Догадки из утекшего документа Google для асессоров

  • Дата:03.11.2011
  • Автор:

Документ для ассессоров GoogleНа прошлой неделе, когда SEO мир был отвлечен тем, что Google заблокировал отчеты по ключевым словам от пользователей, которые ищут под аккаунтом, произошла утечка официального документа Google, Google's official guidelines for quality raters. Прочитав этот 125-страничный документ для асессоров, можно подвести следующие итоги:


Здесь нет секретов, извините

Если Вы ищете «SEO секреты», Вы будете разочарованы этим постом. Также это внутренний документ компании, и Google не будет счастлив из-за его утечки. Вы найдете практическое пособие по философии Google о качестве. Ключевой момент для SEO – понимание того, как размышляет Google. Если Вы пытаетесь догнать алгоритм, Вы всегда будете реагировать на изменения после того, как они произойдут. Я пишу этот пост, так как искренне верю, что понимание философии качества Google – фундаментально “белое SEO”.


Кто такие асессоры?

Асессоры, отслеживающие качество поиска Google – люди, которые следят за тем, чтобы алгоритм делал то, что в него заложено. Данные, получаемые от асессоров, не только служат контролем качества существующей страницы выдачи, но и помогают улучшить потенциальные изменения в алгоритме. Когда узнаёшь, что Google тестировал около 13000 изменений алгоритма за последний год, понимаешь, как важна эта работа.

Данный конкретный документ сфокусирован на отслеживании качества страницы выдачи (SERP) поисковой системы по некоторым запросам. Главным образом асессоры просматривают сайты, отображающиеся в SERPпо заданным запросам,  и оценивают каждый результат на основании релевантности. Асессоры также помечают сайты, которые они считают спамными. И ещё: философия Google не всегда отражается в алгоритмах поиска. Алгоритм – это попытка закодировать качество в код и правила, данная попытка всегда будет несовершенна. Документ, например, ничего не говорит о количестве обратных ссылок, уникальных доменах, C-blockссылках и т.д. Это все количественные показатели.

Ниже приведены 16 догадок о человеческом понимании качества Google.


1. Релевантность непрерывна

Я считаю, основное откровение данного документа в широком смысле того, что компания Google имеет довольно сложное и тонкое мнение. Асессоры проинструктированы оценивать релевантность по 5 категориям документов (страниц): «Жизненно важный» (“Vital”), «Полезный» (“Useful”), «Релевантный» (“Relevant”), «Почти релевантный» (“SlightlyRelevant”), «Не в тему» (“Off-ropic”). Конечно, всегда имеется определенное количество субъективных оценок, но Google предусматривает много примеров и детальные инструкции.


2. Релевантность и спам независимы

Релевантность – оценка, но спам – сигнал. Итак, по мнению Google, сайт может быть полезным, но заспамленным. Или сайт может быть не релевантным, но без спама. Я думаю, мы можем наблюдать эту философию в алгоритме. Контент релевантный или не релевантный, но спам – это тактика или цель.


3. Наиболее интересные правила намерений.

Некоторые запросы двусмысленны – «Apple», например, может означать большое количество вещей, независимо от контекста. В большинстве случаев Google инструктирует асессоров использовать преобладающую интерпретацию (dominant interpretation). Интересно то, что преобладающая интерпретация обычно касается больших брендов. Например, доминирующей интерпретацией слова «apple» будет AppleComputers, а для запроса «kayak» – туристический сайт Kayak.com.

Другие интерпретации («apple» как фрукт, «kayak» как вид транспорта) автоматически понижаются в рейтинге релевантности, если существует преобладающая интерпретация. Я думаю, что понятие преобладающей интерпретации имеет смысл, и может быть необходимо для работы асессора, но оно также очень субъективно. В некоторых случаях я не согласен с примерами Google и чувствую, что преобладающая интерпретация не честно занижает хорошие сайты. Многие люди хотят купить iPad, когда делают запрос «apple», но сайт, который специализируется на онлайн продажах органических яблок, также высокорелевантный двусмысленному запросу, по моему мнению.


4. Некоторые результаты «жизненно важны»

«Жизненно важный» рейтинг релевантности – специальный случай. Любой официальный субъект – компания, актер/актриса, политик и т.д. – может быть важным результатом. В большинстве случаев это официальная домашняя страница. Только преобладающая интерпретация может быть важной – “AppleVacations” никогда не станет жизненно важным результатом для «apple». Я считаю, это предохранитель для проверки алгоритма. Если «жизненно важные» результаты не появляются по субъективным запросам, у многих людей появятся вопросы к выдаче Google, даже если SEO по таким запросам не использовалась.

Социальные профили также могут быть жизненно важными, если эти профили для человека или небольших групп людей. Итак, политики, актрисы и рок-группы могут иметь множество «жизненно важных» страниц (их домашняя страница, страница в Facebook, профиль Twitter, например). Интересно, что Google дает специфичные инструкции о том, что профили социальных сетей для фирм и компаний не могут быть «жизненно важными».


5. Общие запросы никогда не «жизненно важные»

Очевидно, Walmart.com– важный результат для запроса «walmart», но Couches.com– не жизненно важный результат для запроса «couches». Точное вхождение в доменном имени не делает автоматически что-либо жизненно важным, и некоторые запросы по своему смыслу общие.


6. Запросы 3-х видов

Цель запроса может быть классифицирована, согласно Google, на Действие (“Do”), Информация (“Know”) или Навигация (“Go”). Эта модель Do/Know/Goчасто встречается в руководстве и является очень удобной структурой для понимания поиска в целом. Релевантность определяется целью – если запрос ориентирован на действие в чистом виде («купить компьютер»), тогда только результат, ориентированный на действие, будет высокорелевантным.


7. Полезность идет выше релевантности

Широкое понятие для интерпретации, но Google говорит, что «полезные» страницы (рейтинг из 5 категорий релевантности ниже «жизненно важного») должны быть более чем просто релевантными – они должны также быть полностью удовлетворяющими запрос, авторитетными, мультимедийными и свежими. Это оставлено на усмотрение асессора, и нет сайта, соответствующего всем этим критериям. Одной релевантности документа не всегда достаточно для того, чтобы быть в ТОПе.


8. Релевантность подразумевает язык соответствия

Если поисковый запрос не совпадает полностью с целевым языком запроса, тогда в большинстве случаев результат будет низкорелевантным. Аналогично, если запрос включает или подразумевает конкретную страну, а результат не совпадает с этой страной, тогда результат не является актуальным.


9. Локальная цель может быть автоматическая

Даже если запрос общий, он может иметь локальный замысел. Google дает пример «icerink» – запрос «icerink» должен отдавать результат локального поиска, а прямо не локальные результаты должны быть помечены, как «не в тему» или «бесполезные». Это применимо к региону в поиске. Опять же, ждем от Google увеличение важности локального поиска все больше и больше.


10. Специфика целевой страницы играет роль

Хорошая целевая страница будет специфична запросу. Детальная страница товара, например, лучшее совпадение для низкочастотного запроса для специфической позиции. С другой стороны, если запрос шире, тогда более широкий ресурс может быть более релевантным. Например, запросу «рецепты курицы» будет более релевантной страница всех рецептов, нежели страница с одним рецептом курицы.


11. Орфографически ошибки оцениваются по намерению

Если запрос совершенно четко ошибочен, релевантность результатов должна быть основана на том, какой ответ понравится пользователю больше. Раньше нацеливание на ошибочные запросы было одной из SEO тактик, но, я думаю, мы видим все больше и больше, что, Google будет автоматически выдавать искателю правильный (без ошибки в запросе) результат. Похоже, Google становится более агрессивным в определении цели запроса, даже направляя пользователя на более преобладающую цель.


12. Копированный контент может быть релевантным

Это может оказаться сюрпризом в мире после панды, но Google официально признает то, что копированный контент автоматически не становится низкого качества. Разумеется, если этот контент хорошо организован, полезен и не размещен лишь для того, чтобы получать просмотры.


13. Некоторые запросы не нуждаются в определении

Словарь или страницы из энциклопедии полезны лишь тогда, когда запрос обычно заслуживает определения или больше информации. Если большинство пользователей понимают значение запрашиваемых слов – Google не считает (пример запрос «bank») словарь или энциклопедию полезными. Конечно, речь о Википедии.


14. Реклама без ценности или спам

Одна цитата выделилась в документе: «Если страница существует только для заработка денег, эта страница спам». Сейчас некоторые хозяева бизнеса могут возразить, сказав, что почти все сайты в некоторой степени существуют для заработка денег. Когда Google говорит «только для заработка денег», он, видимо, имеет в виду заработок денег без ценного контента. Все нормально в заработке на рекламе, размещенной на страницах своего сайта, если Вы имеете ценный контент. Если вы создали портал лишь для заработка денег – вы спаммер.


15. Google.com низкорелевантный ресурс

По стандартам Google, пустое поле поиска без показанных результатов – это страница «не в тему» или «бесполезна». Ирония, не так ли? Шутки в сторону, в документе сообщается, что страницы внутреннего поиска на сайте могут быть релевантными и полезными в некоторых случаях.


16. Асессоры Google используют Firefox

Я говорил: «Никаких секретов»,– но, думаю, это немного инсайдерская информация. Асессоры Google проинструктированы использовать Firefox вместе с webdeveloperadd-on.


Источник http://www.seomoz.org/blog/16-insights-into-googles-rating-guidelines

Перевод