close
menu
labrika
13 апреля 2018

Факторы пессимизации Google. Алгоритм Panda

Пессимизация сайта — это понижение поисковыми системами позиций сайта в результатах выдачи. Происходит она на основании анализа веб-ресурса специальными алгоритмами, а также проверки вручную экспертами - асессорами.

Labrika подготовила большую подборку факторов алгоритма Google Panda, дополненных показателями, которые учитываются при оценке качества сайта вручную - многие из таких критериев впоследствии становятся частью алгоритмов.

Здесь Вы найдёте как готовые списки факторов, так и ссылки на ресурсы с информацией по данному вопросу. Мы не брали в расчет сомнительные источники, которые могут содержать домыслы. Многие ссылки указывают на первоисточники (официальные публикации Google) и на зарубежные источники на языке оригинала, поскольку технологии Google были разработаны и исследовались в США.

Google Panda - это алгоритм ранжирования результатов поиска Google, который был впервые выпущен в феврале 2011 года. Он предназначен для снижения позиций сайтов с низкокачественным контентом, чтобы сайты, имеющие содержимое более высокого качества, находились в верхней части результатов поиска.

Известные обновления алгоритма Panda

  • Panda – 24.02.2011 
  • Panda 2.0 – 11.04.2011
  • Panda 2.1 – 10.05.2011
  • Panda 2.2 – 16.06.2011
  • Panda 2.3 – 23.07.2011
  • Panda 2.4 – 12.08.2011
  • Panda 2.5 – 28.09.2011
  • Panda 3.0 – 19.10.2011
  • Panda 3.1 – 18.11.2011
  • Panda 3.2 – 18.01.2012
  • Panda 3.3 – 27.02.2012
  • Panda 3.4 – 23.03.2012
  • Panda 3.5 – 19.04.2012
  • Panda 3.6 – 27.04.2012
  • Panda 3.7 – 08.05.2012
  • Panda 3.8 – 25.05.2012
  • Panda 3.9 – 24.07.2012
  • Panda 3.9.1 – 22.08.2012
  • Panda 3.9.2 – 18.09.2012
  • Panda 20 – 27.09. 2012
  • Panda 21 – 06.11.2012
  • Panda 22 – 21.11.2012
  • Panda 23 – 21.12.2012
  • Panda 24 – 22.01.2013
  • Panda 25 – 15.03.2013
  • Panda 26 – 18.07.2013
  • Panda 4.0 – 20.05.2014
  • Panda 4.1 – 23.09.2014
  • Panda 4.2 – 28.07.2015 – последнее обновление

В январе 2016 года Google подтвердил, что Panda включен в основной алгоритм ранжирования.

Список причин пессимизации из официальных источников Google

Качество основного контента

  1. Автоматически сгенерированное содержимое - это контент, подготовленный с помощью программных средств и предназначенный не для помощи пользователям, а для манипуляцией позицией ресурса в результатах поиска.
    Первоисточник: [1, 2, 3]
  2. Страницы с бессмысленным контентом (лишенным смыслом набором слов).
    Первоисточник: [4]
  3. Маскировка - предоставление неодинакового контента или разных URL пользователям и поисковым системам. Первоисточник: [2, 5]
  4. Скрытый текст и ссылки. Наиболее популярные способы:
    • Использовать текст того же цвета, что и фон.
    • Перекрывать текст поверх изображениями.
    • Поместить текст за пределами экрана с помощью CSS.
    • Установить для размера шрифта значение 0.
    • Скрыть ссылку, используя в качестве текста ссылки один незаметный символ (например, символ точки или изображения, размером в 1x1 пиксель и т.д.).

    Первоисточник: [2, 6].

  5. Повторяющийся контент - как правило, таковым считаются большие блоки информации в рамках одного или нескольких доменов, содержание которых либо полностью совпадает, либо почти не отличается. Иногда контент намеренно дублируется с целью манипулирования рейтингом в поисковой системе или увеличения объема трафика. В таких случаях Google может понизить рейтинг сайта или вообще удалить ресурс из индекса. Первоисточник: [7, 8, 9] .

    Примеры повторяющегося контента:

    а. Страницы скопированы с сайта продавца, и при этом отсутствует какой-либо уникальный контент. Если содержимое с партнерских ресурсов не является оригинальным, его должно быть намного меньше по сравнению с оригинальными материалами. Первоисточник: [2, 10].

    b. Тексты, скопированные с других сайтов без дополнительной обработки или с незначительными изменениями (например, слова заменели синонимами, слова или предложения поменяли местами). Первоисточник: [2, 3, 11].

    с. Дублирующие или избыточные статьи на похожие темы. Первоисточник: [9, 12].

    d. Видео, изображения и прочие мультимедийные материалы взяты с других сайтов без дополнительной значимой информации. Первоисточник: [11].

  6. В тексте описываются слишком очевидные вещи, отсутствует глубокий анализ или интересная информация. Первоисточник: [3, 12].
  7. Неудовлетворительное для назначения страницы количество основного контента. Первоисточник: [4, 13].
  8. Использование изображений и видео для передачи текстового контента. Пользователи не смогут скопировать такой текст, а поисковые системы – прочитать его.Первоисточник: [3].
  9. Большое количество орфографических и стилистических ошибок. Первоисточник: [9].
  10. Страницы выглядят неряшливо, сделаны "на скорую руку". Первоисточник: [9, 14, 15].
  11. Избыток ключевых слов на странице - ключевые слова или фразы повторяются много раз, часто вне контекста или в виде списка, из-за чего текст теряет свою естественность. Первоисточник: [2, 16].
  12. Список телефонных номеров без дополнительной информации. Первоисточник: [16].
  13. Текстовые блоки с перечнем городов и областей, по запросам которых веб-мастер пытается повысить рейтинг страницы. Первоисточник: [16].
  14. Спам, созданный посетителями в сообщениях форума, блога, в отзывах или комментариях, может снизить уровень доверия к сайту и привести к наложению санкций со стороны Google. Первоисточник: [2, 3, 17].
  15. Страницы с нерелевантными ключевыми словами. Первоисточник: [3].
  16. Очень низкий уровень экспернтости, авторитетности или надежности контента (показатель EAT - expertise, authoritativeness, trustworthiness). Особенно важен данный фактор для так называемых YMYL-страниц (YMYL означает англ. «Your Money or Your Life» - «кошелек или жизнь»), то есть таких ресурсов, от которых зависят жизнь, здоровье и доходы пользователей (к ним относятся прежде всего сайты, посвященные правовой, финансовой, медицинской, научной и новостной тематике, а также ресурсы, через которые осуществляются онлайн-покупки и платежи).
    Первоисточник: [13].
  17. Для страниц YMYL и других страниц, которые требуют высокого уровня доверия пользователей, отсутствие или недостаточное количество информации об обслуживании клиентов, контактах, о том, кто несет ответственность за сайт, и о создателе основного контента будет причиной присвоения странице низкого рейтинга в поиске.
    Первоисточник: [4, 13].
  18. На канонической и AMP-страницах (Accelerated Mobile Pages - страницах мобильной версии с ускоренной загрузкой) размещены разные материалы. На AMP-странице должен быть представлен тот же контент, что и на канонической. Допускаются различия в тексте, однако темы страниц должны быть идентичны. Также на обеих версиях страниц пользователям должны быть доступны одинаковые функции. Первоисточник: [2] .

Ссылки

  1. Неработающие внутренние ссылки являются контрольным признаком некачественного веб-ресурса, поскольку они усложняют индексацию сайта поисковыми системами и затрудняют навигацию пользователей. Первоисточник: [13, 18].
  2. Избыток на странице партнерских ссылок (за размещение которых выплачивается вознаграждение, если перешедший по такой ссылке посетитель совершил целевое действие на сайте-партнере) особенно в сочетании с некачественным неуникальным контентом может привести к пессимизации.

Дополнительный контент и реклама

  1. Страницы с затрудненным доступом к основному контенту - например, отсутствие основного контента в верхней половине видимой части сайта. В этом случае пользователи не могут сразу найти основное содержимое ресурса, а вынуждены сначала прокручивать массу рекламных объявлений. Первоисточник: [12, 13, 19].
  2. Отсутствие полезного для посетителей дополнительного контента станет причиной снижения рейтинга для сайтов крупных компаний и организаций. Первоисточник: [4].
  3. Очень назойливая реклама, без учета интересов пользователей. К снижению рейтинга может привести наличие на странице полноэкранных баннеров и всплывающих окон, которые затрудняют доступ пользователей к основному контенту. Первоисточник: [3, 20].
  4. Чрезмерное количество рекламы, не только баннерной, но и в содержании. Первоисточник: [3, 14].

Мошеннические и вредоносные сайты

  1. Скрытая переадресация - перенаправление пользователя на другой URL вместо запрошенного, которое применяется для обмана поисковой системы или для предоставления посетителям страниц, отличных от тех, которые анализирует робот. Первоисточник: [2, 3, 4, 21].
  2. Дорвеи - они представляют собой веб-страницы, которые оптимизированы под определенные поисковые запросы и перенаправляют пользователей на другие сайты. Первоисточник: [2, 3, 22].
  3. Сайты, предназначенные для фишинга и др. видов мошенничества, то есть созданные для извлечения выгоды за счет обмана пользователей, которые обманным путем заставляют выполнять опасные действия, например разглашать конфиденциальную информацию или скачивать вредоносные программы. Первоисточник: [4, 23].
  4. Вирусы и вредоносные программы. Первоисточник: [3, 24, 25].
  5. Ссылки на вредоносные сайты. Первоисточник: [24].
  6. Изменение домашней страницы в браузере или настроек поиска без ведома и согласия пользователя.
    Первоисточник: [24].
  7. Подмена действия таким образом, что при нажатии пользователем на конкретную ссылку или кнопку фактически происходит нажатие на другой элемент. Первоисточник: [24].
  8. Ресурсы, распространяющие ненависть и склоняющие к причинению вреда самому себе или другим, должны получить самый низкий рейтинг. Первоисточник: [13].
  9. Ресурсам, которые могут дезинформировать или обманывать пользователей, также присваивается самый низкий рейтинг. Это страницы, распространяющие ложную или недостоверную информацию, противоречащую мнению экспертов по данной тематике. Особенно важен данный фактор для YMYL-страниц, посвященных медицинской, финансовой информации, историческим или текущим событиям. Первоисточник: [13].
  10. Спам на вашем сервере бесплатного хостинга. Первоисточник: [2, 13].

Технические ошибки

  1. Закрытые от индексации JS или CSS сайта. Если в файле robots.txt закрыт доступ к этим ресурсам, то Google не удастся правильно проанализировать и проиндексировать содержание. Это может ухудшить позиции вашего сайта в Поиске. Первоисточник: [26].
  2. Некорректное использование разметки для расширенных описаний веб-страниц, нарушающее правила Google в отношении структурированных данных. Примеры: структурированные данные добавлены для контента, который не виден пользователям или вводит их в заблуждение, не относится к теме сайта и т.д. Первоисточник: [2, 3].

Качество работы сайта

  1. Необслуживаемые, взломанные или поврежденные веб-сайты. Первоисточник: [4, 13].
  2. Медленные сайты не будут ранжироваться так же высоко, как быстрые. Показатель скорости отражает, насколько быстро сайт реагирует на запросы пользователей. Google сделал скорость страницы фактором ранжирования еще в 2010 году. Первоисточник: [15, 27].

Отношение пользователей

  1. Жалобы, поступавшие в Google на содержание сайта. Первоисточник: [3].
  2. Отрицательная репутация сайта - по результатам анализа рейтингов, отзывов и комментариев пользователей. Это прежде всего важно для ресурсов с тематикой YMYL. Первоисточник: [4].
  3. Большой процент возвратов в поиск после перехода на сайт (процент отказов) и короткое время пребывания на сайте. Первоисточник: [12].

Список менее достоверных причин пессимизации из вопросов-ответов и видео от Google, а также авторитетных SEO-компаний в США

Качество основного контента

  1. Меньше 200-250 слов на странице. Хотя представители Google утверждают, что при определении качества контента не устанавливается необходимое минимальное количество слов. Первоисточник: [15, 28].
  2. Агрессивное использование ключевых слов, в том числе в URL, содержании страницы, TITLE или ALT.
    Первоисточник: [12, 16, 26].
  3. Устаревшие или неверные факты. Первоисточник: [12, 26].
  4. Слова "для взрослых" и картинки "для взрослых" на сайте. Такой контент имеет соответствующую пометку и не будет доступен, если включена функция безопасного поиска, которая является состоянием Google по умолчанию. Первоисточник: [29, 30].
  5. Выделение слишком большой части текстового контента метками заголовков (H1, H2 и т.д.), маркерами списков, тегами жирного шрифта, курсива и другими акцентами, поскольку это не соответствует естественной форме написания. Первоисточник: [26, 30].
  6. Много потерянных изображений.
  7. Дубликаты TITLE и DESCRIPTION. Заголовок страницы может состоять из нескольких слов или фразы, а в метатег описания можно добавить несколько предложений или даже небольшой абзац. Первоисточник: [15, 26, 28].

Ссылки

  1. Много очень похожих анкоров внутри сайта на разные, но похожие страницы.
  2. Очень большое количество внутренних ссылок на странице. Первоисточник: [26].
  3. Много ссылок на несуществующие страницы, в том числе и на других сайтах. Первоисточник: [12].

Технические ошибки

  1. Грубые ошибки в разметке HTML или SCHEMA.
  2. Ошибки 500 на сайте, выбросы ошибок программного кода ( PHP, MySQL ). Несмотря на то, что алгоритм Panda создан для анализа в первую очередь качества контента, некоторые технические проблемы заложены в обычном алгоритме ранжирования ядра Google, и если страница заполнена ошибками, сгенерированными PHP, Java или другим серверным языком, она соответствует определениям Google о плохом пользовательском интерфейсе и некачественном сайте. Как минимум, ошибки на странице могут помешать общему анализу контента. Первоисточник: [15, 30].

Качество работы сайта 

  1. Загрузка страниц больше 20 секунд. Первоисточник: [12].
  2. IP-адрес сайта находится в черном списке – по спам-рассылкам или фермам контента. Первоисточник: [12].
  3. На сайте есть фразы, которые могут указывать на продажу домена: "domain is for sale", "buy this domain", "this page is parked", “домен продается”, “купите этот домен”, “этот домен забронирован” и др. Первоисточник: [12]

Официальные публикации Google о показателях качества сайтов

Дополнительно могут быть полезными:

Публикации о Google Panda

Использованные источники:

  1. Автоматически созданный контент
  2. Отчет о мерах, принятых вручную
  3. Рекомендации для веб-мастеров
  4. Google Quality Rating Guidelines. Version 5.0.pdf
  5. Маскировка
  6. Скрытый текст и ссылки
  7. Повторяющийся контент
  8. Повторяющийся контент
  9. More guidance on building high-quality sites
  10. Партнерские программы
  11. Скопированное содержание
  12. Content Quality Score: Google's Best Kept Secret For Rankings
  13. Search quality evaluator guidelines.pdf
  14. Схемы обмена ссылками
  15. Understanding Google Panda: Definitive Algo Guide for SEOs
  16. Наполнение ключевыми словами
  17. Рекомендации в отношении спама, созданного пользователями
  18. Patent Application Publication US20080097977A1.pdf
  19. Page layout algorithm improvement
  20. Helping users easily access content on mobile
  21. Скрытая переадресация
  22. Дорвеи
  23. Социальная инженерия (сайты для фишинга и обмана пользователей)
  24. Создание страниц для злонамеренных действий
  25. Подробно о проблемах с безопасностью
  26. Руководство по поисковой оптимизации для начинающих
  27. Using site speed in web search ranking
  28. A Complete Guide to the Google Panda Update
  29. Using data to fight webspam
  30. Google Ranking Factors
Бесплатно

Всё ещё думаете? Просто попробуйте!