Пессимизация сайта — это понижение поисковыми системами позиций сайта в результатах выдачи.
Происходит она на основании анализа веб-ресурса специальными алгоритмами, а также проверки вручную экспертами -
асессорами.
Labrika подготовила большую подборку факторов алгоритма Google Panda, дополненных показателями, которые
учитываются при оценке качества сайта вручную - многие из таких критериев впоследствии становятся частью
алгоритмов.
Здесь Вы найдёте как готовые списки факторов, так и ссылки на ресурсы с информацией по данному вопросу. Мы не брали в
расчет сомнительные источники, которые могут содержать домыслы. Многие ссылки указывают на первоисточники
(официальные публикации Google) и на зарубежные источники на языке оригинала, поскольку технологии Google были
разработаны и исследовались в США.
Google Panda - это алгоритм ранжирования результатов поиска Google, который был впервые выпущен в
феврале 2011 года. Он предназначен для снижения позиций сайтов с низкокачественным контентом, чтобы сайты, имеющие
содержимое более высокого качества, находились в верхней части результатов поиска.
Известные обновления алгоритма Panda
- Panda – 24.02.2011
- Panda 2.0 – 11.04.2011
- Panda 2.1 – 10.05.2011
- Panda 2.2 – 16.06.2011
- Panda 2.3 – 23.07.2011
- Panda 2.4 – 12.08.2011
- Panda 2.5 – 28.09.2011
- Panda 3.0 – 19.10.2011
- Panda 3.1 – 18.11.2011
- Panda 3.2 – 18.01.2012
- Panda 3.3 – 27.02.2012
- Panda 3.4 – 23.03.2012
- Panda 3.5 – 19.04.2012
- Panda 3.6 – 27.04.2012
- Panda 3.7 – 08.05.2012
- Panda 3.8 – 25.05.2012
- Panda 3.9 – 24.07.2012
- Panda 3.9.1 – 22.08.2012
- Panda 3.9.2 – 18.09.2012
- Panda 20 – 27.09. 2012
- Panda 21 – 06.11.2012
- Panda 22 – 21.11.2012
- Panda 23 – 21.12.2012
- Panda 24 – 22.01.2013
- Panda 25 – 15.03.2013
- Panda 26 – 18.07.2013
- Panda 4.0 – 20.05.2014
- Panda 4.1 – 23.09.2014
- Panda 4.2 – 28.07.2015 – последнее обновление
В январе 2016 года Google подтвердил, что Panda включен в основной алгоритм ранжирования.
Список причин пессимизации из официальных источников Google
Качество основного контента
- Автоматически сгенерированное содержимое - это контент, подготовленный с помощью программных средств и
предназначенный не для помощи пользователям, а для манипуляцией позицией ресурса в результатах поиска.
Первоисточник: [1, 2, 3]
- Страницы с бессмысленным контентом (лишенным смыслом набором слов).
Первоисточник: [4]
- Маскировка - предоставление неодинакового контента или разных URL пользователям и поисковым системам.
- Первоисточник: [2, 5]
- Скрытый текст и ссылки. Наиболее популярные способы:
- Использовать текст того же цвета, что и фон.
- Перекрывать текст поверх изображениями.
- Поместить текст за пределами экрана с помощью CSS.
- Установить для размера шрифта значение 0.
- Скрыть ссылку, используя в качестве текста ссылки один незаметный символ (например, символ точки или
изображения, размером в 1x1 пиксель и т.д.).
Первоисточник: [2, 6].
- Повторяющийся контент - как правило, таковым считаются большие блоки информации в рамках одного или нескольких
доменов, содержание которых либо полностью совпадает, либо почти не отличается. Иногда контент намеренно
дублируется с целью манипулирования рейтингом в поисковой системе или увеличения объема трафика. В таких случаях
Google может понизить рейтинг сайта или вообще удалить ресурс из индекса. Первоисточник: [7, 8, 9]
.
Примеры повторяющегося контента:
- Страницы скопированы с сайта продавца, и при этом отсутствует какой-либо уникальный контент. Если
содержимое с партнерских ресурсов не является оригинальным, его должно быть намного меньше по сравнению
с
оригинальными материалами. Первоисточник: [2, 10].
- Тексты, скопированные с других сайтов без дополнительной обработки или с незначительными изменениями
(например, слова заменели синонимами, слова или предложения поменяли местами). Первоисточник: [2, 3, 11].
- Дублирующие или избыточные статьи на похожие темы. Первоисточник: [9, 12].
- Видео, изображения и прочие мультимедийные материалы взяты с других сайтов без дополнительной
значимой
информации. Первоисточник: [11].
- В тексте описываются слишком очевидные вещи, отсутствует глубокий анализ или интересная информация.
Первоисточник: [3, 12].
- Неудовлетворительное для назначения страницы количество основного контента. Первоисточник: [4, 13].
- Использование изображений и видео для передачи текстового контента. Пользователи не смогут скопировать такой
текст, а поисковые системы – прочитать его.Первоисточник: [3].
- Большое количество орфографических и стилистических ошибок. Первоисточник: [9].
- Страницы выглядят неряшливо, сделаны "на скорую руку". Первоисточник:
[9, 14, 15].
- Избыток ключевых слов на странице - ключевые слова или фразы повторяются много раз, часто вне контекста или в
виде списка, из-за чего текст теряет свою естественность. Первоисточник: [2, 16].
- Список телефонных номеров без дополнительной информации. Первоисточник: [16].
- Текстовые блоки с перечнем городов и областей, по запросам которых веб-мастер пытается повысить рейтинг
страницы. Первоисточник: [16].
- Спам, созданный посетителями в сообщениях форума, блога, в отзывах или комментариях, может снизить уровень
доверия к сайту и привести к наложению санкций со стороны Google. Первоисточник:
[2, 3, 17].
- Страницы с нерелевантными ключевыми словами. Первоисточник: [3].
- Очень низкий уровень экспернтости, авторитетности или надежности контента (показатель EAT -
expertise, authoritativeness, trustworthiness). Особенно важен данный фактор для так называемых
YMYL-страниц (YMYL означает англ. «Your Money or Your Life» - «кошелек или жизнь»), то
есть таких ресурсов, от которых зависят жизнь, здоровье и доходы пользователей (к ним относятся прежде всего
сайты, посвященные правовой, финансовой, медицинской, научной и новостной тематике, а также ресурсы, через
которые осуществляются онлайн-покупки и платежи).
Первоисточник: [13].
- Для страниц YMYL и других страниц, которые требуют высокого уровня доверия пользователей, отсутствие или
недостаточное количество информации об обслуживании клиентов, контактах, о том, кто несет ответственность за
сайт, и о создателе основного контента будет причиной присвоения странице низкого рейтинга в поиске.
Первоисточник: [4, 13].
- На канонической и AMP-страницах (Accelerated Mobile Pages - страницах мобильной версии с ускоренной загрузкой)
размещены разные материалы. На AMP-странице должен быть представлен тот же контент, что и на канонической.
Допускаются различия в тексте, однако темы страниц должны быть идентичны. Также на обеих версиях страниц
пользователям должны быть доступны одинаковые функции. Первоисточник: [2] .
Ссылки
- Неработающие внутренние ссылки являются контрольным признаком некачественного веб-ресурса, поскольку они
усложняют индексацию сайта поисковыми системами и затрудняют навигацию пользователей. Первоисточник: [13, 18].
- Избыток на странице партнерских ссылок (за размещение которых выплачивается вознаграждение, если перешедший по
такой ссылке посетитель совершил целевое действие на сайте-партнере) особенно в сочетании с некачественным
неуникальным контентом может привести к пессимизации.
Дополнительный контент и реклама
- Страницы с затрудненным доступом к основному контенту - например, отсутствие основного контента в верхней
половине видимой части сайта. В этом случае пользователи не могут сразу найти основное содержимое ресурса, а
вынуждены сначала прокручивать массу рекламных объявлений. Первоисточник: [12, 13, 19].
- Отсутствие полезного для посетителей дополнительного контента станет причиной снижения рейтинга для сайтов
крупных компаний и организаций. Первоисточник: [4].
- Очень назойливая реклама, без учета интересов пользователей. К снижению рейтинга может привести наличие на
странице полноэкранных баннеров и всплывающих окон, которые затрудняют доступ пользователей к основному
контенту. Первоисточник: [3, 20].
- Чрезмерное количество рекламы, не только баннерной, но и в содержании. Первоисточник: [3, 14].
Мошеннические и вредоносные сайты
- Скрытая переадресация - перенаправление пользователя на другой URL вместо запрошенного, которое применяется для
обмана поисковой системы или для предоставления посетителям страниц, отличных от тех, которые анализирует робот.
Первоисточник: [2, 3, 4, 21].
- Дорвеи - они представляют собой веб-страницы, которые оптимизированы под определенные поисковые запросы и
перенаправляют пользователей на другие сайты. Первоисточник: [2, 3, 22].
- Сайты, предназначенные для фишинга и др. видов мошенничества, то есть созданные для извлечения выгоды за счет
обмана пользователей, которые обманным путем заставляют выполнять опасные действия, например разглашать
конфиденциальную информацию или скачивать вредоносные программы. Первоисточник:
[4, 23].
- Вирусы и вредоносные программы. Первоисточник: [3, 24, 25].
- Ссылки на вредоносные сайты. Первоисточник: [24].
- Изменение домашней страницы в браузере или настроек поиска без ведома и согласия пользователя.
Первоисточник: [24].
- Подмена действия таким образом, что при нажатии пользователем на конкретную ссылку или кнопку фактически
происходит нажатие на другой элемент. Первоисточник: [24].
- Ресурсы, распространяющие ненависть и склоняющие к причинению вреда самому себе или другим, должны получить
самый низкий рейтинг. Первоисточник: [13].
- Ресурсам, которые могут дезинформировать или обманывать пользователей, также присваивается самый низкий рейтинг.
Это страницы, распространяющие ложную или недостоверную информацию, противоречащую мнению экспертов по данной
тематике. Особенно важен данный фактор для YMYL-страниц, посвященных медицинской, финансовой информации,
историческим или текущим событиям. Первоисточник: [13].
- Спам на вашем сервере бесплатного хостинга. Первоисточник: [2,
13].
Технические ошибки
- Закрытые от индексации JS или CSS сайта. Если в файле
robots.txt
закрыт доступ к этим ресурсам, то
Google не
удастся правильно проанализировать и проиндексировать содержание. Это может ухудшить позиции вашего сайта в
Поиске. Первоисточник: [26].
- Некорректное использование разметки для расширенных описаний веб-страниц, нарушающее правила Google в отношении
структурированных данных. Примеры: структурированные данные добавлены для контента, который не виден
пользователям или вводит их в заблуждение, не относится к теме сайта и т.д. Первоисточник: [2, 3].
Качество работы сайта
- Необслуживаемые, взломанные или поврежденные веб-сайты. Первоисточник: [4, 13].
- Медленные сайты не будут ранжироваться так же высоко, как быстрые. Показатель скорости отражает, насколько
быстро сайт реагирует на запросы пользователей. Google сделал скорость страницы фактором ранжирования еще в 2010
году. Первоисточник: [15, 27].
Отношение пользователей
- Жалобы, поступавшие в Google на содержание сайта. Первоисточник: [3].
- Отрицательная репутация сайта - по результатам анализа рейтингов, отзывов и комментариев пользователей. Это
прежде всего важно для ресурсов с тематикой YMYL. Первоисточник: [4].
- Большой процент возвратов в поиск после перехода на сайт (процент отказов) и короткое время пребывания на сайте.
Первоисточник: [12].
Список менее достоверных причин пессимизации из вопросов-ответов и видео от Google, а также авторитетных
SEO-компаний в США
Качество основного контента
- Меньше 200-250 слов на странице. Хотя представители Google утверждают, что при определении качества контента не
устанавливается необходимое минимальное количество слов. Первоисточник: [15, 28].
- Агрессивное использование ключевых слов, в том числе в URL, содержании страницы, TITLE или ALT.
Первоисточник: [12, 16, 26].
- Устаревшие или неверные факты. Первоисточник: [12, 26].
- Слова "для взрослых" и картинки "для взрослых" на сайте. Такой контент имеет соответствующую
пометку и не будет доступен, если включена функция безопасного поиска, которая является состоянием Google по
умолчанию. Первоисточник: [29, 30].
- Выделение слишком большой части текстового контента метками заголовков (H1, H2 и т.д.), маркерами списков,
тегами жирного шрифта, курсива и другими акцентами, поскольку это не соответствует естественной форме написания.
Первоисточник: [26, 30].
- Много потерянных изображений.
- Дубликаты TITLE и DESCRIPTION. Заголовок страницы может состоять из нескольких слов или фразы, а в метатег
описания можно добавить несколько предложений или даже небольшой абзац. Первоисточник: [15,
26, 28].
Ссылки
- Много очень похожих анкоров внутри сайта на разные, но похожие страницы.
- Очень большое количество внутренних ссылок на странице. Первоисточник: [26].
- Много ссылок на несуществующие страницы, в том числе и на других сайтах. Первоисточник: [12].
Технические ошибки
- Грубые ошибки в разметке HTML или SCHEMA.
- Ошибки 500 на сайте, выбросы ошибок программного кода ( PHP, MySQL ). Несмотря на то, что алгоритм Panda создан
для анализа в первую очередь качества контента, некоторые технические проблемы заложены в обычном алгоритме
ранжирования ядра Google, и если страница заполнена ошибками, сгенерированными PHP, Java или другим серверным
языком, она соответствует определениям Google о плохом пользовательском интерфейсе и некачественном сайте. Как
минимум, ошибки на странице могут помешать общему анализу контента. Первоисточник: [15, 30].
Качество работы сайта
- Загрузка страниц больше 20 секунд. Первоисточник: [12].
- IP-адрес сайта находится в черном списке – по спам-рассылкам или фермам контента. Первоисточник: [12].
- На сайте есть фразы, которые могут указывать на продажу домена: "domain is for sale", "buy this
domain", "this page is parked", “домен продается”, “купите этот домен”,
“этот домен забронирован” и др. Первоисточник: [12]
Официальные публикации Google о показателях качества сайтов
Дополнительно могут быть полезными:
Публикации о Google Panda
Использованные источники:
- Автоматически созданный контент
- Отчет о мерах, принятых
вручную
- Рекомендации для
веб-мастеров
- Google Quality Rating Guidelines. Version 5.0.pdf
- Маскировка
- Скрытый текст и ссылки
- Повторяющийся контент
- Повторяющийся
контент
- More guidance on building high-quality sites
- Партнерские программы
- Скопированное содержание
- Content Quality Score:
Google's Best Kept Secret For Rankings
- Search quality evaluator guidelines.pdf
- Схемы обмена
ссылками
- Understanding Google Panda: Definitive Algo Guide for SEOs
- Наполнение ключевыми словами
- Рекомендации в отношении спама, созданного пользователями
- Patent Application Publication US20080097977A1.pdf
- Page layout algorithm improvement
- Helping users easily access content on mobile
- Скрытая переадресация
- Дорвеи
- Социальная инженерия (сайты для фишинга и обмана пользователей)
- Создание страниц для злонамеренных действий
- Подробно о проблемах с безопасностью
- Руководство по
поисковой оптимизации для начинающих
- Using site speed in web search ranking
- A Complete Guide to the Google Panda Update
- Using data to
fight webspam
- Google Ranking
Factors