close
menu
labrika
blog-icon
Январь 16, 2018

Проверка текста на переоптимизацию. Переспам страниц на сайте

Переоптимизация в SEO – это превышение допустимой меры оптимизации веб-ресурса, то есть перенасыщение его элементами, способствующими улучшению позиции сайта при ранжировании в поисковых системах.

Переоптимизацией текста называется чрезмерное употребление на странице ключевых слов, а также повышение их веса за счет помещения в мета-теги и заголовки и выделения заметным шрифтом.

Чем опасна переоптимизация?

Поисковые системы начали бороться с ней после того, как оптимизаторы стали злоупотреблять ключевыми словами и манипулировать их весом для искусственного повышения релевантности страниц и получения более высоких позиций.

Переспам по ключевым словам (то есть избыточное их употребление) часто приводит к понижению в поисковой выдаче позиций отдельных страниц по конкретным ключевым фразам, использование которых было чрезмерным. Если же на сайте будет обнаружено большое количество переоптимизированных текстов, под санкции может попасть весь ресурс.

Яндекс начал пессимизировать сайты с текстовой переоптимизацией еще в 2011 году. А с выходом алгоритма Баден-Баден весной 2017 года огромное количество веб-ресурсов с переоптимизированными текстами попали под фильтр, что привело к сильному проседанию их позиций и потере трафика.

О понижении рейтинга сайтов с такими текстами предупреждают и официальные источники Google.

Как проверить текстовую переоптимизацию?

Выявить это нарушение довольно сложно — нужно пересмотреть все тексты, ссылки и html-код. Упрощает процесс использование специального онлайн-сервиса «Лабрика», предназначенного для оптимизации и продвижения веб-ресурсов.

Проверка на переоптимизацию осуществляется в разделе «SEO-аудит». В отчете «Тошнота слов на страницах» будут представлены основные признаки поискового спама, обнаруженные в текстовом содержимом ресурса.

Проверка на переоптимизацию

Виды текстового поискового спама

Поисковый спам (то есть манипулирование результатами поиска) часто осуществляется при помощи различных методов переоптимизации текста на страницах ресурса.

Высокая тошнота слов в тексте

Тошнота текста – это показатель заспамленности, то есть частоты употребления каких-либо слов в тексте.

Выделяют 2 вида тошноты:

Классическая - определяется независимо от объёма текста и равняется квадратному корню от общего количества использования слова. Этот показатель обычно не является существенным.

Более информативна академическая тошнота, которая показывает плотность употребления слова или фразы, то есть частоту ее использования по отношению к объёму текста.

Она выражается в процентах и рассчитывается по формуле:

количество повторов слова в тексте / общее количество слов в тексте * 100%

Заниженная тошнота ключевых слов может свидетельствовать о нерелевантности текста запросу пользователя, а высокий процент академической тошноты говорит о злоупотреблении ключевыми фразами.

Пример страницы с высокой плотностью словоформ "насосы" в области контента (академическая тошнота — 7.4%):
Пример страницы с высокой плотностью словоформ

В «Лабрике» для анализа также используется показатель академической тошноты. В отчете сервиса будут показаны все слова с высокой плотностью. Чтобы определить, является ли такой показатель в данном случае нормой, он сравнивается с данными сайтов-конкурентов. Анализ плотности проводится только по добавленным на сервис ключевым запросам. По остальным словам предупреждение показывается в случае превышения обычных значений нормы, без дополнительных проверок.

показатель академической тошноты

Внимание! У каждого слова есть своя "нормальная" плотность в естественном тексте. В некоторых видах текстов плотность отдельных слов может быть выше обычной нормы.

Когда высокая плотность слов допустима?

Мэтт Каттс, руководитель одного из отделов Google, который занимается проблемами веб-спама, в одном из своих видеообращений отмечал, что допустимое значение плотности ключевого слова варьируется. Оно зависит от тематики и числа этих слов на сайтах, которые уже по ним ранжируются. Ключевые слова необходимо размещать на странице таким образом, чтобы текст хорошо читался и выглядел естественным.

То есть оптимального значения плотности слов, общего для всех сайтов, не существует. Для каждой конкретной тематики этот параметр нужно устанавливать индивидуально.

Высокая плотность некоторых слов характерна для определенных стилей речи и документов. Например, стилистической особенностью научных и юридических текстов является насыщенность терминами и устойчивыми выражениями, имеющими строго установленное значение. Заменить их без искажения смысла всего документа зачастую невозможно. Большое количество таких слов в данном случае будет оправдано, поскольку обусловлено стилем документа.

Высокая плотность слов

На коммерческих сайтах частое повторение слов (плотность 10% и выше) можно встретить в каталогах товаров и прайс-листах.

плотность 10% и выше

Помните, что высокая плотность слов допускается только в отдельных видах текста и не должна присутствовать на страницах ресурса, если они не относятся к данной категории.

Заспамленность биграммами и триграммами

К N-граммам относятся устойчивые сочетания из двух и более слов, которые встречаются в тексте вместе и при этом несут определенную смысловую нагрузку. К этой категории можно отнести и ключевые фразы.

Если ранее санкции поисковых систем накладывались за высокую плотность отдельных слов на странице, то после внедрения фильтра Яндекса Баден-Баден наказывается неестественно частое использование биграмм (устойчивых фраз из двух слов) и триграмм (фраз из трех слов). Особенно это касается словосочетаний, типичных для поисковых запросов, например, включающих слово «купить» или «цена». Высокая частота использования таких n-грамм при небольшом количестве в тексте отдельных слов, входящих в их состав, свидетельствует об искусственном наполнении контента ключевыми фразами.

Пример заспамленности биграммой «переоптимизированные тексты» приводится в блоге Яндекса:

Пример заспамленности биграммой

Поскольку наличие переспама по n-граммам с высокой долей вероятности приводит к пессимизации сайта, «Лабрика» в отчете по переоптимизации текста выводит этот показатель отдельно от других видов академической тошноты.

наличие переспама по n-граммам

Повторы слова внутри предложения

Повторы слов в предложении затрудняют чтение и понимание текста. Повторение слов допускается в юридических или технических документах, а также в навигационной цепочке «хлебные крошки». Если повторы не обусловлены спецификой текста, их нужно убрать. «Лабрика» позволяет выявить такие неудобочитаемые фрагменты.

Повторы слова внутри предложения

Высокая плотность слов в мета-тегах

Поскольку в метата-тегах Title и Description прописывается только самая важная информация, то поисковики придают им большее значение, чем остальному тексту, размещенному на странице. Поэтому переоптимизация здесь особенно нежелательна.

Если на странице встречается избыточное употребление какого-либо слова в тексте, то его чрезмерное использование в мета-тегах создает уже несколько видов переспама по одному слову, что повышает опасность наложения фильтра.

Чтобы этого избежать, «Лабрика» отдельно указывает на высокую плотность слова в Title иDescription.

опасность наложения фильтра

опасность наложения фильтра

Переспам тегов в заголовках

Выделение текста определенными тегами (жирный шрифт, курсив) повышает его вес. Включение таких тегов в заголовки Н1 иН2, которые сами по себе имеют высокую значимость для поисковых систем, считается чрезмерным. Использование в таком заголовке ключевых слов может привести к переоптимизации по ним, особенно если на странице уже есть признаки переоптимизации по этим словам.

Выделение текста

Наибольший вес для поисковых систем имеют следующие теги:

  • <b> (от англ. "bold" ‒ «жирный, полужирный») - выделяет вложенный в него текст полужирным шрифтом.

  • <strong> (от англ. "strong" ‒ «сильный, серьёзный») - предназначен для выделения важного фрагмента текста, на который нужно обратить внимание пользователя. Также отображает текст жирным шрифтом.

  • <i> (наклонный текст) - используется для выделения текста курсивом.

  • <u> - содержит подчёркнутый текст.

  • <а> (анкор) - служит для создания ссылок.

В отчете «Лабрики» отображается наличие данных тегов в заголовках.

наличие тегов в заголовках

Дубли заголовков H2, H3, H4 и заспамленность заголовками

Дублирование означает повторы заголовков H2, H3, H4 на странице, заспамленность - слишком частое их использование, не соответствующее структуре статьи. Это затрудняет восприятие текста читателями, а поисковым роботам в этом случае будет сложно определить характер и качество контента. Страница с такими текстами может  быть понижена в результатах поиска.

Пример заспамленности заголовками:
Пример заспамленности заголовками

Переоптимизация url-адресов и доменных имен

Избыточное употребление ключевых слов в этих элементах может стать причиной наложения фильтра Google под названием EMD (Exact Match Domains). В результате его действия страница может быть исключена из поиска или понижена в поисковой выдаче.

Совпадение Title, Н1, URL и хлебных крошек

В этом случае ключевое слово будет повторяться сразу в нескольких элементах, оказывающих влияние на ранжирование. Это послужит негативным сигналом для поисковой системы и может привести к пессимизации ресурса.

Страницы, на которых совпадают Title и Н1, можно быстро найти с помощью отчета «Ошибки МЕТА тегов» в разделе «SEO-аудит» сервиса «Лабрика».

совпадают Title и Н1

Переоптимизация анкоров

Избыток ссылок, текст которых наполнен ключевыми словами, является основным сигналом для наложения фильтров поисковых систем. Особенно, если большая часть анкор-листа представляет собой прямые вхождения продвигаемых коммерческих запросов.

Часто наблюдается переспам сквозных ссылок футера или каталога, например, когда в пунктах меню много раз повторяется название товара или услуги («мебель», «ремонт» и. п.).

переспам сквозных ссылок

Злоупотребление выделением слов жирным шрифтом

Написание жирным шрифтом слишком большого объема текста считается попыткой повлиять на результаты поиска, поскольку такое выделение увеличивает вес слов для поисковых систем.

Написание жирным шрифтом

Писать текст жирным шрифтом допустимо только в исключительных случаях, когда нужно подчеркнуть особо важную информацию или заголовок.

«Лабрика» показывает страницы со слишком высоким процентом текста, выделенного жирным шрифтом.

страницы со слишком высоким процентом текста, выделенного жирным шрифтом

Скрытые методы спама

Помимо поискового спама, направленного на искусственное повышение релевантности страницы за счет увеличения веса и количества ключевых слов, отдельно выделяют методы, которые используются для его сокрытия и маскировки. Как обойти спам фильтры?

Невидимый контент

На странице размещается невидимый для посетителей текст с ключевыми словами, который предназначен для поисковых роботов. Для этого используются:

  • текст того же цвета, что и фон;

  • размер шрифта с нулевым значением;

  • изображения поверх текста;

  • текст, скрытый с помощью специальных технических приемов: display: none, сдвиг текста за видимую часть сайта;

  • и др.

Маскировка (клоакинг)

Поисковым роботам для индексации предоставляется содержимое с большим количеством ключей, а пользователь видит дугой контент, без каких-либо признаков спама.

Страницы с подозрением на клоакинг можно найти с помощью сервиса «Лабрика». Они отображаются в разделе «Анализ доступности сайта».

Страницы с подозрением на клоакинг

Дорвеи

Это веб-страницы, которые в процессе загрузки отправляют пользователей на другой ресурс. При этом поисковый робот продолжает индексировать первоначальную страницу, а пользователь ее уже не видит. Сайт-посредник, как правило, не содержит никакого полезного контента и наполнен ключевыми словами. Он служит только для привлечения трафика на нужную страничку.

Важно помнить, что все методы скрытого спама отслеживаются и наказываются пессимизацией или исключением ресурсов из поискового индекса.

Некоторые из приемов сокрытия спамного контента определяются поисковыми алгоритмами автоматически, другие обнаруживаются в результате жалобы конкурентов в интернете или после проверки сайта экспертами — асессорами. Обойти спам фильтры сложно.

Рекомендации по снижению текстовой переоптимизации

После обнаружения переоптимизированных страниц и определения вида поискового спама нужно работать над устранением фильтра переоптимизации.

  • Снизить академическую тошноту можно следующим образом:

  1. убрать некоторые вхождения ключевых слов или заменить их синонимами;
  2. увеличить объем текста без использования данных слов или словосочетаний.
  • Соблюдайте баланс между размером метата-тегов Title и Description и числом вписанных в них ключевых слов - содержимое данных элементов является более значимым сигналом ранжирования, чем какой-либо другой текст на странице. Узнать, сколько раз ключевое слово должно использоваться в мета-тегах, можно, проанализировав этот показатель у топовых конкурентов в вашей нише. Уже готовые рекомендации вы найдете в разделе «Оптимизация и кластеризация» сервиса «Лабрика».

  • Уберите из текста лишние заголовки Н1 — Н6, которые не отражают его смысловую структуру.

  • Очистите заголовки от тегов и избытка ключевых слов.

  • Не используйте слишком много анкоров с точным вхождением ключевых фраз. Разбавляйте текст ссылок, используйте синонимы, размещайте безанкорные ссылки.

  • Футер не должен содержать перечисление ключей. Меню и каталоги товаров нужно организовывать без многократного повторения одной и той же фразы.

  • Отмените выделение жирным шрифтом больших фрагментов текста.

  • Не прибегайте к методам скрытого спама для обмана поисковых систем.

Практика показывает: наиболее критичным является переспам по биграммам и триграммам, а также в мета-тегах и заголовках. Если при этом часто употребляются слова, по которым продвигается данная страница, такой переспам может получить наложение санкций со стороны поисковых систем. Поэтому его нужно снять в первую очередь.

Не забывайте главные правила создания веб-контента — публикации нужно писать для людей, а не для поисковых роботов. В первую очередь нужно сделать их полезными и удобными для чтения. Эта работа улучшит поведенческие факторы ресурсов, и их позиции попадут в ТОП естественным путем.

Online SEO-инструменты для продвижения сайтов

Проверьте свой сайт и сайты конкурентов на 230 факторов поисковых систем.