Главная / SEO аудит / Тошнота слов на страницах

Онлайн анализ на тошноту текста

Переоптимизацией называется чрезмерное употребление на странице ключевых слов, а также повышение их веса за счет помещения в мета-теги и заголовки и выделения заметным шрифтом.

Внимание! За переоптимизацию поисковые системы снижают позицию только конкретного ключевого слова или фразы по которой происходит переспам для конкретной посадочной страницы. Сайт может быть понижен в результатах поиска по всем запросам только если переоптимизация будет ярко выражена и будет затрагивать много страниц сайта. Labrika показывает все виды переоптимизации. Это даёт возможность найти плохие страницы и исправить их. Некоторые варианты могут попасть в отчёт по ошибке. Но это не значит, что если вы исправите только конкретные фразы, то это сильно улучшит положение сайта – необходимо переосмыслить эти страницы целиком и убедиться, что они представляют пользу для посетителей сайта.

Поисковые системы начали бороться с переоптимизацией после того, как оптимизаторы стали злоупотреблять ключевыми словами и манипулировать их весом для искусственного повышения релевантности страниц и получения более высоких позиций.

Переспам часто приводит к понижению в поисковой выдаче позиций отдельных страниц по конкретным ключевым фразам, использование которых было чрезмерным. Если на сайте большое количество переоптимизированных текстов, под санкции может попасть весь ресурс.

Яндекс начал пессимизировать сайты с текстовой переоптимизацией еще в 2011 году. А с выходом алгоритма Баден-Баден весной 2017 года огромное количество web-ресурсов с переоптимизированными текстами попали под фильтр, что привело к сильному проседанию их позиций и потере трафика.

О понижении рейтинга сайтов за переопимизированные тексты предупреждают и официальные источники Google.

Виды поискового спама, которые определяет Лабрика:

  • Тошнота слов в контенте (то есть высокая плотность употребления слов в тексте страницы)
  • Тошнота биграмм (фраз из двух слов) и триграмм (фраз из трех слов) в тексте
  • Повторы слова внутри предложения
  • Высокая плотность слов в META-тегах
  • Высокая плотность слов в заголовках
  • Дубли заголовков H2, H3, H4
  • Заспамленность заголовками
  • Наличие в заголовках тегов <b>, <strong>, <i>, <u>, <a>
  • Злоупотребление выделением слов жирным шрифтом

Тошнота слов в тексте

В Лабрике для анализа используется академическая тошнота, которая показывает плотность употребления слова или фразы, то есть частоту ее использования по отношению к объёму текста.

Она выражается в процентах и рассчитывается по формуле:

[количество повторов слова в тексте] / [общее количество слов в тексте] * 100%.

Заниженная тошнота ключевых слов может свидетельствовать о нерелевантности текста запросу пользователя, а высокий процент академической тошноты говорит о злоупотреблении ключевыми фразами.

Внимание! У каждого слова есть своя "нормальная" плотность в естественном тексте. В некоторых видах текстов плотность отдельных слов может быть выше обычной нормы, например, в технической и юридической литературе. На коммерческих сайтах высокую плотность слов (10% и выше) можно встретить в прайс-листах и каталогах товаров. Но это не значит, что на других страницах это допустимо. Labrika показывает все слова с высокой плотностью. Чтобы определить, является ли большая плотность в данном случае нормой, производится сравнение с сайтами конкурентов. Проверка плотности проводится только по добавленным для анализа ключевым запросам. По остальным словам предупреждение показывается в случае превышения обычных норм плотности, без перепроверок.

В отчете указывается процент тошноты тех слов, плотность которых слишком высока. В этом случае стоит снизить количество указанных слов - убрать некоторые вхождения или заменить их синонимами.

Тошнота биграмм и триграмм в тексте

Ранее санкции накладывались за высокую плотность отдельных слов, но после внедрения фильтра Яндекса Баден-Баден наказывается и чрезмерное использование биграмм (фраз из двух слов) и триграмм (фраз из трех слов), особенно если эти словосочетания типичны для ключевых фраз, например, включают слово «купить» или «цена».

Повторы слова внутри предложения

Повторы слов в предложении затрудняют чтение и понимание текста. Лабрика позволяет выявить такие неудобочитаемые фрагменты. Повторение слов допускается в юридических или технических документах, а также в «хлебных крошках». Если повторы не обусловлены спецификой текста, их нужно убрать. Так, в приведенном ниже скриншоте слово «электростанция» встречается в предложении 3 раза. Чтобы избежать повторов, нужно изменить предложение — например, сначала написать «виды электростанций», а затем перечислить их уже без слова «электростанция».

Повторы слова внутри предложения

Высокая плотность слов в META-тегах и заголовках

Лабрика указывает на высокую плотность слова в различных формах в заголовках и META-тегах. Поскольку в данных элементах прописывается только самая важная информация, то поисковики придают им большее значение, чем остальному тексту, размещенному на странице. Поэтому переспам здесь особенно нежелателен.

Если на странице уже имеется переспам по какому-либо слову в тексте, то его чрезмерное использование в заголовках и META-тегах создает уже несколько видов переспама по одному слову, что повышает опасность наложения фильтра.

Дубли заголовков H2, H3, H4 и заспамленность заголовками

Дублирование означает повторы заголовков H2, H3, H4 на странице, заспамленность - слишком частое их использование, не соответствующее структуре статьи. Это затрудняет восприятие текста читателями, а поисковым роботам в этом случае будет сложно определить характер и качество контента. Страницы с такими текстами могут быть понижены в результатах поиска.

Наличие тегов в заголовках

Выделение текста тегами повышает его вес. Включение слов в заголовки (Н1, Н2) также повышает их значимость для поисковых систем. Поэтому сочетание этих факторов считается чрезмерным и относится к переоптимизации текста.

В отчете Лабрики отображается наличие в заголовках следующих тегов:

  • <b> (от англ. "bold" ‒ «жирный, полужирный») - выделяет вложенный в него текст полужирным шрифтом.
  • <strong> (от англ. "strong" ‒ «сильный, серьёзный») - предназначен для выделения важного фрагмента текста, на который нужно обратить внимание пользователя. Также отображает текст жирным шрифтом.
  • <i>(наклонный текст) - используется для выделения части текста курсивом.
  • <u> - содержит подчёркнутый текст.
  • <a> (анкор) - служит для создания ссылок.

Злоупотребление выделением слов жирным шрифтом

Лабрика показывает страницы со слишком высоким процентом текста, выделенного жирным шрифтом.

Выделять текст таким образом допустимо только в исключительных случаях, когда нужно подчеркнуть особо важную информацию или заголовок. Написание жирным шрифтом слишком большого объема текста считается попыткой повлиять на результаты поиска, так как выделение ключевых слов увеличивает их вес для поисковых систем.

Содержание отчёта «Тошнота слов на страницах»

Содержание отчёта Тошнота слов на страницах

  1. URL страницы, на которой обнаружены признаки переспама.
  2. Данные по количеству слов на странице.
  3. Причина подозрения на поисковый спам.

Как пользоваться отчетом?

Отчет носит рекомендательный характер. Решение о необходимости исправления переоптимизированных фрагментов принимает оптимизатор.

Наиболее критичным является переспам по биграммам и триграммам, а также в заголовках, если часто употребляются слова, по которым продвигается данная страница.

В верхней части отчета предоставляется возможность снять галочки около тех видов переспама, данные по которым нужно скрыть:

переспам по биграммам и триграммам