close
16 января 2018

Переоптимизация текста: что это и как исправить?

Переоптимизация в SEO – это превышение допустимой меры оптимизации веб-ресурса, то есть перенасыщение его элементами, способствующими улучшению позиции сайта при ранжировании в поисковых системах.

Переоптимизацией текста (или текстовой переоптимизацией) называется чрезмерное употребление на странице ключевых слов, а также повышение их веса за счет помещения в мета-теги и заголовки и выделения заметным шрифтом.

Чем опасна переоптимизация?

Поисковые системы начали бороться с переоптимизацией после того, как оптимизаторы стали злоупотреблять ключевыми словами и манипулировать их весом для искусственного повышения релевантности страниц и получения более высоких позиций.

Переспам по ключевым словам (то есть избыточное их употребление) часто приводит к понижению в поисковой выдаче позиций отдельных страниц по конкретным ключевым фразам, использование которых было чрезмерным. Если же на сайте будет обнаружено большое количество переоптимизированных текстов, под санкции может попасть весь ресурс.

Яндекс начал пессимизировать сайты с текстовой переоптимизацией еще в 2011 году. А с выходом алгоритма Баден-Баден весной 2017 года огромное количество веб-ресурсов с переоптимизированными текстами попали под фильтр, что привело к сильному проседанию их позиций и потере трафика.

О понижении рейтинга сайтов с такими текстами предупреждают и официальные источники Google.

Как обнаружить текстовую переоптимизацию?

Выявить это нарушение довольно сложно — нужно пересмотреть все тексты, ссылки и html-код. Упрощает процесс использование специального онлайн-сервиса «Лабрика», предназначенного для оптимизации и продвижения веб-ресурсов.

Проверка на переоптимизацию осуществляется в разделе «SEO-аудит». В отчете «Тошнота слов на страницах» будут представлены основные признаки поискового спама, обнаруженные в текстовом содержимом ресурса.

Виды текстового поискового спама

Поисковый спам (то есть манипулирование результатами поиска) часто осуществляется при помощи различных методов переоптимизации текста на страницах ресурса.

Высокая тошнота слов в тексте

Тошнота текста – это показатель заспамленности, то есть частоты употребления каких-либо слов в тексте.

Выделяют 2 вида тошноты:

Классическая - определяется независимо от объёма текста и равняется квадратному корню от общего количества использования слова. Этот показатель обычно не является существенным.

Более информативна академическая тошнота, которая показывает плотность употребления слова или фразы, то есть частоту ее использования по отношению к объёму текста.

Она выражается в процентах и рассчитывается по формуле:

количество повторов слова в тексте / общее количество слов в тексте * 100%

Заниженная тошнота ключевых слов может свидетельствовать о нерелевантности текста запросу пользователя, а высокий процент академической тошноты говорит о злоупотреблении ключевыми фразами.

Пример страницы с высокой плотностью словоформ "насосы" в области контента (академическая тошнота — 7.4%):

В «Лабрике» для анализа также используется показатель академической тошноты. В отчете сервиса будут показаны все слова с высокой плотностью. Чтобы определить, является ли такой показатель в данном случае нормой, он сравнивается с данными сайтов-конкурентов. Проверка плотности проводится только по добавленным на сервис ключевым запросам. По остальным словам предупреждение показывается в случае превышения обычных значений нормы, без дополнительных проверок.

Внимание! У каждого слова есть своя "нормальная" плотность в естественном тексте. В некоторых видах текстов плотность отдельных слов может быть выше обычной нормы.

Когда высокая плотность слов допустима?

Мэтт Каттс, руководитель одного из отделов Google, который занимается проблемами веб-спама, в одном из своих видеообращений отмечал, что допустимое значение плотности ключевых слов варьируется. Оно зависит от тематики и числа ключевых слов на сайтах, которые уже по ним ранжируются. Ключевые слова необходимо размещать на странице таким образом, чтобы текст хорошо читался и выглядел естественным.

То есть оптимального значения плотности слов, общего для всех сайтов, не существует. Для каждой конкретной тематики этот параметр нужно устанавливать индивидуально.

Высокая плотность некоторых слов характерна для определенных стилей речи и документов. Например, стилистической особенностью научных и юридических текстов является насыщенность терминами и устойчивыми выражениями, имеющими строго установленное значение. Заменить их без искажения смысла всего документа зачастую невозможно. Большое количество таких слов в данном случае будет оправдано, поскольку обусловлено стилем документа.

На коммерческих сайтах частое повторение слов (плотность 10% и выше) можно встретить в каталогах товаров и прайс-листах.

Помните, что высокая плотность слов допускается только в отдельных видах текста и не должна присутствовать на страницах ресурса, если они не относятся к данной категории.

Заспамленность биграммами и триграммами

К N-граммам относятся устойчивые сочетания из двух и более слов, которые встречаются в тексте вместе и при этом несут определенную смысловую нагрузку. К этой категории можно отнести и ключевые фразы.

Если ранее санкции поисковых систем накладывались за высокую плотность отдельных слов на странице, то после внедрения фильтра Яндекса Баден-Баден наказывается неестественно частое использование биграмм (устойчивых фраз из двух слов) и триграмм (фраз из трех слов). Особенно это касается словосочетаний, типичных для поисковых запросов, например, включающих слово «купить» или «цена». Высокая частота использования таких n-грамм при небольшом количестве в тексте отдельных слов, входящих в их состав, свидетельствует об искусственном наполнении страницы ключевыми фразами.

Пример заспамленности биграммой «переоптимизированные тексты» приводится в блоге Яндекса:

Поскольку наличие переспама по n-граммам с высокой долей вероятности приводит к пессимизации сайта, «Лабрика» в отчете по переоптимизации текста выводит этот показатель отдельно от других видов академической тошноты.

Повторы слова внутри предложения

Повторы слов в предложении затрудняют чтение и понимание текста. Повторение слов допускается в юридических или технических документах, а также в навигационной цепочке «хлебные крошки». Если повторы не обусловлены спецификой текста, их нужно убрать. «Лабрика» позволяет выявить такие неудобочитаемые фрагменты.

Высокая плотность слов в мета-тегах

Поскольку в метата-тегах Title и Description прописывается только самая важная информация, то поисковики придают им большее значение, чем остальному тексту, размещенному на странице. Поэтому переоптимизация здесь особенно нежелательна.

Если на странице встречается избыточное употребление какого-либо слова в тексте, то его чрезмерное использование в мета-тегах создает уже несколько видов переспама по одному слову, что повышает опасность наложения фильтра.

Чтобы этого избежать, «Лабрика» отдельно указывает на высокую плотность слова в Title и  Description.

Переспам тегов в заголовках

Выделение текста определенными тегами (жирный шрифт, курсив) повышает его вес. Включение таких тегов в заголовки Н1 и Н2, которые сами по себе имеют высокую значимость для поисковых систем, считается чрезмерным. Использование в таком заголовке ключевых слов может привести к переоптимизации по ним, особенно если на странице уже есть признаки переоптимизации по этим словам.

Наибольший вес для поисковых систем имеют следующие теги:

  • <b> (от англ. "bold" ‒ «жирный, полужирный») - выделяет вложенный в него текст полужирным шрифтом.

  • <strong> (от англ. "strong" ‒ «сильный, серьёзный») - предназначен для выделения важного фрагмента текста, на который нужно обратить внимание пользователя. Также отображает текст жирным шрифтом.

  • <i> (наклонный текст) - используется для выделения текста курсивом.

  • <u> - содержит подчёркнутый текст.

  • <а> (анкор) - служит для создания ссылок.

В отчете «Лабрики» отображается наличие данных тегов в заголовках.

Дубли заголовков H2, H3, H4 и заспамленность заголовками

Дублирование означает повторы заголовков H2, H3, H4 на странице, заспамленность - слишком частое их использование, не соответствующее структуре статьи. Это затрудняет восприятие текста читателями, а поисковым роботам в этом случае будет сложно определить характер и качество контента. Страницы с такими текстами могут быть понижены в результатах поиска.

Пример заспамленности заголовками:

Переоптимизация url-адресов и доменных имен

Избыточное употребление ключевых слов в этих элементах может стать причиной наложения фильтра Google под названием EMD (Exact Match Domains). В результате его действия страница может быть исключена из поиска или понижена в поисковой выдаче.

Совпадение Title, Н1, URL и хлебных крошек

В этом случае ключевое слово будет повторяться сразу в нескольких элементах, оказывающих влияние на ранжирование. Это послужит негативным сигналом для поисковой системы и может привести к пессимизации ресурса.

Страницы, на которых совпадают Title и Н1, можно быстро найти с помощью отчета «Ошибки МЕТА тегов» в разделе «SEO-аудит» сервиса «Лабрика».

Переоптимизация анкоров

Избыток ссылок, текст которых наполнен ключевыми словами, является основным сигналом для наложения фильтров поисковых систем. Особенно, если большая часть анкор-листа представляет собой прямые вхождения продвигаемых коммерческих запросов.

Часто наблюдается переспам сквозных ссылок футера или каталога, например, когда в пунктах меню много раз повторяется название товара или услуги («мебель», «ремонт» и. п.).

Злоупотребление выделением слов жирным шрифтом

Написание жирным шрифтом слишком большого объема текста считается попыткой повлиять на результаты поиска, поскольку такое выделение увеличивает вес слов для поисковых систем.

Писать текст жирным шрифтом допустимо только в исключительных случаях, когда нужно подчеркнуть особо важную информацию или заголовок.

«Лабрика» показывает страницы со слишком высоким процентом текста, выделенного жирным шрифтом.

Скрытые методы спама

Помимо поискового спама, направленного на искусственное повышение релевантности страницы за счет увеличения веса и количества ключевых слов, отдельно выделяют методы, которые используются для его сокрытия и маскировки.

Невидимый контент

На странице размещается невидимый для посетителей текст с ключевыми словами, который предназначен для поисковых роботов. Для этого используются:

  • текст того же цвета, что и фон;

  • размер шрифта с нулевым значением;

  • изображения поверх текста;

  • текст, скрытый с помощью специальных технических приемов: display: none, сдвиг текста за видимую часть сайта;

  • и др.

Маскировка (клоакинг)

Поисковым роботам для индексации предоставляется содержимое с большим количеством ключевых слов, а пользователь видит дугой контент, без каких-либо признаков спама.

Страницы с подозрением на клоакинг можно найти с помощью сервиса «Лабрика». Они отображаются в разделе «Анализ доступности сайта».

Дорвеи

Это веб-страницы, которые в процессе загрузки перенаправляют пользователей на другой ресурс. При этом поисковый робот продолжает индексировать первоначальную страницу, а пользователь ее уже не видит. Сайт-посредник, как правило, не содержит никакого полезного контента и наполнен ключевыми словами. Он служит только для привлечения трафика на нужную страницу.

Важно помнить, что все методы скрытого спама отслеживаются и наказываются пессимизацией или исключением ресурсов из поискового индекса.

Некоторые из приемов сокрытия спамного контента определяются поисковыми алгоритмами автоматически, другие обнаруживаются в результате жалобы конкурентов или после проверки сайта экспертами — асессорами.

Рекомендации по снижению текстовой переоптимизации

После обнаружения переоптимизированных страниц и определения вида поискового спама нужно принять меры по его устранению.

  • Снизить академическую тошноту можно следующим образом:

  1. убрать некоторые вхождения ключевых слов или заменить их синонимами;
  2. увеличить объем текста без использования данных слов или словосочетаний.
  • Соблюдайте баланс между размером метата-тегов Title и Description и числом вписанных в них ключевых слов  - содержимое данных элементов является более значимым сигналом ранжирования, чем какой-либо другой текст на странице. Узнать, сколько раз ключевое слово должно использоваться в мета-тегах, можно, проанализировав этот показатель у топовых конкурентов в вашей нише. Уже готовые рекомендации вы найдете в разделе «Оптимизация и кластеризация» сервиса «Лабрика».

  • Уберите из текста лишние заголовки Н1 — Н6, которые не отражают его смысловую структуру.

  • Очистите заголовки от тегов и избытка ключевых слов.

  • Не используйте слишком много анкоров с точным вхождением ключевых фраз. Разбавляйте текст ссылок, используйте синонимы, размещайте безанкорные ссылки.

  • Футер не должен содержать перечисление ключевых слов. Меню и каталоги товаров нужно организовывать без многократного повторения одной и той же фразы.

  • Отмените выделение жирным шрифтом больших фрагментов текста.

  • Не прибегайте к методам скрытого спама для обмана поисковых систем.

Наиболее критичным является переспам по биграммам и триграммам, а также в мета-тегах и заголовках. Если при этом часто употребляются слова, по которым продвигается данная страница, такой переспам может привести к наложению санкций со стороны поисковых систем. Поэтому его нужно устранять в первую очередь.

Не забывайте главный принцип создания веб-контента — тексты нужно писать для людей, а не для поисковых роботов. В первую очередь, они должны быть полезными и удобными для чтения. Это улучшит поведенческие факторы вашего ресурса, и он будет продвигаться в ТОП естественным путем.

Онлайн SEO-сервис Labrika

Получите рекомендации для продвижения сайта на основе 178 требований поисковых систем