5 главных принципов текстовой оптимизации сайта

Самые важные характеристики страницы, которые необходимо проверить при продвижении коммерческих сайтов:

  1. Размер страницы должен входить в рекомендованный диапазон.
  2. Тип страницы должен соответствовать типу ключевой фразы (коммерческий/информационный);
  3. Страница должна находиться на допустимом уровне вложенности,  не глубже чем посадочные у конкурентов из ТОП-10
  4. Плотность ключевых фраз должна входить в рекомендованный диапазон.
  5. Оптимизированные TITLE и H1.

Далее, разберем каждый пункт более подробно.

 1. Размер страницы должен входить в рекомендованный диапазон

Если вы внимательно присмотритесь к размеру текста в документах коммерческих сайтов, то увидите примерно такую картину по большинству запросов:

темно-синим - страницы, которые попадут в рекомендательную систему Лабрики;

фиолетовым - сайты с высокими трастовыми;

зеленым - информационные страницы;

красным - страницы не удалось проанализировать краулером;

пунктиром – рекомендованный диапазон по размеру текста.

Из изображения видно:

  1. Для обеспечения разнообразия,  Google добавил в результаты информационные страницы – они выделены зеленым.
  2. Диапазон значений размера текста на странице достаточно ограничен.
  3. Присутствуют сайты, которые попали в ТОП-10 не благодаря тому, что соответствуют диапазону по размеру текста, а с помощью других факторов. В данном случае, для Google мы отдельно выделили сайты с высокими трастовыми характеристиками – они обозначены фиолетовым цветом.

Необходимые примечания:

  1. На каждый ключевой запрос –  есть свой рекомендованный диапазон по размеру текста. Этот диапазон выбрала поисковая система с помощью машинного обучения на основе изучения тех сайтов, которые предпочитают пользователи. Для коммерческих ключевых слов он обычно укладывается в  500-1200 слов. Для информационных запросов размер текста может быть намного больше, от 2-х до 16-ти тысяч.
  2. Нет четкой границы рекомендаций по размеру текста.  Если рекомендуемый диапазон 492 – 1100 слов, то не стоит паниковать, если у вас получилось 490 слов.

Насколько это важно:

Исследование на 75 тысячах запросах показало, что если размер текста входит в определяемый Лабрикой диапазон значений, то это увеличивает шанс попасть в ТОП-10 Google в 1,8 раза, в ТОП-10 Яндекса – в 1,4 раза.

 

2. Тип страницы должен соответствовать типу ключевой фразы

Поисковые системы работают с таким понятием, как “интент”.

Интент – в переводе на русский язык с английского ­-  “намерение”.

Человек не просто так ищет что-то в поиске, он намерен использовать контент  – посмотреть видео, купить товар, скачать программу, узнать как отремонтировать замок и т.д.

Когда пользователь пишет запрос очень конкретно, например, “синий пылесос  купить” –  поисковая система определяет интент очень чётко – желание купить товар. И соответственно, покажет в результатах поиска интернет-магазины, у которых есть корзина, большой выбор синих пылесосов и т.д.

В случае, если в поисковую систему вводят запрос, по которому нельзя определить интент, или пользователи при его вводе имеют совершенно разные намерения –   поисковые системы включают принцип разнообразия результатов. Пример я приводил выше – когда на запрос “Москва” показываются разнообразные результаты. Причём, в разных городах эти результаты могут отличаться. Например, в каком-либо городе может оказаться очень популярный ресторан  с названием “Москва”,  тогда региональные результаты выдачи будут содержать в себе и это заведение. В других городах вы его не увидите.

Интенты определяются в каждом регионе по всем запросам с помощью машинного обучения.

Интенты могут быть разными, но мы разберём сейчас только разделение на коммерческие и информационные. В Labrika.ru это называется “Тип слова”.

Когда ключевое слово чаще используют для поиска товара или услуги с целью покупки или заказа – это слово коммерческого типа.

Когда ключевое слово чаще используют для поиска информации – это слово информационного типа.

Еще бывает третий вариант, когда требуется большое разнообразие результатов, в таком случае, ключевое слово используют примерно в одинаковой пропорции для поиска информации и для покупок – это слово смешанного типа.

Такая сегментация сделана для упрощения понимания оптимизатору, что же хочет видеть пользователь по этому запросу, и что соответственно, надо размещать на странице.

Поисковые системы ранжируют сайты с учетом соответствия сайта интенту пользователя. Поэтому, Labrika.ru по двум десяткам признаков определяет тип страницы, для того чтобы проверить, сможет ли пользователь увидеть или сделать то, зачем пришел.

При выборе того, какую страницу оптимизировать под определенную ключевую фразу, вы должны учитывать, что на странице пользователь должен обязательно получить ожидаемое. То есть под коммерческий запрос должна быть коммерческая страница (купить/заказать), а под информационный запрос – информационная страница (полезно/интересно/с фото/видео).

Насколько это важно:

Исследования на 75 тысячах запросах показало, что если тип страницы соответствует типу интента запроса, то это увеличивает шанс попасть в ТОП-10 Google на 8-9%, а в Яндексе – на 53-56%.

 

3. Страница должна находиться не глубже от главной, чем посадочные в ТОП-10 конкурентов

Сначала определимся с термином «Глубина вложенности страницы» (Уровень Вложенности). В терминологии есть путаница и противоречия, одни специалисты считают, что главная страница имеет уровень вложенности 0, другие утверждают, что этот показатель равен 1.

В Лабрике используется следующее значение: Главная страница имеет уровень вложенности (УВ) = 1. Все страницы, на которые можно перейти с главной страницы по ссылкам имеют УВ = 2. Далее со страниц 2-го уровня вложенности можно перейти на 3-ий уровень и т.д.

Глубина вложенности – показатель того, сколько кликов надо сделать, чтобы перейти с главной страницы на следующий по порядку уровень вложенности (+ 1).

Уровень вложенности имеет косвенное отношение к Page Rank страниц сайта. На большинстве сайтов у главной страницы самый высокий Page Rank, так как на неё идут ссылки со всех страниц сайта. У страниц на втором уровне вложенности Page Rank меньше, на 3-ем уровне он еще ниже и т.д.

Page Rank можно посчитать на своём сайте, но очень трудозатратно считать его на сайтах конкурентов.  Без сравнения с конкурентами Page Rank мало чем может помочь, например, показатель 0,076 – это много или мало ? Поэтому уровень посадочной страницы является самым простым фактором для сравнения с конкурентами. Чем меньше уровень вложенности страницы -  тем лучше, но когда ключевых фраз для продвижения очень много, то не совсем понятно, как правильно распределить ключевые фразы по страницам – главная страница всего одна, страниц второго уровня тоже ограниченное количество.

Подтверждение статистикой:

Если уровень вложенности страницы больше, чем у конкурентов – это снижает шанс попасть в ТОП-10 Googleна 70%, а в Яндекс – на 57%. Поэтому, размещайте ключевые фразы на страницах с рекомендуемым Лабрикой, или меньшим, уровнем.

 

4. Плотность ключевых фраз должна входить в рекомендованный диапазон

Оптимальная плотность вхождения в тексте, своя у каждого слова. Нельзя сказать, что 0,5% для всех фраз –  это хорошо, а 5% –  очень плохо. Дело в том, что плотность у каждого слова в естественном употреблении своя, отличная от других, какие-то используются чаще, какие-то реже.

Более того, у каждого слова плотность отличается в зависимости от того, что это за страница: в научной литературе плотность слов одна, в художественной литературе другая, в прайс-листах и на страницах с карточками товаров она может быть намного больше – доходить до 12% и более.

Как поисковые системы выполняют поиск и ранжирование результатов?

Если кратко и приближённо, то сначала поисковая система отправляет запрос в базу данных и получает из миллиардов хранящихся там страниц всего 1000. Дальше эта 1000 страниц уже ранжируется (сортируется) исходя из трастовых, поведенческих, коммерческих и других факторов, но эта тысяча будет выбрана исключительно с учетом регионального признака (для геозависимых запросов) и релевантности текста по модифицированной формуле BM25.

То есть, если у вас не будет нормального текста на странице, то всё остальное –  не имеет значения. Одно время можно было попасть в ранжирование при наличии ключевых слов в анкорах ссылок с других сайтов, но сейчас этот способ сошел на нет.

BM25 – это функция, на которой основано все современное ранжирование текстовых документов. В общем виде BM25 зависит от плотности ключевых слов в тексте и частоты этих слов коллекции поисковых систем (в интернете). Подробнее можно почитать на странице:  https://ru.wikipedia.org/wiki/Okapi_BM25

Как видно из изображения выше, сайты в ТОП-10 имеют ограниченный диапазон значений BM25 в тексте на странице.

Поисковые системы используют намного более сложный алгоритм расчета текстовой релевантности – расстояние между словами из ключевой фразы, если они стоят не рядом, данные о том, внутри каких тегов они находятся, скрытую семантику и т.д.  Но в грубом приближении, BM25 можно использовать как минимальный показатель уровня оптимизации текста страницы.

Подтверждение статистикой:

Если показатель BM25 на странице входит в рекомендуемый диапазон, то это увеличивает шанс попасть в ТОП-10 Google в 3,2 раза, в ТОП-10 Яндекс в 2,9 раза. Поэтому,  размещайте ключевые фраза на страницах с рекомендуемым Labrika уровнем или меньшим.

 

5. Минимально необходимая оптимизация TITLE и H1

Мета-тег TITLE - используется поисковыми системами для ранжирования страницы и для формирования заголовка сниппета.

Сниппет – краткое описание сайта, которое отображается в результатах поиска.

H1 – это видимый заголовок страницы. Он, как и TITLE, имеет повышенный вес (значение) для поисковых систем. Поэтому оптимизации этих параметров стоит уделить особое значение.

Повышенный вес этим полям страницы поисковые системы отвели по простой причине –их длина ограничена, а также, там должна информация о том, что находится на странице.

Что важно учитывать ?

  1. В H1 нельзя размещать точно такой же текст, что и в TITLE. Это считается поисковым спамом.
  2. Не нужно размещать все ключевые фразы в TITLE и H1  - эти поля имеют ограничения по размеру. Лабрика покажет, какие слова из ключевых фраз необходимо использовать при оптимизации, а остальные можно продвинуть и без этого.
  3. Не рекомендуется использовать одно слово в теге больше одного раза, даже в разных словоформах. Это считается поисковым спамом - при наличии других нарушений на странице она может быть пессимизирована*.

*Пессимизация страницы – снижение позиции страницы  в результатах поиска за наличие на ней негативных факторов или нарушений.

Подтверждение статистикой:

Если вы не будете использовать необходимые ключевые фразы в TITLE, то шанс попасть в ТОП-10 в Google будет меньше в 4,7 раза, а в случае с Яндекс в 4,1 раза.

Если вы не будете использовать необходимые ключевые фразы в H1, то шанс попасть в ТОП-10 Google будет меньше в 3,3 раза, а в случае с Яндекс в 2,9 раз.