Технология Яндекс "Спектр"

Принцип работы "Спектра"

В основе работы этого алгоритма лежит статистика поисковых запросов. Яндекс исследует запросы всех пользователей и выделяет в них различные понятия и слова – это могут быть имена людей, названия фильмов и книг, модели автомобилей и так далее. Каждое слово относится к одной или нескольким категориям. Например, в запросе [колдрекс инструкция] название лекарства "Колдрекс" — объект, который попадает в категорию «лекарства». А слово "Пушкин", относится к двум категориям — "поэты" и "города".

Кроме того, "Спектр" ;умеет учитывать при поиске различные потребности пользователей. У каждой категории есть список возможных потребностей – тех намерений, с которыми пользователи ищут тот или иной объект. Например, когда люди ищут какой-нибудь товар, они, как правило, хотят купить его, или почитать отзывы и обзоры. То есть, в категории «товары», потребности будут следующие: купить, отзывы и обзоры. Всего у категории может быть от двух-трех до нескольких десятков потребностей.

С учетом того, в какие категории попал объект, какую информацию люди обычно про него спрашивают и что пишут о нем в интернете -  "Спектр" оценивает процент пользователей, которые ищут этот объект с каждой из возможных целей. Эти данные используются при ранжировании результатов поиска по многозначным запросам. Используя их, "Спектр" вычисляет пропорции, в которых ответы на ту или иную тему должны быть представлены в результатах поиска. Найденные сайты упорядочиваются таким образом, чтобы спектр ответов соответствовал спектру вопросов. Таким образом, поиск Яндекса максимизирует вероятность того, что человек найдет именно то, что искал. Даже если он не указал это явно в своем запросе, а просто подумал.

Кроме статистики запросов, "Спектр" ;умеет использовать данные из справочников и энциклопедий – в том числе из Википедии. Это помогает распознавать недавно появившиеся объекты, узнавать, какие значения объектов не укладываются ни в одну из существующих категорий, и добавлять новые.

Самые большие категории:

  • товары (цена, каталог, отзывы, купить, доставка, выбрать, оптом)
  • поэты (родился, биография, реферат, фамилия)
  • знаменитости (фото, биография, скачать, mp3, тексты песен, официальный сайт, аккорды, клипы)
  • лекарства (комментарий, описание, свечи, таблетки, инструкция, купить)
  • фильмы, книги (смотреть, онлайн, скачать)
  • авто (продажа, отзывы, цены, б/у, фото, технические характеристики)
  • города (время, погода, работа, вакансии, достопримечательности, гостиницы, новости, карта, афиша, знакомства)
  • туризм (отели, туры, отдых, погода, цены, горящие туры, новости)
  • кулинария (рецепт, фото, калорийность, доставка, википедия, в картинках, в домашних условиях)
  • одежда (на заказ, продажа, купить, фото)
  • недвижимость (цена, продажа, купить, фото, жилье)

Наличие дополнительных слов придает странице большую релевантность.

“Спектр” работает только для многозначных запросов и для тех, процент поиска которых превышает определенный порог. Тоесть, во внимание идет количество показов данного запроса, а также количество показов запроса + дополнительное слово.

В связи с нововедениями в поисковых алгоритмах Яндекса не стоит "спамить" словами близкими к заданной категории преследуя цель занять ТОП выдачи. В первую очередь необходимо определить "полезность" предлагаемого пользователю контента, и уже после глубокого анализа можно рассматривать возможность "попадания" в несколько категорий поиска. В 2017 году при анализе ресурсов в выдаче, Яндекс все больше акцентирует внимание на актуальности информации для пользователей.