Понимание задачи: HTML против JavaScript сайтов
При анализе сайта для SEO одним из ключевых аспектов является способ доставки контента. Сайты делятся на две большие категории:
- Сайты на основе HTML: Эти сайты предоставляют контент непосредственно в исходном коде HTML. Структура статична, и вся ключевая информация (текст, изображения, метаданные) доступна в сыром исходном коде страницы.
- Пример: Традиционный блог или сайт малого бизнеса, созданный с помощью платформ, таких как WordPress или Joomla.
- Преимущество для SEO: Поисковые системы могут легко сканировать и индексировать контент без дополнительной обработки или задержек.
- Сайты на основе JavaScript: Эти сайты динамически генерируют контент в браузере с использованием JavaScript. Это означает, что исходный код HTML часто неполный или даже пуст до выполнения JavaScript.
- Пример: Современная платформа электронной коммерции, созданная с использованием фреймворков, таких как React или Angular, где списки продуктов или описания загружаются динамически из API.
- Проблема для SEO: Поисковым системам необходимо отобразить страницу и выполнить JavaScript, чтобы увидеть весь контент, что требует больше времени и ресурсов.
Почему это важно для SEO?
Поисковые системы, такие как Yandex, активно работают над улучшением своей способности сканировать и индексировать контент на основе JavaScript. Однако этот процесс не всегда безупречен. Вот как поисковые системы обрабатывают два типа сайтов:
- Сайты на основе HTML: Поисковые системы читают исходный код HTML и сразу получают доступ ко всему релевантному контенту, метаданным и ссылкам. Этот процесс быстрый и надежный.
- Сайты на основе JS: Сначала поисковая система должна получить HTML, затем загрузить и выполнить JavaScript, и в конце отобразить страницу, чтобы увидеть весь контент. Это включает несколько этапов:
- Загрузка внешних JS-файлов.
- Разрешение API-запросов для получения данных.
- Отрисовка итогового макета.
Пример проблемы: Рассмотрим сайт электронной коммерции, где описания продуктов загружаются через JavaScript. Если YandexBot не выполнит JS корректно, описания не появятся в индексе, что означает, что пользователи, ищущие конкретные продукты, могут никогда не найти сайт в результатах поиска.
Как проверить, видит ли Yandex контент вашего сайта
Прежде чем решать, включать ли парсинг JS в Labrika, необходимо убедиться, что ваш контент виден Yandex. Вот три подробных метода для проверки:
- Инструмент проверки URL в Yandex Webmaster
- Откройте Яндекс.Вебмастер и перейдите в инструмент проверки URL.
- Введите URL конкретной страницы, чтобы увидеть, как Yandex ее сканировал.
- Проверьте раздел «Просканированная страница»:
- Отображает ли он весь видимый контент?
- Присутствуют ли метатеги, структурированные данные и текст?
- Совет: Ищите расхождения между тем, что Yandex индексировал, и тем, что видят пользователи. Для сайтов с большим количеством JavaScript отсутствие элементов может указывать на проблемы с отображением.
- Поиск в Yandex с использованием оператора site:
- Перейдите в Яндекс и введите site:вашдомен.рф. Это покажет все страницы, которые Yandex индексировал с вашего сайта.
- Сравните количество индексированных страниц с фактическим количеством страниц на вашем сайте.
- Проверьте заголовки и описания индексированных страниц: они точные и полные?
- Ключевой вывод: Если критические страницы или контент отсутствуют, это сильный признак того, что Yandex испытывает трудности с отображением вашего JavaScript-контента.
Решение о включении парсинга JS в Labrika
Как только вы узнаете, может ли Yandex видеть ваш контент, вы можете принять обоснованное решение о включении парсинга JS в Labrika. Вот пошаговое руководство:
Когда включать парсинг JS
- Ключевой контент генерируется динамически: Если описания продуктов, статьи блога или внутренние ссылки создаются с помощью JavaScript, вам нужен парсинг JS, чтобы Labrika точно анализировала ваш сайт.
- Критические элементы SEO зависят от JS: Метатеги, канонические URL или структурированные данные, которые вставляются динамически через JavaScript, требуют парсинга JS для правильного анализа.
- Вы проверили, что Yandex видит ваш контент: Если Yandex успешно отображает ваш сайт, включение парсинга JS в Labrika будет отражать это поведение и предоставлять полезные инсайты.
Когда пропустить парсинг JS
- Контент доступен в HTML: Если весь видимый контент присутствует в сыром исходном коде HTML, нет необходимости в парсинге JS, так как это добавляет ненужную сложность и затраты.
- Yandex не видит ваш контент: Если Yandex не может индексировать ваш динамически генерируемый контент (на основе вышеупомянутых проверок), включение парсинга JS не решит проблему. Вместо этого вам следует сосредоточиться на переработке вашего сайта, чтобы предоставлять ключевой контент в HTML.
Почему парсинг JS стоит больше
Парсинг JavaScript требует значительно больше вычислительных ресурсов, чем стандартный анализ HTML. Вот почему:
- Симуляция среды браузера: Labrika должна создать виртуальную среду браузера для выполнения JavaScript и отображения полного контента. Это включает обработку макетов, API-запросов и дополнительных ресурсов, таких как шрифты или изображения.
- Дополнительные сетевые запросы: Многие сайты с большим количеством JavaScript полагаются на API для динамической загрузки данных (например, информации о продуктах, отзывов пользователей). Каждый дополнительный запрос увеличивает время и ресурсы, необходимые для анализа одной страницы.
- Сложность обработки: Парсинг JS часто требует анализа нескольких уровней скриптов, включая сторонние зависимости, для генерации итогового вида.
В результате анализ сайтов с большим количеством JavaScript в Labrika потребляет вдвое больше кредитов на страницу по сравнению с сайтами только на HTML.
Сколько времени займет парсинг JS?
Включение парсинга JS не только увеличивает потребление кредитов, но и значительно замедляет процесс анализа. Вот чего можно ожидать:
- Сравнение скорости: Парсинг JS занимает примерно в 2–3 раза больше времени, чем стандартный анализ HTML.
- Пример для 1,000 страниц:
- Без парсинга JS: 0,5–1 час.
- С парсингом JS: 2–6 часов в зависимости от сложности сайта и времени отклика сервера.
Это дополнительное время необходимо для обеспечения точности анализа, но важно планировать это заранее при работе с большими сайтами.
Как включить парсинг JS в Labrika
Вы можете включить анализ на основе JavaScript в настройках вашего сайта.
- Перейдите в левое меню
- Перейдите в Настройки
- Откройте вкладку Общие настройки
- Найдите раздел Настройки краулера
Кейс: Когда необходимо переработать сайт
Рассмотрим реальный пример:
Сценарий: Онлайн-магазин мебели, созданный с использованием React, динамически загружает описания продуктов и отзывы через API-запросы. При тестировании в Yandex Webmaster ключевой контент (например, детали продуктов) не появляется в виде «Просканированной страницы».
Результат:
- Включение парсинга JS в Labrika позволило бы точно проанализировать сайт, но Yandex все равно не видит контент из-за заблокированных скриптов и задержек API.
- Долгосрочное решение — переработать сайт, чтобы предоставлять описания продуктов и критические метаданные непосредственно в HTML.
Если поисковые системы не могут индексировать ваш контент, включение парсинга JS является временным решением для анализа, но не улучшит SEO-показатели вашего сайта.
Почему стоит выбирать платформы, дружелюбные к HTML
Если вы создаете или переносите сайт, выберите платформу, которая предоставляет ключевой контент в HTML. Примеры включают WordPress, Drupal и Joomla. Эти платформы:
- Обеспечивают быстрое и надежное SEO с контентом, доступным непосредственно в HTML.
- Упрощают анализ, сокращая использование кредитов и время анализа.
- Избегают рисков, связанных с проблемами отображения JavaScript.