Sitemap validator

Количество найденных файлов карты сайта

Количество элементов в файлах карты сайта

Количество страниц во всех файлах карты сайта

Ошибки, обнаруженные на карте сайта

Предупреждения, найденные на карте сайта

Недопустимый URL-адрес в индексном файле карты сайта

Недопустимый URL-адрес

Пустая карта сайта

URL-адреса недоступны

Ошибка сжатия

Слишком много перенаправлений (>4)

Нет объявления формата

Ошибка в размере файла карты сайта

Слишком много URL-адресов на карте сайта

Слишком много карт сайта в индексном файле карты сайта

Неверная дата

Недопустимый XML: слишком много тегов

URL-адрес другого домена

Недопустимое значение атрибута

Неподдерживаемый формат

Несоответствие пути - Отсутствует www

Несоответствие пути: включает www

Неправильное пространство имен

Недопустимое значение тега

Недопустимый URL в индексном файле карты сайта: неполный URL

Отсутствует обязательный атрибут XML

Отсутствует необходимый XML-тег

Отсутствующий URL-адрес миниатюры

Отсутствующий заголовок видео

Неправильный формат индекса карты сайта: вложенные индексы карты сайта

Ошибка синтаксического анализа

Миниатюра слишком большая

Миниатюра слишком мала

Местоположение видео и страницы воспроизведения совпадают

URL-адрес местоположения видео, по-видимому, является URL-адресом страницы воспроизведения

Тег <changefreq> = никогда

Карта сайта заблокирована в robots.txt

Относительная ссылка

Слишком длинный URL-адрес

Все страницы внутри одной и той же карты сайта имеют одинаковое время изменения документа

Карта сайта не содержит тега с датой последнего изменения документа

На всей карте сайта нет даты обновления страницы или приоритета обновления страницы

Для страницы не указана частота обновления или приоритет индексации

Ведущий пробел

URL-адрес карты сайта перенаправляет на другой URL-адрес

Недопустимый формат приоритета URL-адреса

URL-адрес не разрешен

Все страницы внутри одной и той же карты сайта имеют одинаковый приоритет

Количество найденных файлов карты сайта

Это показывает, сколько файлов карты сайта было найдено на сайте. Файлы карты сайта содержат список страниц и других ресурсов сайта, подлежащих индексации. Эта информация помогает поисковым системам более эффективно индексировать сайт.

Стандарт, принятый для карты сайта, позволяет использовать множество файлов карты сайта. Пожалуйста, обратите внимание, что файлы sitemap могут быть не найдены, если их пути не соответствуют стандарту протокола sitemap или содержат орфографические ошибки.

Количество элементов в файлах карты сайта

Этот отчет показывает количество HTML-страниц и других ресурсов, найденных во всех файлах карты сайта на момент анализа сайта.

Количество страниц во всех файлах карты сайта

Этот отчет показывает, сколько страниц в формате HTML было найдено во всех файлах карты сайта на момент анализа сайта. Сюда не входят ресурсы в других форматах, таких как изображения и т.д.

Это полезный отчет для сравнения количества страниц, найденных в файлах карты сайта, с фактическим количеством страниц на сайте, проиндексированных в поисковых системах. Это может помочь быстро обнаружить различные проблемы.

Например, некоторые сайты, возможно, не удалили страницы из карты сайта, которые были удалены или отключены в административной панели сайта. Таким образом, это может привести к потере краулинового бюджета на поиск и, возможно, к снижению позиций сайта. Если в индексе поисковой системы значительно меньше страниц, чем на карте сайта, это также может указывать на то, что у сайта проблемы с индексацией. Или что карта сайта отформатирована неправильно и содержит дополнительные страницы.

Ошибки, обнаруженные на карте сайта

Ошибки в карте сайта могут привести к неправильной интерпретации данных и невозможности использования всего файла или отдельных строк внутри него. Мы проверяем карту сайта на соответствие стандартам sitemap, XML, w3c, а также рекомендациям Google, Yahoo, Bing и Яндекса.

Предупреждения, найденные на карте сайта

Предупреждения указывают на наличие проблем, которые значительно снизят эффективность карты сайта.

Например, если сайт содержит десятки тысяч страниц, то при правильном выполнении индексация изменений на страницах может занять от нескольких часов до нескольких дней. Однако, если все сделано неправильно, например, если на карте сайта нет временных меток, то индексация изменений может занять несколько недель. Таким образом, это замедляет любое продвижение или оптимизацию вашего сайта.

Сообщения об ошибках

Недопустимый URL-адрес в индексном файле карты сайта

Это означает, что URL-адрес файла карты сайта неправильно отформатирован или содержит недопустимые символы. Существует несколько распространенных причин, по которым может возникнуть эта ошибка:

  1. URL-адрес карты сайта не должен находиться в другом домене или поддомене.
  2. Google может не обрабатывать относительные URL-адреса на карте сайта. Если возможно, добавляйте абсолютные или полные URL-адреса, а не относительные.
    Например, при переходе по ссылке на другую страницу сайта используйте ссылку:
    https://www.example.com/page.hml
    вместо
    page.hml
  3. Если URL-адрес содержит пробелы и символы, замените все пробелы и недопустимые символы соответствующими объектами кодировки URL-адреса.
      Например, для пробелов вы должны использовать:
    http://www.example.com/space%20here.html
    Для символов типа & используйте:
    http://www.example.com/and%26here.html

URL-адреса в карте сайта должны соответствовать стандарту RFC-3986 (https://www.ietf.org/rfc/rfc3986.txt)

Стандарт XML (https://www.w3.org/TR/REC-xml/)

И стандарт RFC-3987 (https://www.ietf.org/rfc/rfc3987.txt).

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Недопустимый URL-адрес

URL-адрес в вашей карте сайта указан неправильно. Эта ошибка может быть вызвана тем, что она содержит пробелы, неподдерживаемые или недопустимые символы.

Например, htp:// или http:/ вместо http://

Убедитесь, что URL-адреса, указанные на карте сайта, соответствующим образом защищены.

Например, символ "&" в URL-адресе следует заменить на "%26", а все пробелы - на "%20".

URL-адреса в карте сайта должны соответствовать стандарту RFC-3986 (https://www.ietf.org/rfc/rfc3986.txt)

Стандарт XML (https://www.w3.org/TR/REC-xml/)

И стандарт RFC-3987 (https://www.ietf.org/rfc/rfc3987.txt).

Для получения более подробной информации:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2

Пустая карта сайта

Файл карты сайта не содержит никаких URL-адресов

URL-адреса недоступны

Эта ошибка появляется, когда мы не можем получить URL-адреса из карты сайта.

Проверьте URL-адрес карты сайта с помощью инструмента проверки URL-адреса: (https://support.google.com/webmasters/answer/9012289), чтобы узнать, доступен ли этот адрес Google.

Ошибка сжатия

Мы получили сообщение об ошибке при попытке распаковать файл. Используйте формат gzip для сжатия файла.

Слишком много перенаправлений (>4)

URL-адрес содержит слишком много перенаправлений для поисковых роботов. Замените адреса перенаправления в ваших файлах карты сайта URL-адресами, которые необходимо отсканировать. Избегайте использования перенаправлений типа JavaScript или meta-update.

Нет объявления формата

Эта ошибка возникает, если карта сайта имеет неправильный заголовок или заголовок не соответствует формату.

Например, если ваша карта сайта создана в формате XML, то у нее должен быть заголовок:

<?версия xml="1.0"encoding="UTF-8"?>

Кроме того, согласно правилам Google и принятым стандартам, все атрибуты XML должны быть заключены в одинарные (') или двойные (") кавычки. Кавычки должны быть прямыми, а не фигурными.

Пожалуйста, обратите внимание, что программы обработки текстов, такие как Microsoft Word, могут заменять прямые кавычки фигурными, и тогда это нарушило бы требования.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Ошибка в размере файла карты сайта

Размер карты вашего сайта в несжатом виде превышает 50 МБ. Если размер вашей карты сайта превышает допустимый, ее следует разделить на несколько файлов меньшего размера.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Слишком много URL-адресов на карте сайта

Карта вашего сайта содержит не более 50 000 URL-адресов. Разделите карту сайта на несколько файлов и убедитесь, что каждый содержит не более 50 000 URL-адресов. Вы также можете использовать индексный файл карты сайта для размещения URL-адресов в ваших картах сайта.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Слишком много карт сайта в индексном файле карты сайта

Индексный файл sitemap содержит более 50 000 карт сайта.

Разделите индексный файл карты сайта на несколько файлов и убедитесь, что в каждом из них указано не более 50 000 карт сайта.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/large-sitemaps

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#index

Неверная дата

Ваша карта сайта содержит недопустимый формат даты.

Даты должны использовать кодировку W3C Datetime (https://www.w3.org/TR/NOTE-datetime).

Пример приемлемых форматов:

2021-12-19

2021-12-19T16:00:17+04 00

Время не является обязательным (время по умолчанию - 00:00:00Z).

Однако, если вы указываете время, вы должны указать часовой пояс.

Для получения более подробной информации посетите:

https://www.sitemaps.org/protocol.html#xmlTagDefinitions

https://www.w3.org/TR/NOTE-datetime

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Недопустимый XML: слишком много тегов

Карта сайта содержит повторяющиеся теги.

Пример ошибки:

<url>

<loc>http://www.example.com/</loc>

<lastmod>2021-12-17</lastmod>

<lastmod>2021-12-19T16:00:17+04 00</lastmod>

<priority>0.8</priority>

</url>

В примере тег <lastmod> указан дважды для одного элемента - это ошибка.

Номер строки будет указан в сообщении об ошибке. Чтобы устранить проблему, просто удалите повторяющийся тег.

Документация:

https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

URL-адрес другого домена

Карта сайта не может содержать URL-адрес другого уровня домена или другого поддомена.

Например, на карте сайта https://example.com/sitemap.xml вы не можете ссылаться на https://en.example.com/index.htm поскольку это другой домен.

Для получения более подробной информации посетите

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#location

Недопустимое значение атрибута

Атрибут содержит недопустимое значение для XML-тега. Проверьте свои карты сайта и убедитесь, что они содержат только разрешенные атрибуты и что они написаны в соответствии со спецификациями карты сайта. Кроме того, проверьте атрибуты и значения на наличие опечаток.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Неподдерживаемый формат

Google поддерживает следующие форматы файлов:

  • XML (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#xml)
  • RSS-канал (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#rss)
  • mRSS (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#rss)
  • Atom 1.0 (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#rss)
  • Текст (https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap?visit_id=637740703567261364-115722582&rd=2#text)

Эта ошибка также возникает, если карта сайта имеет неправильный заголовок или заголовок отсутствует для используемого формата.

Например, если ваша карта сайта представлена в формате XML, то у нее должен быть заголовок:

<?version xml="1.0" encoding="UTF-8"?>

Как упоминалось ранее, согласно правилам Google, все атрибуты XML должны быть заключены в одинарные (') или двойные (") кавычки. Кавычки должны быть прямыми, а не фигурными.

Пожалуйста, обратите внимание, что программы обработки текстов, такие как Microsoft Word, могут заменять прямые кавычки фигурными. Это противоречит стандартным требованиям.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Несоответствие пути - Отсутствует www

Путь к карте сайта не содержит префикса www (например, https://example.com/sitemap.xml)

Но указанные в нем URL-адреса содержат www (например, https://www.example.com/index.hml).

Все страницы сайта должны быть перенаправлены на желаемую версию - с www или без www. Убедитесь, что карта сайта содержит тот же вариант префикса.

Источник: https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

Несоответствие пути: включает www

Путь к карте сайта содержит префикс www (например, https://www.example.com/sitemap.xml), но указанные в нем URL-адреса не содержат www (например, https://example.com/index.hml).

Все страницы сайта должны быть перенаправлены на желаемую версию - с www или без www. Убедитесь, что карта сайта содержит тот же вариант префикса.

Источник: https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

Неправильное пространство имен

Карта сайта не содержит правильного пространства имен или объявлена неправильно. Пространство имен может содержать опечатку или неверный URL-адрес.

Убедитесь, что вы используете правильное пространство имен для вашего типа файла. Например:

Файл карты сайта: urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 "

Файл карты сайта для видео: xmlns: видео = "http://www.google.com/schemas/sitemap-video/1 .1"

Индексный файл карты сайта: xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9 ">

Файл, в котором хранятся HTML-код и изображения, будет содержать

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 "

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1 ">

Ошибка может возникнуть, если формат записан неправильно, например: /.9 вместо /0.9.

Или если путь указан неправильно, например:

<urlset xmlns="/schemas/sitemap/0.9">

вместо

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 ">

или <urlset xmlns="http://www.sitemaps.org/schmas/sitemap/0.9 "> - буква в ссылке здесь отсутствует.

Источники:

https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

https://www.w3.org/XML/Schema#dev

Недопустимое значение тега

Ваша карта сайта содержит тег с недопустимым значением. Проверьте спецификации для вашего типа карты сайта.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#xmlTagDefinitions

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

https://developers.google.com/search/docs/advanced/sitemaps/image-sitemaps

https://developers.google.com/search/docs/advanced/sitemaps/news-sitemap

Недопустимый URL в индексном файле карты сайта: неполный URL

Google описывает эту ошибку следующим образом: "Индексный файл карты сайта содержит неполный URL".

Когда поисковые системы видят индекс карты сайта, они выполняют поиск файлов, на которые он ссылается, в том же каталоге.

Расположение файла карты сайта определяет набор URL-адресов, которые могут быть включены в этот конкретный файл карты сайта.

Например, файл карты сайта, расположенный по адресу http://example.com/catalog/sitemap.xml может включать любые URL-адреса, начинающиеся с http://example.com/catalog / Но не может включать URL-адреса, начинающиеся с http://example.com/images/.

Если наш инструмент не сможет найти там URL-адрес, вы увидите эту ошибку. Обновите индексный файл карты сайта, чтобы включить полный путь к каждому файлу карты сайта в списке, а затем отправьте повторно.

Было много судебных дел против поисковых систем за ошибочную индексацию разделов сайтов, которые были закрыты

Несмотря на то, что информации об этой ошибке немного, в стандартах Google sitemap ей посвящен целый раздел, несмотря на то, что многие другие ошибки не включены. Поэтому, по нашему мнению, это правило существует для того, чтобы избежать ошибочной индексации данных, которые предназначены для блокировки индексации.

Пожалуйста, обратите внимание, что не все разработчики принимают во внимание эти стандарты карты сайта при разработке своих плагинов CMS, и поэтому может возникнуть эта ошибка.

Источники: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://www.sitemaps.org/protocol.html#location

Отсутствует обязательный атрибут XML

В теге карты сайта нет атрибута. Это обязательно.

Пример ошибки:

<?version xml="1.0" кодировка="UTF-8"?>

<urlset>

<url>

<loc>http://www.example.com /</loc>

<lastmod>2023-11-09</lastmod>

</url>

</urlset>

Здесь, в теге

<urlset>

Этот атрибут опущен:

xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 "

Тег должен содержать:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 ">

Источник:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap

Отсутствует необходимый XML-тег

Требуемый тег отсутствует. Номер строки будет указан в сообщении об ошибке.

Пример ошибки:

<url>

<lastmod>2021-12-19T16:00:17+04 00</lastmod>

 <priority>0.8</priority>

</url>

Тег <loc> в примере отсутствует, поэтому неясно, к какому URL-адресу принадлежит элемент.

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/build-sitemap

https://www.sitemaps.org/protocol.html

Отсутствующий URL-адрес миниатюры

URL-адрес уменьшенного изображения отсутствует.

Убедитесь, что расположение URL-адресов всех миниатюр указано с помощью тега <video: thumbnail_loc>.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Отсутствующий заголовок видео

Название видео отсутствует.

Убедитесь, что у каждого видео есть заголовок, указанный в теге <video: title> на вашей карте сайта.

Источник:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Неправильный формат индекса карты сайта: вложенные индексы карты сайта

Одна или несколько записей в вашем индексном файле карты сайта указывают на его собственный URL-адрес или URL-адрес другого индексного файла карты сайта.

Никакие другие индексные файлы карты сайта не могут быть указаны в индексном файле карты сайта, только файлы карты сайта.

Удалите все записи, указывающие на индексные файлы карты сайта.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Ошибка синтаксического анализа

Нам не удалось проанализировать XML-файл карты сайта. Скорее всего, файл содержит нарушения в своем формате XML. Вам нужно загрузить файл и проверить его с помощью одного из XML-валидаторов.

Часто эта проблема возникает из-за нарушения вложенности неэкранированного символа в теге URL. Как и во всех XML-файлах, любые значения данных (включая URL-адреса) должны использовать escape-коды сущностей для определенных символов, таких как символы & '"<>.

Убедитесь, что ваши URL-адреса правильно экранированы. Например, символ "&" следует заменить в URL-адресе на "%26", а все пробелы - на "%20".

URL-адреса на карте сайта должны соответствовать:

  • Стандарт RFC-3986 (https://www.ietf.org/rfc/rfc3986.txt)
  • Стандарт XML (https://www.w3.org/TR/REC-xml/)
  • RFC-3987 (https://www.ietf.org/rfc/rfc3987.txt).

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Миниатюра слишком большая

Уменьшенное изображение видео, указанное на карте сайта, слишком велико. Уменьшите размер миниатюры видео до 160 x 120 пикселей.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps?visit_id=637740801105480409-2568149602&rd=1

Миниатюра слишком мала

Уменьшенное изображение видео, указанное на карте сайта, слишком маленькое. Увеличьте размер миниатюры видео до 160 x 120 пикселей.

Источник: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Для получения более подробной информации посетите:

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Местоположение видео и страницы воспроизведения совпадают

На карте сайта видео URL видеоконтента и URL проигрывателя не могут совпадать. Если вы указываете как <video: player_loc>, так и <video: content_loc>, URL-адреса должны быть разными.

Для получения более подробной информации посетите: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

URL-адрес местоположения видео, по-видимому, является URL-адресом страницы воспроизведения

URL-адрес видеоконтента <video: content_loc> указывает на ту же страницу, где находится проигрыватель.

Для получения более подробной информации посетите: https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

https://developers.google.com/search/docs/advanced/sitemaps/video-sitemaps

Тег <changefreq> = никогда

Тег <changefreq> на карте сайта сообщает поисковой системе, как часто следует повторно сканировать эту страницу. Сканеры могут периодически сканировать страницы, помеченные как "никогда", чтобы отслеживать неожиданные изменения на этих страницах. Однако это значение "никогда" не рекомендуется, потому что, если вы внезапно измените содержимое страницы и введете новую дату в теге <lastmod>, неясно, как поведет себя поисковая система, будут ли изменения проиндексированы и сколько времени это может занять.

Карта сайта заблокирована в robots.txt

Поисковые системы не смогут получить доступ к вашей карте сайта, поскольку robots.txt файл блокирует это.

Измените robots.txt файл, позволяющий роботам сканировать карту сайта.

Относительная ссылка

В стандартах на sitemaps.org записываются следующие требования:

URL-адрес страницы. Этот URL-адрес должен начинаться с протокола (например, HTTP) и заканчиваться косой чертой, если этого требует ваш веб-сервер. Это значение должно быть меньше 2048 символов.

Источник: https://www.sitemaps.org/protocol.html#xmlTagDefinitions

Слишком длинный URL-адрес

Длина URL-адреса не может превышать 2048 символов.

Источник: https://www.sitemaps.org/protocol.html#xmlTagDefinitions

Типы предупреждений:

Все страницы внутри одной и той же карты сайта имеют одинаковое время изменения документа

Чтобы поисковые системы работали эффективно, карта сайта должна содержать фактическую дату изменения страницы. Без этого он резко теряет свою эффективность.

Чтобы понять эту проблему, вам нужно знать, как работают поисковые системы. Поисковая система тратит ресурсы на чтение и анализ каждой страницы, увеличивая нагрузку на сервер, на котором размещен сайт. Таким образом, поисковая система рассчитывает так называемый бюджет обхода для каждого сайта. В упрощенном виде это означает, сколько страниц должно быть проиндексировано на конкретном сайте в день.

Пример: Сайт содержит 10 000 страниц, а бюджет обхода составляет 300 страниц в день. Но на короткое время поисковая система может увеличить этот бюджет, например, до 900 страниц в день, если заметит, что все страницы сайта изменились, или вы отправили карту сайта для переиндексации.

Если карты сайта нет, то в обычном режиме бюджет будет выделен на индексацию трех категорий страниц:

  • новые страницы
  • страницы, важные для пользователей
  • страницы, которые долгое время не индексировались.

Таким образом, для сайта с 10 000 страницами (без карты сайта) и со скоростью индексации 300 страниц в день полная индексация может занять более 34 дней. Это связано с тем, что часть бюджета обхода будет потрачена на переиндексацию уже заполненных страниц. Следовательно, тратится впустую бюджет и время обхода.

У поисковой системы есть только два способа узнать, была ли изменена страница: прочитать информацию о странице в карте сайта (не тратя бюджет на поиск) или проиндексировать страницу (и потратить на нее бюджет на поиск). Поэтому, если у вас нет тега с правильной датой обновления страницы, он просто переиндексирует все страницы.

При одинаковом времени изменения документа для всех страниц карты сайта поисковые системы не знают, каким страницам отдать приоритет. Они могут фокусироваться на других элементах, таких как тег приоритета. Однако это гораздо менее точный инструмент для ускорения индексации. Например, у вас может быть 1000 страниц с приоритетом 0,8 и 9000 страниц с приоритетом 0,3. В этом случае изменения на страницах из первой группы могут быть проиндексированы более чем за пять дней, а из второй группы - более чем за месяц. Если вы правильно используете этот тег приоритета рядом с датой изменения документа, изменения в индексации могут произойти в течение дня.

Время смены страницы должно быть указано в формате W3C Datetime (http://www.w3.org/TR/NOTE-datetime).

Стандарт допускает несколько форматов, например: <lastmod>2021-12-23T18:00:15+00:00</ lastmod>

или

<lastmod>2021-11-23</lastmod>.

Карта сайта не содержит тега с датой последнего изменения документа

Чтобы поисковые системы работали эффективно, карта сайта должна содержать фактическую дату изменения страницы. Без этого он резко теряет свою эффективность и становится бесполезным.

Чтобы понять эту проблему, вам нужно знать, как работают поисковые системы. Поисковая система тратит ресурсы на чтение и анализ каждой страницы, увеличивая нагрузку на сервер, на котором размещен сайт. Таким образом, поисковая система рассчитывает так называемый бюджет обхода для каждого сайта. В упрощенном виде это означает, сколько страниц должно быть проиндексировано на конкретном сайте в день.

Пример: Сайт содержит 10 000 страниц, а бюджет обхода составляет 300 страниц в день. Но на короткое время поисковая система может увеличить этот бюджет, например, до 900 страниц в день, если заметит, что все страницы сайта изменились, или вы отправили карту сайта для переиндексации.

Если карты сайта нет, то в обычном режиме бюджет будет выделен на индексацию трех категорий страниц:

  • новые страницы
  • страницы, важные для пользователей
  • страницы, которые долгое время не индексировались

Таким образом, для сайта с 10 000 страницами (без карты сайта) и со скоростью индексации 300 страниц в день полная индексация может занять более 34 дней. Это связано с тем, что часть бюджета обхода будет потрачена на переиндексацию уже заполненных страниц. Следовательно, тратится впустую бюджет и время обхода.

У поисковой системы есть только два способа узнать, была ли изменена страница: прочитать информацию о странице в карте сайта (не тратя бюджет на поиск) или проиндексировать страницу (и потратить на нее бюджет на поиск). Поэтому, если у вас нет тега с правильной датой обновления страницы, он просто переиндексирует все страницы.

Время смены страницы должно быть указано в формате W3C Datetime (http://www.w3.org/TR/NOTE-datetime)

Стандарт допускает несколько форматов, например:

<lastmode>2021-12-23T18:00:15+00:00</ lastmode>

или

lt;lastmode>2021-11-23</последний мод>.

Обратите внимание, что не все форматы файлов sitemap допускают использование даты последнего изменения или тега приоритета. Если ваш сайт не поддерживает этот формат карты сайта, то это может снизить скорость индексации вашего сайта. Возможно, стоит подумать о смене платформы, если это так.

На всей карте сайта нет даты обновления страницы или приоритета обновления страницы.

Дата обновления страницы и приоритет индексации страницы являются двумя наиболее важными атрибутами карты сайта. Тег, содержащий время последнего изменения, позволяет поисковым системам определить, какие страницы были изменены сегодня и должны быть проиндексированы как можно быстрее при наличии достаточного бюджета на поиск. Это лучший атрибут для ускорения индексации.

Атрибут priority позволяет вам сначала проиндексировать наиболее важные страницы, даже среди этих обновленных страниц. Однако, если на карте сайта не указан ни приоритет, ни время последнего изменения документа, сайт столкнется с большими проблемами, когда дело дойдет до индексации.

Поисковые системы тратят ресурсы на чтение и анализ каждой страницы, тем самым увеличивая нагрузку на сервер, на котором размещен сайт. По этой причине поисковая система рассчитывает так называемый бюджет обхода для каждого сайта. По сути, это то, сколько страниц должно быть проиндексировано на конкретном сайте в день.

Пример: Сайт содержит 10 000 страниц, а бюджет обхода составляет 300 страниц в день. Но на короткое время поисковая система может увеличить этот бюджет, например, до 900 страниц в день, если заметит, что все страницы сайта изменились, или вы отправили карту сайта для переиндексации.

Если карты сайта нет, то в обычном режиме бюджет будет выделен на индексацию трех категорий страниц:

  • новые страницы
  • страницы, важные для пользователей
  • страницы, которые долгое время не индексировались

Таким образом, для сайта с 10 000 страницами (без карты сайта) и со скоростью индексации 300 страниц в день полная индексация может занять более 34 дней. Это связано с тем, что часть бюджета обхода будет потрачена на переиндексацию уже заполненных страниц. Следовательно, тратится впустую бюджет и время обхода. Однако, если вы правильно используете теги <lastmod> и <priority>, вы можете увидеть страницы, проиндексированные в течение дня.

Время смены страницы должно быть указано в формате W3C Datetime (http://www.w3.org/TR/NOTE-datetime). Стандарт допускает несколько форматов, например:

<lastmod>2021-12-23T18:00:15+00:00</ lastmod>

или

<lastmod>2021-11-23</lastmod>.

Обратите внимание, что не все форматы файлов sitemap допускают использование даты последнего изменения или тега приоритета. Если ваш сайт не поддерживает этот формат карты сайта, то это может снизить скорость индексации вашего сайта. Возможно, стоит подумать о смене платформы, если это так.

Для страницы не указана частота обновления или приоритет индексации.

Чтобы быть проиндексированным как можно быстрее, лучше всего:

  • Есть информация о последнем обновлении в теге <lastmod>
  • Помечайте страницы с высоким приоритетом тегом <priority>
  • Укажите частоту обновления в теге <changefreq>

Без этих данных поисковая система на крупном сайте может не индексировать изменения на странице более месяца. Страницы без информации о приоритете, но с частыми обновлениями будут проиндексированы в соответствии с базовыми стандартами индексации, что значительно увеличит время индексации потенциально важных страниц.

Ведущий пробел

Ваша карта сайта начинается с пробела, а не с объявления пространства имен. XML-файлы должны начинаться с XML-объявления, в котором указывается версия этого формата, которая будет использоваться.

Это не помешает поисковым системам обработать вашу карту сайта, но Google рекомендует удалять пробелы, чтобы файл соответствовал стандарту XML.

Источник: https://support.google.com/webmasters/answer/7451001 ?hl=en#zippy=%2Ccomplete-error-list

URL-адрес карты сайта перенаправляет на другой URL-адрес

Например, в нем указывается http://example.com/sitemap.xml, но он перенаправляет на https://example.com/sitemap1.xml.

Это не помешает поисковым системам обрабатывать вашу карту сайта, но может привести к проблемам, если перенаправление будет работать некорректно.

Замените URL-адреса перенаправления в ваших файлах карты сайта на те, которые необходимо отсканировать.

Недопустимый формат приоритета URL-адреса

Приоритет индексации может иметь значение от 0.0 до 1.0.

Цифры в значении разделены точкой, а значения меньше единицы должны начинаться с символа "0". Например, вы должны написать: "0.3", а не ".3".

URL-адрес не разрешен

Ваша карта сайта содержит URL-адреса на другом поддомене или домене, отличном от домена карты сайта.

Например, если карта вашего сайта расположена по адресу http://www.example.com/sitemap.xml, тогда следующие URL-адреса будут недействительны для этой карты сайта:

  • http://example.com / - "www" отсутствует.
  • www.example.com / - отсутствует "http"
  • https://www.example.com / - используя "https", а не "http".

В стандарте карты сайта есть специальный раздел, посвященный этой ошибке:

https://www.sitemaps.org/protocol.html#location

"URL-адреса, которые не считаются действительными, исключаются из дальнейшего рассмотрения".

Поэтому даже в описании стандарта настоятельно рекомендуется поместить файл sitemap в корневой каталог сайта.

Для получения более подробной информации посетите:

https://support.google.com/webmasters/answer/7451001?hl=en#zippy=%2Ccomplete-error-list

Все страницы внутри одной и той же карты сайта имеют одинаковый приоритет

Страницы, которые меняются чаще и представляют больший интерес для пользователей, должны быть приоритетными.

Чтобы указать приоритет страницы, вы можете использовать следующий тег (в диапазоне от 0 до 1):

<priority>0.8</priority>.

Пожалуйста, обратите внимание, что не все форматы файлов sitemap поддерживают этот тег.

В первую очередь поисковая система будет ориентироваться на тег времени обновления документа, поскольку это более точное значение. Когда вы указываете точную дату изменения страницы в своей карте сайта, атрибут priority имеет меньший вес. Следовательно, если тег <lastmod> содержит актуальную информацию, наличие того же приоритета страницы не является большой проблемой.

Однако присвоение высокого приоритета всем URL-адресам на сайте также не имеет смысла, поскольку это просто снова делает все страницы равноценными по приоритету.

Например, если поисковая система решит выделить бюджет на обход в размере 30 страниц в день сайту с 1000 страницами, то увеличение приоритета для всех страниц не увеличит скорость, с которой они индексируются. По-прежнему будет индексироваться 30 страниц в день.

Наилучшей практикой является определение приоритетности тех страниц, которые меняются чаще всего и являются более важными для получения трафика от поисковой системы. Затем остальным страницам следует присвоить более низкий приоритет. Это позволит сбалансировать индексацию, гарантируя, что страницы с более высоким приоритетом будут индексироваться быстрее.

Тег <приоритет> особенно важен, когда был обновлен весь сайт, поскольку в этом случае дата последнего изменения одинакова на всех страницах. Затем тег <priority> становится запасным вариантом. Обеспечение правильной настройки с помощью этого тега гарантирует, что наиболее важные страницы будут переиндексированы в первую очередь.