Поисковые системы очень негативно относятся к дублированию контента на сайтах в интернете и постоянно борются с этой проблемой. Уникальность контента - основная его ценность, и за копии можно легко попасть под санкции. Чтобы этого избежать, можно использовать несколько методов борьбы с дублями страниц. В этой статье разберем один из них - канонические URL.
Существует несколько причин образования дублей, например, CMS могут создавать дополнительные копии, где страница доступна по адресу с www и без. Особенно часто копии возникают в интернет-магазинах, где карточки товара отличаются только фотографией.
Канонический URL – это предпочитаемый адрес, то есть, именно эту версию страницы (с точки зрения поисковика - это дубли) будет индексировать робот из группы схожих.
Канонический URL в борьбе с дублями.
Допустим, есть несколько адресов, ведущих на одну и ту же страницу:
mysite.ru/main
mysite.ru/blog/2364
mysite.ru/blog/page?id=2364
Если мы хотим индексировать только одну страницу из них, необходимо использовать атрибут rel=canonical
.
Например, если основной является страница - mysite.ru/main
, тогда в коде двух других появится строчка:
<link rel="canonical" href="http:// mysite.ru/main "/>
Стоит отметить, что поисковые системы не гарантируют стопроцентного следования данному правилу. Однако, если вы не укажете в качестве канонической страницу, то ПС может сделать это сама. В этом случае вы потеряете контроль над индексацией, так как поисковый робот выберет страницу рандомно и занесет в индекс.
Злоупотреблять атрибутом rel=canonical
также не стоит. Встречались сайты, которые теряли позиции в результатах поиска после того, как разработчики ошибочно записывали в тег rel=canonical
всех страниц сайта одинаковый url.
rel=canonical
для указания на нее с других страниц – дублей. Важно прописывать абсолютные пути: http:// mysite.ru/blog/page?id=2364
, а не /blog/page?id=2364
.Sitemap.xml (карта сайта)
. Это не гарантирует правильную индексацию, но поможет поисковому роботу определить, какие страницы нужно считать основными.Различие в принципе их действия. Атрибут rel=canonical
показывает поисковой системе, какую страницу нужно индексировать и отображать в поиске. Остальные страницы не ранжируются, но на сайте пользователю видны. При использовании 301-редирект, вас автоматически перенаправляют на основную. Если рассматривать с позиции передачи веса, то оба варианта будут передавать определенную часть веса канонической странице.
Одновременное использование rel=canonical
и 301-редирект может оказаться плохой идеей. Мы говорим о тех случаях, когда вы указываете на url, как на канонический, перенаправляя с нее, в свою очередь, на другую 301-редиректом. Скорее всего, поисковый робот посчитает это ошибкой. Возможно, передаваемый вес потеряется внутри этой цепи, что приведет к потере позиций в выдаче. Лучше не соединять канонические ссылки в цепь, а использовать только в пределах одного шага до основной страницы.
robots.txt
.Sitemap.xml
и в rel=canonical
совпадали.Яндекс и Google не считает использование канонических URL обязательным правилом. Но если у вас есть дублированный контент, лучше решить эту проблему самостоятельно. Иначе поисковая система сделает выбор по-своему и выберет основной другую страницу, а нужную вам может просто удалить из индекса.