Главная / SEO аудит / Поиск плагиата на посадочных

Поиск плагиата на посадочных

Плагиат - это умышленное и незаконное использование физическим или юридическим лицом не принадлежащих ему продуктов интеллектуальной собственности. В SEO чаще всего под риск быть "украденными" попадают изображения и тексты. Также известны случаи, когда воровали целые сайты вместе с дизайном и содержимым. В данной инструкции речь идет о текстовом плагиате.

Как плагиат влияет на ранжирование?

Наличие на сайте фрагментов текста и целых статей, ранее опубликованных на других ресурсах, негативно влияет на продвижение. И даже не по причине незаконности плагиата с правовой точки зрения, а потому, что поисковые системы стремятся предоставить в результатах выдачи полезный и уникальный контент. Яндекс и Google понижают в результатах выдачи позиции ресурсов, содержащих скопированную с других сайтов информацию, и могут совсем удалить их из поискового индекса. К пессимизации может привести не только использование чужих материалов, но также копирование собственного контента и размещение его на других своих сайтах.

В каких случаях можно использовать неуникальную информацию?

Есть исключение и из этого правила. Например, неуникальное содержание может быть в описании товаров на коммерческих сайтах. Объяснить это очень просто. Технические параметры у какого-либо товара неизменны и четко регламентированы производителем, соответственно, на всех интернет-ресурсах будет указана одна и та же информация о них, размещены одинаковые фотографии. Поисковик понимает это и не наказывает за использование неуникальных характеристик и изображений товаров. То же касается художественных произведений или, например, цитат известных людей - поисковик не уберёт из выдачи все сайты кроме одного - он покажет их в соответствии с факторами ранжирования. При этом ресурсы, содержащие уникальный контент, получат преимущество и займут более высокие позиции в результатах поиска.

Как обезопасить себя от кражи или рерайта текстов?

В статье «Оригинальные тексты» сервис Яндекс.Помощь для вебмастеров дает рекомендации по защите материалов сайта от плагиата. В частности, предлагается добавлять новый оригинальный текст в специальную форму на Яндекс Вебмастере.

 

Это не даёт 100% защиты, но, по-видимому, как-то учитывается поисковой системой. В 2015-2017 годах было несколько кейсов, когда даже добавленные в указанную форму тексты понижались в рейтинге при копировании их на других сайтах. После 2018 года мы не встречали такого понижения - возможно, Яндекс изменил свой алгоритм.

Как найти плагиат на своем сайте?

Искать тексты с плагиатом вручную сложно и долго, особенно на большом web-портале или на сайте интернет-магазина. Labrika при запуске анализа сайта автоматически определяет неуникальный контент и показывает соответствующие данные в отдельном отчете. Находится он в в разделе "SEO-аудит"→ "Поиск плагиата на посадочных".

Содержание отчёта:

  1. Страница вашего сайта, на которой обнаружен неуникальный контент.
  2. Страница другого web-ресурса в интернете, на котором размещена похожая информация.
  3. Процент совпадения текстовой информации на страницах. Чем выше этот процент, тем больше вероятность попасть под санкции от поисковых систем.

Как бороться с плагиатом у себя на сайте?

Даже добропорядочный SEO-специалист или владелец сайта может обнаружить на своём сайте неоригинальный текст.

Варианты борьбы с плагиатом, если вы - пострадавшая сторона:

  1. Если текст находится на вашем сайте давно, и нет времени разбираться с кражей контента, то проще переписать текст частично или полностью. 100% уникальности не требуется - достаточно 80%.
  2. Разбираться в правовом поле. Начать можно со звонка владельцу сайта-нарушителя. В большинстве случаев такого звонка бывает достаточно, чтобы плагиатор удалил со своего ресурса украденный контент. Если это не помогает, то пишется претензия по всем юридическим правилам. После получения уведомления, если ответа не последовало, необходимо обращаться к адвокату. Если адрес владельца сайта неизвестен, то необходимо сразу обратиться к адвокату, чтобы он получил адрес через адвокатский запрос. На решение проблемы через адвоката может уйти несколько месяцев.

В любом случае, необходимо вычислить весь плагиат на вашем ресурсе и заменить его качественной уникальной информацией.

Вопросы-ответы

Мы проверяли тот же текст в специализированном сервисе, и там процент уникальности был меньше, чем в Лабрике. Почему?

Такие сервисы специально разработаны для поиска малейших совпадений, чтобы проверить, например, уникальность студенческого реферата или журналистской статьи. Они определяют текст как неуникальный, даже если сходные с ним фрагменты небольших размеров обнаружены на нескольких разных сайтах.

Алгоритм Лабрики предназначен для SEO и близок к принципу работы поисковых систем.

Во-первых, текст, составленный из материала, собранного из разных источников, может считаться отдельным произведением — например, статьи со сводками различных данных.

Во-вторых, поисковые системы не могут тратить большое количество времени на детальное сравнение каждой страницы с сотнями миллиардов других страниц - они используют очень быстрый алгоритм сравнения, который срабатывает только на плагиат значительного фрагмента текста, который совпадает, например, на 90% с содержимым другого сайта.

Кроме того, алгоритм работает так, что плагиат может быть обнаружен не сразу, а через некоторое время - возможно, через несколько иттераций (повторений) индексации.

Какая еще есть польза от этого отчёта?

С его помощью оптимизаторы много раз находили аффилированные и старые сайты, о которых им не рассказывал владелец продвигаемого ресурса, а также тестовые версии того же самого сайта на субдоменах разработчиков.