Главная //Блог о SEO //Проверка текстов на уникальность с Advego Plagiatus

Проверка текстов на уникальность с Advego Plagiatus

Это инструкция по быстрой проверке текстов на сайте. Она позволяет выявить, были ли массовые заимствования контента с сайта, а также узнать о возможных дублях контента на поддоменах или резервных копиях сайта.

Работа с Advego Plagiatus

Чтобы проверить уникальность текстов, скачиваем программу Advego Plagiatus и выставляем настройки:

настройки Advego Plagiatus

В настройках программы также можно указать прокси-сервер и ключ от сервиса анти-капчи.

В поле "Игнорировать домены" прописываем адрес сайта, тексты с которого проверяем:

игнорировать домены Адвего

При помощи Компарсера получаем список страниц сайта и поочерёдно проверяем текст с каждой страницы. Копируем в Адвего только фактическую часть статьи/описания без меню или других текстовых блоков страницы.

Для ускорения работы включаем одновременно несколько копий программы:

проверка уникальности в нескольких копиях программы

Результаты проверки

Результаты проверки копируем в Иксель:

результаты проверки уникальности текстов

Действительно ли контент не уникальный?

В наказание за копирование материала статья плагиатора будет ранжироваться ниже в поиске. Но, поскольку и статья-оригинал и дубль будут одновременно присутствовать в результатах, программа покажет, что контент не уникальный. Хотя на самом деле это не так.

оригинал и дубль

На этом примере видно что оригинал находится выше в поиске (а, значит, поисковик, считает проверяемый сайт первоисточником), хотя программа показала уникальность 0%. По всей видимости, сам владелец сайта разместил дубль статьи в соц. сети. Естественно, в этом случае переписывать статью нет необходимости. Но нужно вручную проверить все материалы, показавшие уникальность 0-10%. Для этого следует выборочно копировать фрагменты текстов в поиск. Например, проверять один фрагмент на примерно каждую 1000 символов. Если каждый раз проверяемый сайт оказывается выше, то такую статью считаем уникальной.

При забивании в поиск нужно установить нужный регион и исключить "персонализированность" результатов выдачи (использовать режим "Инкогнито" в браузере, убрать галочки

персонализированные настройки

в настройках поиска Яндекса).

Другие случаи

Другие случаи возникновения не уникального контента:

  • не закрытая от индексации резервная копия сайта в виде поддомена, например, test.site.ru;
  • не закрытая от индексации версия сайта на ресурсе разработчика. То есть, например, компания, делавшая сайт у себя на домене или поддомене, не закрыла его от поисковых роботов;
  • дублирующийся контент на региональных поддоменах вроде saratov.site.com;
  • дублирующийся контент на других сайтах того же заказчика;
  • заимствование конкурентами.