Внутренний дублированный контент: поиск и устранение

95 0

"Мы постоянно индексируем новые страницы, новые тексты, но стараемся пользователям показывать именно оригиналы."

Яндекс, раздел помощи для вебмастеров

Наличие неуникального контента, когда один и тот же материал повторяется на страницах, принадлежащих рассматриваемому ресурсу может приводить к нарушениям в индексации и понижению рейтинга в поисковых системах.

Методы поиска дублированного контента

  1. 1. Это основной автоматический, но платный метод. Позволяет определить повторы фрагментов текста на разных страницах сайта даже в тех случаях, когда страницы не являются полными дублями.

    Запускаем аудит на сервисе https://saitreport.ru/

    Увидеть дубли можно в "Отчётах" — "Контент":

    скрин сервиса saitreport

  2. 2. Если страницы дублируются полностью, то во многих случаях дублируются также и мета-теги, поэтому можно воспользоваться методом поиска дублей мета-тегов.
  3. 3. Доп. информацию можно получить в отчете Компарсера в сравнении страниц, обнаруженных на сайте, и индексах поисковых систем
  4. 4. Если текстов на сайте не очень много, можно вручную поискать небольшие фрагменты через Яндекс или Гугл с ограничением по сайту:

поиск дублированного контента

Некоторые ситуации, когда возникает дублированный контент

  1. 1. Текст написан в категории и дублируется на страницах пагинации. Это "лечится" обычно программистом. Он делает так, чтобы текст присутствовал только на странице категории.
  2. 2. Текст дублируется в результате существования нескольких адресов одной и той же страницы. Например:

    http://k-gayduk.ru/example/
    http://k-gayduk.ru/example/index.html
    http://k-gayduk.ru/example

    Также устраняется программистом.

  3. 3. Текст был вручную скопирован из другого раздела сайта. В этом случае просто можно переписать.

Если нет возможности переписать или удалить повторяющиеся фрагменты

Бывают случаи, когда повторяющиеся фрагменты на страницах сайта нерационально или по другим причинам нельзя переписать или удалить. Тогда, их можно закрыть от индексации при помощи тегов noindex:

<!--noindex-->Закрываемый от индексации текст<!--/noindex-->

Этот метод сработает только в Яндексе https://yandex.ru/support/webmaster/controlling-robot/html.html#noindex.

Тег может по разному обрабатываться визуальными редакторами, поэтому корректность размещения нужно проконтролировать в коде страницы.

В этот тег также заключаем счётчики аналитики, сквозные блоки с метками и т.д.

Комментировать