Важность: высокая
Описание ошибки «Дубликаты текста»
Показывает дубликаты индексируемых страниц по текстовому содержимому блока <body>. В этом отчёте все URL сгруппированы по параметру «Хеш текста».
Важность проблемы
Поисковые системы могут посчитать дубликатами страницы, у которых дублируется текст в блоке <body>, даже если содержимое блока <head> (например, <title>, <meta name='description'>) у них отличается.
Поисковым системам сложно определить, какой адрес среди дубликатов добавить в свою базу и показывать в поиске. В итоге на более высокой позиции в выдаче могут оказаться неважные для продвижения адреса страниц. Это может привести к низким позициям важных страниц в результатах поиска, потере трафика и даже удалению этих страниц из поиска.
Большие сайты могут особенно пострадать от дубликатов: у поисковых роботов может не хватить ресурсов сканирования на целевые страницы, так как они были потрачены на неприоритетные. В итоге многие целевые страницы могут не попасть в поисковую базу, и сайт потеряет трафик. А если дубликатов страниц особенно много, поисковые системы могут понизить позиции всего сайта (например, так работает алгоритм Google Panda).
Пути исправления ошибки
Необходимо сделать контент важных для продвижения страниц уникальным. А для неважных страниц настроить 301 редирект на основной URL (рекомендуется) или удалить их (настроить 404 или 410 код ответа). При этом важно помнить, что на сайте не должно быть ссылок на редиректы и недоступные страницы.
Если не получается исключить дубликаты адресов предыдущими способами, или эти URL нужны на сайте (например, адреса с метками для веб-аналитики), укажите для них основной URL с помощью тега <link rel="canonical" /> или HTTP-заголовка «Link: rel="canonical"».
Проверить качество оптимизации страницы можно с помощью бесплатного браузерного расширения SiteAnalyzer SEO Tools.
|