Поиск дублей страниц в Яндексе. Удаляем простейшие дубли
Удаляем простейшие дубли Страницы вашего сайта открываются со слешем и без оного на конце адреса. Как проверить:
Меня опять перекидывает на страницу со слешем на конце – всё нормально. Редирект работает. Дубля нет. Если же одна и та же страница открывается с адресом без слеша и со слешем на конце – налицо явный дубль. Для ПС это две разные страницы. То есть одна и та же страница открывается по адресам – Как устранить: Либо сделать всё самим. Для этого нужно прописать в файле .htaccess (открывается блокнотом, находится в корне сайта, обычно в папке public_html) такое правило (для сервера Apache) – RewriteCond %{REQUEST_URI} (.*/[^/.]+)($|\?) RewriteRule.* %1/ [R=301,L] После этого все страницы сайта будут открываться со слешем на конце. То есть если вы введёте адрес http://comp-on.ru/dubli-stranits-poisk-udalenie-dubley Точно таким же образом будут открываться и все остальные страницы сайта. Страницы сайта открываются по адресу с www и без www. Как проверить: Теперь допишите либо уберите www из адреса. Я дописал www, адрес получился такой – http://www.comp-on.ru/ Нажимаем Enter. Меня снова перекидывает на страницу без www – http://comp-on.ru/ Дубля нет. Если у вас страницы открываются с www и без www – это дубль. Нужно исправлять. Как устранить: RewriteEngine On RewriteCond %{HTTP_HOST} ^www.domain.com$ [NC] RewriteRule ^(.*)$ http://domain.com/$1 [R=301,L] Само собой вместо domain.com должен быть адрес вашего сайта. Но это ещё не всё. Желательно перед настройкой этого редиректа добавить оба зеркала сайта (с www и без www) в панели вебмастров Гугла и Яндекса, и указать основной домен там. В инструментах для веб-мастеров Google путь к настройке основного домена такой – «Конфигурация» – «Настройки». Здесь указываем основной домен и сохраняем. В Яндекс вебмастер – «Настройка индексирования» – «Главное зеркало». После того как сайт начнёт индексироваться (если новый), прописываем редирект в.htaccess как описано выше. 3. В индекс попали страницы с «левыми» параметрами в адресах страниц:?page=1, page/1,?replytocom, просто цифрой после адреса и т.п., а так же с приставкой index.php и т.д. Частично это проблемы движка WordPress, но он пытается (не во всех случаях) с ними бороться, добавляя на страницы с такими адресами атрибут rel="canonical", указывающий на основную страницу, которую нужно индексировать с данным контентом. Подробнее о rel="canonical" можно прочитать здесь. Открываем исходный код интересующей нас страницы и ищем в хедере (сверху) – rel="canonical". Если атрибут присутствует и указывает на страницу поста с правильным адресом – уже хорошо. При использовании приставок типа index.php, index.html – прописываем 301 редирект на нужный адрес. Поиск дублей страниц в Яндексе Чтобы проверить наличие дублированных страниц сайта в индексе Яндекса, идём в расширенный поиск Берём одно предложение из давно проиндексированной статьи сайта, заключаем его в кавычки, вставляем в поисковую строку, указываем адрес сайта и жмём «Найти». Не стоит брать предложение из начала статьи, так как в этом случае могут быть показаны страницы с анонсами в рубриках, на главной и т.д. Если находится только одна страница – всё нормально, дублей нет. Если показывается несколько страниц – вот они дубли. Желательно проверить не одну статью таким образом. Удалить дубли из индекса Яндекса можно с помощью этого инструмента.
|