В феврале 2009 года Google ввел поддержку атрибута rel=»canonical», который был призван помочь вебмастерам разобраться с дублированным контентом. Появилась возможность указать какая именно страница из группы страниц с похожим (или одинаковым) содержанием должна участвовать в поиске. Вслед за Гуглом, в мае 2011 года, поддержку атрибута rel=»canonical» ввел Яндекс.
У вебмастеров появилась отличная возможность убрать из выдачи дублированный контент, однако встал вопрос – если на неканонический URL стояла внешняя ссылка, то будет ли передан «ссылочный вес» канонической странице? Не менее интересен вопрос – имеет ли значение, что появилось раньше – «внешняя ссылка на неканоническую страницу», или «rel=»canonical» с неканонического на канонический URL»? Если почитать хелпы Google и Яндекса, то в них Вы не найдете в них ответа на этот вопрос. Значит нужен эксперимент
Цель эксперимента: выяснить, будет ли передан «вес ссылки» со страницу А на страницу С, в том случае, если страница А ссылается на страницу Б, а на странице Б стоит rel=»canonical», который указывает, что канонической страницей является страница С.
Если со страницы А на страницу С «вес ссылки» передается, то необходимо выяснить имеет ли значение «первоочередность».
Вариант №1. Страница А ссылается на страницу Б и эта ссылка проиндексирована поисковыми системами. Через некоторое время на странице Б устанавливается rel=»canonical», который указывает, что канонической является страница С, что в итоге приводит к исключению страницы Б из индекса.
Вариант №2. На странице Б устанавливается rel=»canonical», который указывает, что канонической является страница С, что приводит к исключению страницы Б из индекса. Через некоторое время после этого со страницы А на страницу Б устанавливается ссылка.
Необходимо выяснить в каком из двух вариантов будет передан «вес ссылки» со страницы А на страницу С. Под «весом ссылки» я понимаю так называемый «анкорный вес», т.е. если страница акцептор ищется по тексту стоящей на нее ссылки, то считаем, что «вес ссылки» передается, если не ищется, то не передается.
Описание эксперимента
На тестовом сайте было создано 4 экспериментальных страницы:
Страница «Альфа 1» является полным дублем страницы «Альфа 2». При создании страницы на странице «Альфа 1» изначально был прописан rel=»canonical», который указывал, что канонической является страница «Альфа 2».
Страница «Бета 1» является полным дублем страницы «Бета 2», но изначально на страницах этой группы атрибут rel=»canonical» отсутствовал.
После того как сайт был проиндексирован в Яндекс и Google, было проверено какие страницы попали в индекс. Как и следовало ожидать страница «Альфа 1» в индекс не попала.
Выдача Яндекса:
Выдача Google. Обратите внимание, на различия заголовков у страниц группы Бета, цифры «1» и «2» отсутствуют в тегах title и по всей видимости Google «взял» их из анкоров ссылок стоящих на главной странице, хотя возможен вариант, что цифры были взяты из URL, хотя на мой взгляд это менее вероятно:
После того как сайт был проиндексерован, на страницу «Альфа 1» и «Бета 1» были поставлены ссылки с уникальными анкорами.
Ссылка на страницу «Альфа 1» в Яндексе. Как видите по ссылке сразу же стала искаться страница «Альфа 2», т.е. атрибут rel=»canonical» передал «вес ссылки»:
Ссылка на страницу «Бета 1» в Яндексе. Тут все ожидаемо, нашлась именно страница «Бета 1»:
В Google ситуация оказалась полностью аналогичной как для ссылки на страницу «Альфа 1»:
Так и для ссылки на страницу «Бета 1»:
После того как ссылки были проиндексированы, на странице «Бета 1» был установлен атрибут rel=»canonical», который указывал, что канонической является страница «Бета 2». После переиндексации сайта в индексе Яндекса осталось только 3 страницы (Главная, «Альфа 2», «Бета 2»):
По анкору ссылки стоящей на страницу «Бета 1» стала искаться страница «Бета 2»:
Со страницей «Альфа 2» естественно ничего не поменялось:
В Google ситуация с переиндексацией страницы «Бета 1» заметна затянулась, пришлось ждать на 3 недели дольше чем в Яндексе (это к слову о быстрой индексации). Как и ожидалось страница «Бета 1» выпала из индекса, в выдаче осталось 3 страницы (Главная, «Альфа 2», «Бета 2»):
Страница «Альфа 2» по прежнему искалась по уникальному слову:
А вот страница «Бета 2» искаться перестала и это, мягко говоря, было неожиданно:
Выводы
- Для Яндекса не имеет значения что появилось раньше — rel=»canonical», или внешняя ссылка – в любом случае «вес ссылки» будет передан с неканонического URL на канонический.
- Для Google имеет значение что появилось раньше раньше — rel=»canonical», или внешняя ссылка.
- Если изначально со страницы А на страницу Б стоял rel=»canonical» и страница А была исключена из поиска как неканоническая, то в случае если на страницу А появится внешняя ссылка, то ее «вес» будет передан на страницу Б.
- Если же изначально на страницу А вели внешние ссылки и Вы решили поставить со страницы А на страницу Б rel=»canonical», то в этом случае «вес ссылок» не будет передан на страницу Б.
Да, но…
- Я понимаю, что данный эксперимент не до конца является «чистым», поэтому с радостью выслушаю конструктивную критику.
- Я понимаю, что если страница не ищется по тексту внешней ссылки, то это не обязательно означает, что ссылка не учитывается. Тем не менее, это самый простой из возможных вариантов определения «работоспособности» ссылки.
- Я понимаю, что «анкорный» и «статический» вес ссылки – это разные вещи, но определить влияние статического веса в данном случае не представляется возможным (если Вы подскажите как это можно сделать, то респект Вам и уважуха).
- Не исключено, что спустя некоторое время страница «Бета 2» будет искаться по тексту ссылки и в Google. Если это произойдет, то очень хорошо, заодно можно будет определить временной лаг.
Вот как то так. Вопросы?
P.S. Забыл указать, начало эксперимента: 22.02.2013, окончание: 22.04.2013.
Шикарен!
Большинство только бесполезную херню пишут, а ты полезную инфу выдал, пусть и не самую важную, но работа проделана.
По поводу проставленных ссылок — сколько их было и откуда они были? Может в этом проблема в выводах по Гуглу, тем-более что Гугл сейчас стал относится к ссылкам довольно «выборочно»
Очень полезная информация, спасибо за исследование
Отличный эксперимент. Вот вам и Google, который первый ввел этот атрибут. Ну Вы если что пишите, может все-таки вес «перетечет» и в Google. Может глюк какой-то.
Сейчас уже страница Бета 2 отлично ищется по запросу «эксптрибета». Нужен апдейт поста
Вот не понимаю иногда, почему Гугл так чудит. Как можно было выкинуть из индекса обе ссылки Бета если указано что Бета 2 каноническая? куда он ее дел? 0_о
Сначала понаделывает кучу дублей а потом ломай голову как это исправить, даже если явно ему указал как нужно индексировать твой сайт.
Хорошо хоть вернул страницу в индекс…спустя месяц) Но считайте что если у вас интернет-магазин и ваш товар не могут найти по запросу, то это удар по прибыли магазина.
Спасибо за эксперимент.