Эксперимент: как Яндекс и Google учитывают ключевые слова в URL

О том, что для эффективного продвижения сайтов нужно использовать ЧПУ, сегодня знает любой SEO-школьник, ведь об этом говорят все тру блоггеры, пишут в книжках и даже рассказывают на SEO-конференциях… Однако стоит капнуть чуть глубже и спросить «откуда уверенность, что поисковые системы учитывают ключевые слова из URL при ранжировании?», в ответ получаешь что-то вроде «если в выдаче URL выделяется жирным, значит поисковик понимает выделенные слова, а следовательно учитывает их при ранжировании»… Чувствуете слабое звено в этом тезисе?

Эксперимент: как Яндекс и Google учитывают ключевые слова в URL

«Понимает» не равно «учитывает»! За примером далеко ходить не надо – meta name keywords. Понимают ли поисковые системы значение этого тега, а так же ключевые слова, которые в нем перечисляются? Бесспорно. Имеет ли влияние этот тег? К сожалению нет. Возможно так же обстоят дела с ключевыми словами в ЧПУ?

Эксперимент

Что бы не гадать на кофейной гуще, я провел небольшой эксперимент. Цель эксперимента – проверить, будет ли сайт искаться по ключевым словам, которые используется в URL, но которых нет на странице.

На новом домене был создан сайт, часть страниц была на латинице (русские слова переведенные на английский, русские слова на транслите, абракадабра на латинице), а часть на кириллице (русские слова написанные кириллицей, абракадабра на кириллице). Не считая главной, получилось 10 страниц:

  • URL из 1 слова — кирилица (/пароль.html)
  • URL из 1 слова — латиница-транслит (/parol.html)
  • URL из 1 слова — латиница-перевод (/password.html)
  • URL из 1 слова — кирилица-абракадабра (/апросывкалом.html)
  • URL из 1 слова — латиница-абракадабра (/afafhqqddsawf.html)
  • URL из 2 слов — кирилица (/онлайн-курс.html)
  • URL из 2 слов — латиница-транслит (/onlajn-kurs.html)
  • URL из 2 слов — латиница-перевод (/online-course.html)
  • URL из 2 слов — латиница-абракадабра (/afafhqqddsawf-fedtoramus.html)
  • URL из 2 слов — кирилица-абракадабра (/апросывкалом-фураситом.html)

Результат эксперимента

После индексакции сайта в Яндексе и Google были получены следующие результаты.

Поиск в Яндексе с ограничением по домену

По слову «пароль»  нашлись все 3 страницы (кирилица, транслит, перевод), на первом месте находися страница с кириллицей, на втором перевод, на третьем транслит:

 

По запросам «онлайн», «курс», «онлайн курс», «курс онлайн» нашлись все 3 соответствующие страницы,  каждый раз последовательность сохранялась одна и та же:

  • Кириллица;
  • Перевод;
  • Транслит.

Если искать не по русскому слову, а по английскому, то Яндекс всё так же находит все 3 документа, но последовательность в этом случае другая, причем зависит от запроса. Например по слову «password» вначале будет перевод, затем кириллица, затем транслит:

А по слову «online» — первой будет кириллица, затем английский и в конце транслит:

Самое веселое, что даже если искать слово на транслите «parol», «onlajn» URL который содержит транслит все равно оказывается самым последним:

В ходе этого эксперимента была выявлена еще одна интересная особенность — даже если Яндекс понимает значение того, или иного слова, он не всегда выделяет  его в URL жирным. Например по запросу «kurs» всё также находятся все 3 документа, но выделения жирным есть только в двух:

Хотя если искать по фразе на транслите «onlajn kurs», то на 3 место опускается перевод, на втором транслит, а на первом по прежнему кириллица:

Поиске в Яндексе без ограничений

К сожалению из-за ограничения в 1000 результатов, я не смог найти сайт в выдаче Яндекса по запросам, о которых писал выше. Однако сайт замечательно ищется по аброкадабрам:

Поиск в Google с ограничением по домену

Выяснилось, что Google не любит  транслит еще больше, чем Яндекс. По запросу  «пароль» в выдаче только кириллица и перевод, причем на первом месте именно перевод:

Такая же ситуация и с запросом  «онлайн»:

 

Хотя, например по запросу «курс» на первом месте идет URL, который содержит ключевое слово на кириллице, а только затем перевод:

Транслит Google все же понимает, но судя по всему относится к нему весьма своеобразно. Например по запросу «parol» в выдаче есть и транслит (на первом месте)  и кириллица (на втором), но нет перевода. Понимая значение слова на транслите, Google предлагает осуществить поиск по слову на кириллице:

При этом Google понимает далеко не все слова, например по запросу «kurs» кириллический URL найден не был:

Выводы

  • Кириллические URL рулят;
  • URL которые содержат перевод тоже рулят, но надо смотреть что бы Яндекс и Google этот самый перевод понимали (но при этом не стоит забывать, что бывают случаи, когда значение слова в URL поисковая система понимает, но жирным ничего не выделяет);
  • URL на транслите худо-бедно работают в Яндексе, но очень хреново работает в Гугле.

Заключение

Напоследок еще одна интересная мысль. В последнее время поисковые системы все больше внимания уделяют естественности анкор листа. Если просто накупить ссылок с прямыми вхождениями, то можно загнать сайт под фильтр. Тру сеошники рекомендуют покупать безанкорные ссылки, но многие продолжают закупаться по старинке, не желая тратиться на разбавку.

К чему я все это? В описанном выше эксперименте наглядно показано, что поисковые системы находят документы по словам, которые есть в URL, но которых нет в тексте. Исходя из этого наблюдения можно предположить, что если на сайт стоит ссылка вида http://site.ru/key.html, то по слову «key» передастся ссылочный вес. Получается, что такие безанкорные ссылки вовсе и не безанкорные, поэтому ими можно не только наращивать мифический «траст», но и продвигать запросы, которые содержатся в URL.

Есть вопросы? Задавайте их в комментариях!

BR-59B278E84FAF-24-11-13-09
Понравилась статья? Поделиться с друзьями:
Комментарии: 24
  1. Ярослав

    Спасибо за статью очень интересная.

  2. wisest

    Большое спасибо, будем внедрять.

  3. Наталия

    Огромное спасибо за отличную статью!! Кое-что для себя отметила полезное. Продолжайте свои эксперименты — у вас хорошо получается :)

  4. Rusfetische

    Кирилические урл не рулят ибо есть запара с их передачей другим людям. Кодировки браузеров не всегда разбираются с ними хорошо. А SEO не должно зацикливаться на себе, но и учитывать вирусный маркетинг в частности.

  5. Torrey

    И что теперь все урлы менять? Из-за этого хуже не будет?

  6. Xstroy

    Последнее утверждение пока не подтверждено экспериментально…

    Выводы эксперимента расстроили. Свои сайты давно наполняю с транслитерацией. Кирилица для продвижения — это жесть(учитывая хитрый набор символов), а с переводом тоже не всё так гладко.

  7. vanya_only

    весьма интересный эксперимент…есть мысли куда это можно еще внедрит :-)

  8. 195531

    Для чистоты эксперимента хорошо бы еще попробовать не чпу и не абракадабры, а линки с ID постов и категорий как в вордпрессе, к примеру

  9. 195531

    В предыдущем комменте неправильный мэйл указал, добавил еще один коммент чтоб за темой следить

  10. Bakalov Igor (автор)

    Torrey, менять урлы или нет — это на ваше усмотрение. Моё дело дать вам пищу для размышления.

    Xstroy, вы про передачу ссылочного веса? Пока у меня нет светлых идей, как можно проверить эту гипотезу, поэтому я специально выделил, что это предположение.

    195531, а в чем смысл использовать линк с ID? Если там нет ключевого слова, то страница точно не найдется.

  11. Олег

    Интересный эксперимент. А то приходится верить на слово «знающим людям». Везде советуют, что сначала транслит, потом перевод, потом кириллица. Оказывается все наоборот.

  12. Lexx

    Олег, все-же, вначале идет контент, а только потом url )
    Я вот тоже либо перевод — либо транслит использую.
    не нравится мне кириллица. особенно, когда вперемешку идет вида:
    site.ru/категория/страница.html
    чисто эстетически не нравится.

  13. FreeThinker

    Эксперимент действительно интересный, и применительно к нему выводы вполне очевидны. Единственное, я не понял, нафига нужны страницы с вообще непонятными абракадабрами? В чем смысл? Ладно, если бы это были ошибки раскладки (например, «пароль», набранный в английской раскладке – «gfhjkm»), а тут…

    В анализе не учтена длина URL (говорю за Яндекс, т.к. Google для меня – тёмный лес). В случае с кириллистическими запросами длина URL’ов идет по убыванию – сначала самый длинный кириллистический (с процентиками), потом аглицкий, потом (самый короткий в обоих случаях) транслит. Факт неочевидный и непонятный, но закономерный, судя по эксперименту.

    Сравнивать однословные переводы считаю некорректным, потому что связки «пароль-password» и «онлайн-online» явно не равнозначны. Все равно, что «music» и «музыка», а с другой стороны – «search» и «поиск». Как бы то ни было, по запросу «online course» выдается «родная» страница, а не кириллица. Делать выводы здесь по переводам, думаю, не вполне корректно и считаю, что использование перевода для продвижения по кириллистическим запросам крайним и очень частным случаем, который крайне не стабилен: сегодня Яндекс понимает перевод слова и подсвечивает его, а завтра считает, что разные языки – разная выдача.

    Но вообще, эксперимент довольно спорный и уже точно не полный. Нужно/можно было добавить в эксперимент:
    * страницы с вхождением в URL куда большего числа слов (4-6). Полагаю, результаты были бы более спорными.
    * страницы с разным уровнем вложенности в URL и вхождением в них запросов. Например, «/обучение/онлайн-курс.html», «/обучение-онлайн-курс.html», «/онлайн-курс/обучение.html» и т.п. Это тоже довольно интересно.
    * страницы с запросами, набранными в неверной раскладке, о чем я написал выше.
    * побольше страниц с разной длиной URL’ов в каждом случае (кириллица, английский, транслит) – выше я описал, в чем загвоздка текущих выводов.

  14. Bakalov Igor (автор)

    @FreeThinker, абракадабры были нужны на случай, если бы страницы с осмысленными URL не находились вообще, так сказать подстраховка на случай полного краха.

    На счет длины URL — согласен, не учитывал, в принципе это тема отдельного исследования.

    В остальном очень справедливые замечания, которые я с удовольствием использую для дальнейших исследований.

  15. Виктор

    За «Заключение» отдельное спс!

  16. Иван

    Супер эксперимент

  17. Игорь

    Смешной эксперимент.

    Сейчас (при поиске внутри домена) поисковики показывают Вам не приоритетность выдачи, а порядок индексации страниц на вашем сайте. Нужно смотреть реальную выдачу в поиске, а не внутри своего сайта.

    Хотя конечные выводы будут схожие с Вашими, при прочих равных, кириллица практически всегда будет «обыгрывать» другие варианты.

  18. Bakalov Igor (автор)

    Игорь, хотите сказать, что сортировка идет не «по релевантности», а «по дате»? Откуда дровишки?

  19. Саша

    Если это так, тогда почему вы сами не используете кириллицу, или перевод?

  20. Иван (SEOpmr)

    2 Саша, потому что геморно переделывать все.

  21. Вячеслав

    Интересная статья, в этой связи вопрос — как закупать ссылки на частично кириллический урл вида site.ru/страница ?
    Не возникнет ли проблем с кодировкой на некоторых сайтах, если я пропишу ссылку так — страница ?

  22. Vlad

    у гугла есть два варианта поиска все результаты и точное соответствие, при точном соответствии он ранжирует страницы по релевантности и учитывает кириллицу в урл, а если в настройках поиска стоят все значения (что включено по умолчанию) то какой запрос не вводи ты ну увидишь кириллических урл, это связано либо с тем что все поголовно используют транслит или с тем что при настройках «все значения» гугл переводит транслит в кириллицу и сравнивает с запросом, вот только это теория как ее проверить я не знаю.

  23. chijkov

    Здравствуйте.Интересное исследованные, но вот вопрос, раз вы теперь знаете что ценнее для ПС кириллические перевод или транслит, то почему вы сами на своих сайтах, в том числе и на это не используете такой прием?

  24. Сергиус

    Классный эксперимент. Когда у вас стоит кирилица, на что оставляется ссылка? на кучу непонятных символов или или на сайт.ru/статьи??
    Если ссылки идут на кучу символов то вы запаритесь с раскруткой сайта.

Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: