Canonical URL — это специальная метка, которая указывает Google "основную" версию страницы среди нескольких похожих, и она была совместно введена компаниями Google, Yahoo и Microsoft в 2009 году. В современном интернете один и тот же контент почти всегда доступен по нескольким адресам — например через http и https, с www и без, с параметрами фильтрации и без них. Если поисковая система воспринимает эти варианты как отдельные страницы, то ссылочный вес распределяется между ними и общее ранжирование снижается.
Проблема дублированного контента
Google официально не накладывает штраф за дублированный контент, однако на практике страницы с одинаковым содержимым конкурируют друг с другом за позиции в выдаче. Поисковая система самостоятельно выбирает какую версию показать пользователю, и часто это оказывается не та страница, которую вы хотели бы продвигать. В результате внешние ссылки рассеиваются по нескольким URL, и ни одна из версий не накапливает достаточного авторитета для топовых позиций.
Как правильно прописать rel=canonical
Тег canonical размещается в секции head HTML-документа и указывает на предпочтительный адрес страницы. Главное правило заключается в том, что каждая страница должна иметь self-referencing canonical, то есть указывать сама на себя. Такой подход явно сообщает Google правильный адрес и объединяет все варианты с параметрами с основной версией страницы.
Self-referencing и cross-domain canonical
Self-referencing canonical является самым распространённым сценарием и рекомендуется к использованию на каждой странице вашего сайта. Cross-domain canonical указывает на страницу другого домена и применяется при синдикации контента. Например, если ваша статья перепечатывается в другом издании, то это издание может через canonical сослаться на оригинальный источник, передавая вес исходной публикации.
E-commerce и URL с параметрами
В интернет-магазинах страницы категорий из-за фильтров, сортировки и пагинации разрастаются до сотен вариантов. Параметры вроде ?color=red, ?sort=price или ?page=2 формируют разные URL для одного и того же набора товаров. В таких случаях canonical всех вариантов с фильтрами должен указывать на чистый адрес категории без параметров. UTM-метки и идентификаторы сессий обрабатываются точно таким же образом, чтобы маркетинговые ссылки не создавали дубли.
www, https и завершающий слэш
Один и тот же сайт может открываться в четырёх версиях: http://sayt.uz, http://www.sayt.uz, https://sayt.uz и https://www.sayt.uz. Google потенциально может воспринять каждый из этих адресов как отдельную страницу со своими позициями. Правильное решение — выбрать одну каноническую версию, настроить 301 редирект с остальных и через canonical явно указать выбранный вариант. Аналогично решается вопрос с завершающим слэшем в конце URL.
Типичные ошибки и проверка
При настройке canonical чаще всего встречаются такие ошибки как ссылка на несуществующую страницу 404, создание цепочки редиректов, указание одного URL на всех страницах сайта и одновременное использование с тегом noindex. В Google Search Console в отчёте "Pages" для каждой страницы указывается canonical, который выбрал сам Google, и он должен совпадать с тем, что задали вы. Редирект 301 применяется когда контент полностью переезжает на новый адрес, а canonical — когда обе версии URL должны оставаться доступными для пользователя.