Duplicate content (дублированный контент) — наличие одинакового или очень похожего контента по нескольким URL. Google не знает, какую версию показывать, сила делится, позиции падают. Часто возникает неосознанно.
Как возникает?
1) www и без www: sayt.uz и www.sayt.uz — два разных URL. 2) HTTP и HTTPS версии. 3) Слеш в конце или нет: /blog и /blog/. 4) Параметры URL: ?sort=price, ?utm_source=... 5) Версия для печати. 6) Один товар в нескольких категориях.
Canonical tag — главное решение
На каждой странице укажите "основную" версию: <link rel="canonical" href="https://sayt.uz/blog/post">. Google направит остальные копии на эту основную версию и объединит силу. Один из важнейших элементов технического SEO.
301 redirect
Версию без www постоянно перенаправляйте на www (или наоборот). HTTP на HTTPS. Через .htaccess или конфиг Nginx.
Параметры URL
Фильтры и сортировка (?sort, ?filter) создают много дублей. Решение: canonical на основную страницу, либо настройки параметров в GSC, либо noindex на страницах с параметрами.
Многоязычный сайт — hreflang
Узбекская, русская, английская версии — это НЕ дубль, если правильно использовать hreflang. <link rel="alternate" hreflang="ru" href="..."> объясняет Google: "это языковые версии одного контента".
Внешний дубль
Если другой сайт копирует ваш контент — Google обычно поднимает оригинал (первый проиндексированный, авторитетный). Но на новом сайте есть риск. Быстро индексируйте контент через GSC — будьте первыми.
Внутренний дубль — самый частый
Одинаковые описания товаров (копирование текста производителя), похожие страницы категорий. Пишите уникальный текст для каждой страницы.
Инструменты проверки
1) "site:sayt.uz" в Google — сколько страниц проиндексировано. 2) Copyscape — внешние копии. 3) Siteliner — внутренние дубли. 4) Отчёт "Pages" в GSC.
Опыт Сайт.uz
На Сайт.uz есть canonical tag на каждой странице, redirect www → основной домен, обязательный HTTPS. Блог-посты на 4 языках правильно размечены hreflang.