Неправильная настройка robots.txt в WordPress приводит к тому, что до 30% краулингового бюджета тратится на индексацию системных страниц и дублей, замедляя рост позиций новых статей на 2-4 недели. Этот файл — не формальность, а инструмент управления приоритетами поискового робота.
Критический минимум: что закрывать обязательно
Стандартный WordPress генерирует массу технических страниц, которые не несут ценности для пользователя. Обязательно закрывайте /wp-admin/ и /wp-includes/, но помните: закрытие /wp-content/ может заблокировать CSS и JS, что приведет к ошибкам рендеринга в Google Search Console и падению конверсии на 5-10% из-за «кривой» верстки в глазах бота.
Кейс: на одном из e-commerce проектов на WP из-за запрета /wp-content/plugins/ выпали из индекса критические скрипты фильтрации, что снизило видимость категорий по низкочастотным запросам на 15% за месяц. Мой подход: закрывать только конкретные папки админки, оставляя ресурсы для рендеринга открытыми.
Вывод: используйте точечный Disallow вместо радикальных запретов всей папки content.
Борьба с дублями: теги, категории и архивы
Дублирование контента через страницы тегов (/tag/) и архивы авторов (/author/) размывает ссылочный вес. В среднем, на сайтах с активным блогом такие страницы составляют до 40% от общего числа URL в индексе, не принося при этом целевого трафика. Если у вас один автор, страница автора — это 100% дубль главной или раздела блога.
Пример: для информационного портала с 500+ статьями закрытие /tag/ и /author/ сократило количество проиндексированных страниц на 1200 единиц, что ускорило переобход основных статей с 7 дней до 3.
Вывод: закрывайте теги и архивы через robots.txt, если не выстраиваете под них отдельную семантическую стратегию.
Sitemap и Crawl-budget: технический баланс
Директива Sitemap в robots.txt должна указывать на сжатый XML-файл. Ошибка многих — указывать на стандартный sitemap.xml, который в тяжелых плагинах (типа Yoast или RankMath) может раздуваться до нескольких мегабайт, увеличивая время отклика сервера. Оптимальный размер одного файла карты сайта — до 50 000 URL или 50 МБ.
Практика показывает, что четкое указание пути к Sitemap сокращает время обнаружения новых страниц на 12-24 часа. В связке со стоимоностью контентного продвижения WordPress, где каждая статья должна начать работать максимально быстро, это критический параметр.
Вывод: всегда проверяйте доступность Sitemap через прямой URL и прописывайте его первой строкой файла.
Ошибки плагинов и виртуальный robots.txt
WordPress по умолчанию создает виртуальный robots.txt, который меняется при смене настроек в консоли (Настройки -> Чтение). Это ловушка: любые правки там ограничены. Профессиональный подход — создание физического файла robots.txt в корне сайта через FTP/SFTP. Это дает 100% контроль и исключает конфликты при обновлении ядра или SEO-плагинов.
Риск: использование плагинов для «быстрого редактирования» часто приводит к дублированию директив, что сбивает роботов Яндекс и Google. В моем опыте, физический файл работает стабильнее и позволяет внедрять специфические правила для разных ботов (например, отдельные запреты для Yandex и Google).
Вывод: удаляйте виртуальный файл и переходите на физический .txt для полного контроля над индексацией.
Вывод
Идеальный robots.txt для WordPress — это минималистичный файл, который открывает все ресурсы для рендеринга (CSS/JS), закрывает системный мусор (/wp-admin/, /wp-json/) и отсекает дубли (теги, авторы). Начните с создания физического файла в корне сайта, пропишите путь к Sitemap и закройте /tag/. Избегайте директивы Disall: /, если не уверены в настройках noindex на уровне страниц, иначе вы полностью вылетите из поиска за 48 часов.