27 декабря 20244 мин307
Поделиться

Robots.txt — это текстовый файл, который помогает поисковым системам понять, какие страницы вашего сайта стоит индексировать, а какие нет. Для сайтов правильная настройка файла robots.txt особенно важна, так как большинство популярных CMS генерирует множество служебных страниц, которые могут помешать SEO, если их оставить открытыми.
Почему важно настроить robots.txt?
- Контроль индексации: Вы можете запретить поисковым системам индексировать ненужные страницы (например, служебные разделы, архивы авторов).
- Улучшение SEO: Указание важной информации, например, о sitemap.xml, ускоряет индексацию.
- Снижение нагрузки: Запрет ненужных страниц экономит ресурсы вашего сайта.
Классический файл robots.txt для WordPress
Классический файл robots.txt представляет собой минималистичный вариант, который закрывает от индексации только системные папки, не вдаваясь в детали. Пример:User-agent: * Disallow: /wp-admin/ Disallow: /wp-includes/ Sitemap: https://example.com/sitemap.xmlЧто делает этот файл:
- Закрывает папку /wp-admin/ — административная часть сайта, которая не должна быть видна поисковикам.
- Закрывает папку /wp-includes/ — системные файлы WordPress.
- Указывает путь к файлу sitemap.xml для удобной индексации.
Оптимизированный пример файла robots.txt
Вот пример файла, который подходит для большинства WordPress-сайтов. Однако важно помнить, что каждый проект уникален, и файл robots.txt должен быть настроен под конкретные задачи.User-agent: * # Закрываем системные папки Disallow: /wp-admin/ Disallow: /wp-includes/ Disallow: /wp-content/plugins/ Disallow: /wp-content/cache/ Disallow: /xmlrpc.php Disallow: /? Disallow: /search/ Disallow: /author/ Disallow: /tag/ Disallow: /category/page/ Disallow: /*?* Disallow: /*?s=* # Разрешаем индексацию всех изображений и ресурсов Allow: /*.js$ Allow: /*.css$ Allow: /*.jpg$ Allow: /*.jpeg$ Allow: /*.png$ Allow: /*.gif$ Allow: /*.webp$ Allow: /*.svg$ # Указываем путь к sitemap.xml Sitemap: https://example.com/sitemap.xml
Почему это пример, а не универсальное решение?
Каждый сайт уникален, и требования к файлу robots.txt зависят от:- Целей проекта. Например, интернет-магазину важно оставлять страницы категорий для индексации, а блогам может потребоваться закрыть архивы.
- Структуры сайта. На некоторых сайтах есть уникальные папки или страницы, которые нужно закрыть или открыть для индексации.
- Потребностей SEO. В зависимости от стратегии SEO, настройка файла может отличаться.
Где находится и как найти robots.txt в WordPress
Файл robots.txt находится в корневой директории вашего сайта. Если вы используете Yoast SEO, плагин может создавать виртуальный файл robots.txt, который конфликтует с физическим файлом на сервере. В этом случае предпочтение отдаётся физическому файлу. Чтобы избежать путаницы, удалите физический файл или отключите настройку через плагин. Проверить активный файл можно, открыв https://example.com/robots.txt в браузере.Рекомендации по индивидуальной настройке
- Проанализируйте сайт: Проверьте, какие страницы важны для индексации, а какие следует закрыть.
- Проверьте наличие дубликатов: Например, архивы тегов и авторов часто создают дублированный контент, который можно закрыть через robots.txt.
- Убедитесь в доступности ключевых ресурсов: Поисковики должны видеть CSS, JS и изображения для корректного рендеринга страниц.
- Используйте инструменты анализа: Google Search Console: проверьте, как поисковик видит ваш сайт. Яндекс.Вебмастер: проверьте, правильно ли настроены запреты и разрешения.
Как создать или отредактировать файл robots.txt?
Через плагин WordPress (например, Yoast SEO)- Зайдите в админку WordPress.
- Откройте раздел «SEO → Инструменты».
- Выберите «Редактор файлов» и настройте файл robots.txt через интерфейс.
- Подключитесь к серверу через FTP или файловый менеджер хостинга.
- Найдите корневую директорию сайта (/public_html/).
- Создайте файл с именем robots.txt или отредактируйте существующий. Файл должен быть сохранён в кодировке UTF-8 без BOM (Byte Order Mark). Это стандартная кодировка для большинства веб-документов, которая поддерживается всеми поисковыми системами.
Поделиться