Как правильно настроить robots.txt

Новички, размещайте в этом форуме свои вопросы и получайте рекомендации по SEO продвижению сайта, юзабилити сайта, дизайну. Обсуждаем внутреннюю и внешнюю оптимизацию, поисковые системы, SEO инструменты и сервисы.
Ответить
justmary
Сообщения: 111
Зарегистрирован: 23 июл 2017, 19:04
Благодарил (а): 2 раза
Поблагодарили: 1 раз

Как правильно настроить robots.txt"

Сообщение justmary » 28 сен 2017, 12:08

Здравствуйте! У меня вопрос. Как правильно настроить robots.txt? Я хочу открыть сайт для индексации. Сайт на Битриксе. Можно ли взять с интернета готовый robots.txt или нужно самой вручную прописывать?

Аватара пользователя
Вадим Костин
Сообщения: 211
Зарегистрирован: 28 янв 2017, 18:01
Благодарил (а): 5 раз
Поблагодарили: 7 раз

Re: Как правильно настроить robots.txt"

Сообщение Вадим Костин » 28 сен 2017, 22:02

Здравствуте) Да, можно взять и готовый robots.txt в интернете. Например здесь http://endseo.ru/2017/04/19/robots-1c-bitrix/

Обязательно укажите в директиве Host адрес по которому сайт должен индексироваться, а также укажите путь к карте сайта в директиве sitemap.xml

После того как robots.txt разместите на сервере, обязательно проверьте через валидатор яндекс вебмастера не запретили ли к индексации важные страницы (например категории, карточки товаров, страницы брендов).
После легкой регистрации у Вас появится возможность комментировать и создавать свои темы ;) Регистрация занимает меньше 1 минуты ;)




justmary
Сообщения: 111
Зарегистрирован: 23 июл 2017, 19:04
Благодарил (а): 2 раза
Поблагодарили: 1 раз

Re: Как правильно настроить robots.txt"

Сообщение justmary » 02 окт 2017, 11:56

У меня не получается добавить сайт в поиск. Не считывает мета-тег и не считывает файл скачанный(пишет, что роботс не пропускает). Скидываю свой роботс. Где может быть ошибка?

User-Agent: *
Host: https://nalog.center
Disallow: /
Disallow: */index.php
Disallow: /bitrix/
Disallow: /*show_include_exec_time=
Disallow: /*show_page_exec_time=
Disallow: /*show_sql_stat=
Disallow: /*bitrix_include_areas=
Disallow: /*clear_cache=
Disallow: /*clear_cache_session=
Disallow: /*ADD_TO_COMPARE_LIST
Disallow: /*ORDER_BY
Disallow: /*PAGEN
Disallow: /*?print=
Disallow: /*&print=
Disallow: /*print_course=
Disallow: /*?action=
Disallow: /*&action=
Disallow: /*register=
Disallow: /*forgot_password=
Disallow: /*change_password=
Disallow: /*login=
Disallow: /*logout=
Disallow: /*auth=
Disallow: /*backurl=
Disallow: /*back_url=
Disallow: /*BACKURL=
Disallow: /*BACK_URL=
Disallow: /*back_url_admin=
Disallow: /*?utm_source=
Disallow: /*?bxajaxid=
Disallow: /*&bxajaxid=
Disallow: /auth
Disallow: /include
Disallow: /personal
Allow: /bitrix/components/
Allow: /bitrix/cache/
Allow: /bitrix/js/
Allow: /bitrix/templates/
Allow: /bitrix/panel/
Sitemap: https://nalog.center/sitemap.xml

Аватара пользователя
Вадим Костин
Сообщения: 211
Зарегистрирован: 28 янв 2017, 18:01
Благодарил (а): 5 раз
Поблагодарили: 7 раз

Re: Как правильно настроить robots.txt"

Сообщение Вадим Костин » 02 окт 2017, 12:52

justmary писал(а):
02 окт 2017, 11:56
У меня не получается добавить сайт в поиск.
Вот так попробуйте:

User-Agent: *
Disallow: */index.php
Disallow: /bitrix/
Disallow: /*show_include_exec_time=
Disallow: /*show_page_exec_time=
Disallow: /*show_sql_stat=
Disallow: /*bitrix_include_areas=
Disallow: /*clear_cache=
Disallow: /*clear_cache_session=
Disallow: /*ADD_TO_COMPARE_LIST
Disallow: /*ORDER_BY
Disallow: /*PAGEN
Disallow: /*?print=
Disallow: /*&print=
Disallow: /*print_course=
Disallow: /*?action=
Disallow: /*&action=
Disallow: /*register=
Disallow: /*forgot_password=
Disallow: /*change_password=
Disallow: /*login=
Disallow: /*logout=
Disallow: /*auth=
Disallow: /*backurl=
Disallow: /*back_url=
Disallow: /*BACKURL=
Disallow: /*BACK_URL=
Disallow: /*back_url_admin=
Disallow: /*?utm_source=
Disallow: /*?bxajaxid=
Disallow: /*&bxajaxid=
Disallow: /auth
Disallow: /include
Disallow: /personal
Allow: /bitrix/components/
Allow: /bitrix/cache/
Allow: /bitrix/js/
Allow: /bitrix/templates/
Allow: /bitrix/panel/


User-Agent: Yandex
Disallow: */index.php
Disallow: /bitrix/
Disallow: /*show_include_exec_time=
Disallow: /*show_page_exec_time=
Disallow: /*show_sql_stat=
Disallow: /*bitrix_include_areas=
Disallow: /*clear_cache=
Disallow: /*clear_cache_session=
Disallow: /*ADD_TO_COMPARE_LIST
Disallow: /*ORDER_BY
Disallow: /*PAGEN
Disallow: /*?print=
Disallow: /*&print=
Disallow: /*print_course=
Disallow: /*?action=
Disallow: /*&action=
Disallow: /*register=
Disallow: /*forgot_password=
Disallow: /*change_password=
Disallow: /*login=
Disallow: /*logout=
Disallow: /*auth=
Disallow: /*backurl=
Disallow: /*back_url=
Disallow: /*BACKURL=
Disallow: /*BACK_URL=
Disallow: /*back_url_admin=
Disallow: /*?utm_source=
Disallow: /*?bxajaxid=
Disallow: /*&bxajaxid=
Disallow: /auth
Disallow: /include
Disallow: /personal
Allow: /bitrix/components/
Allow: /bitrix/cache/
Allow: /bitrix/js/
Allow: /bitrix/templates/
Allow: /bitrix/panel/

User-Agent: Googlebot
Disallow: */index.php
Disallow: /bitrix/
Disallow: /*show_include_exec_time=
Disallow: /*show_page_exec_time=
Disallow: /*show_sql_stat=
Disallow: /*bitrix_include_areas=
Disallow: /*clear_cache=
Disallow: /*clear_cache_session=
Disallow: /*ADD_TO_COMPARE_LIST
Disallow: /*ORDER_BY
Disallow: /*PAGEN
Disallow: /*?print=
Disallow: /*&print=
Disallow: /*print_course=
Disallow: /*?action=
Disallow: /*&action=
Disallow: /*register=
Disallow: /*forgot_password=
Disallow: /*change_password=
Disallow: /*login=
Disallow: /*logout=
Disallow: /*auth=
Disallow: /*backurl=
Disallow: /*back_url=
Disallow: /*BACKURL=
Disallow: /*BACK_URL=
Disallow: /*back_url_admin=
Disallow: /*?utm_source=
Disallow: /*?bxajaxid=
Disallow: /*&bxajaxid=
Disallow: /auth
Disallow: /include
Disallow: /personal
Allow: /bitrix/components/
Allow: /bitrix/cache/
Allow: /bitrix/js/
Allow: /bitrix/templates/
Allow: /bitrix/panel/

Sitemap: https://nalog.center.ru/sitemap.xml
Host: https://nalog.center.ru

1. Была директива запрещающая индексировать сайт Disallow: /
2. В пути к карте сайта не прописали ".ru" https://nalog.center/sitemap.xml
3. При указании главного зеркала не указали ".ru" Host: https://nalog.center
После легкой регистрации у Вас появится возможность комментировать и создавать свои темы ;) Регистрация занимает меньше 1 минуты ;)

justmary
Сообщения: 111
Зарегистрирован: 23 июл 2017, 19:04
Благодарил (а): 2 раза
Поблагодарили: 1 раз

Re: Как правильно настроить robots.txt"

Сообщение justmary » 02 окт 2017, 14:07

У меня сайт nalog.center без ru.
Я роботс делала с помощью Битрикса практически автоматически и он какие-то папки сделал Allow. Как понять, правильно ли он сделал эти папки Allow? Как узнать, какие папки открыть для индексации?

Аватара пользователя
Вадим Костин
Сообщения: 211
Зарегистрирован: 28 янв 2017, 18:01
Благодарил (а): 5 раз
Поблагодарили: 7 раз

Re: Как правильно настроить robots.txt"

Сообщение Вадим Костин » 02 окт 2017, 17:34

justmary писал(а):
02 окт 2017, 14:07
Как узнать, какие папки открыть для индексации?
Для робота должны быть доступны важные для вас страницы, например которые Вы хотите чтобы были в индексе поисковиков.

Все остальное нужно закрыть.

Например: для интернет-магазина важно чтобы в индекс попали страницы категорий, карточки товаров. Все остальные страницы по сути не важны. Их можно закрыть от поисковиков.

От поисковиков нужно закрывать дублирующиеся страницы, с параметрами, метками, административную часть, личный кабинет и все остальное что не несет никакой ценности для поисковиков и для пользователей в плане контента.

Когда не видишь проект, сложно судить что закрыть. Выложите ссылку.

Директива Allow: разрешает индексировать папки и файлы которые вы указываете.

Из всех представленных Allow: я бы оставил только

Allow: /bitrix/js/ (разрешает поисковикам индексировать файлы находящиеся в данной директории, это файлы с расширением .js , поисковики требуют чтобы данные файлы были разрешены для индексации).

justmary
Сообщения: 111
Зарегистрирован: 23 июл 2017, 19:04
Благодарил (а): 2 раза
Поблагодарили: 1 раз

Re: Как правильно настроить robots.txt"

Сообщение justmary » 04 окт 2017, 12:16

Сайт nalog.center

Аватара пользователя
Вадим Костин
Сообщения: 211
Зарегистрирован: 28 янв 2017, 18:01
Благодарил (а): 5 раз
Поблагодарили: 7 раз

Re: Как правильно настроить robots.txt"

Сообщение Вадим Костин » 04 окт 2017, 18:06

1. Страницы которые в разработке лучше скрыть (на сайте не должно быть не рабочих и пустых разделов). Лучше активировать раздел когда он полностью готов.
2. Особо сейчас скрывать нечего, только результаты поиска, можно таким правилом: Disallow: /search/ - для каждого робота
3. Сейчас лучше закрыть сайт от индексации, пока не наполните контентом.

justmary
Сообщения: 111
Зарегистрирован: 23 июл 2017, 19:04
Благодарил (а): 2 раза
Поблагодарили: 1 раз

Re: Как правильно настроить robots.txt"

Сообщение justmary » 05 окт 2017, 14:55

Спасибо)

justmary
Сообщения: 111
Зарегистрирован: 23 июл 2017, 19:04
Благодарил (а): 2 раза
Поблагодарили: 1 раз

Re: Как правильно настроить robots.txt"

Сообщение justmary » 20 мар 2018, 15:53

Здравствуйте! Подскажите пожалуйста, должен ли индексироваться слайдер на сайте? Мне бы хотелось, чтобы индексировались картинки со слайдера и текст со слайдера. Как это можно сделать? Я так понимаю, что нужно прописать директиву Allow, но что писать дальше, не пойму. Подскажите пожалуйтста.

Аватара пользователя
Вадим Костин
Сообщения: 211
Зарегистрирован: 28 янв 2017, 18:01
Благодарил (а): 5 раз
Поблагодарили: 7 раз

Re: Как правильно настроить robots.txt"

Сообщение Вадим Костин » 20 мар 2018, 19:45

У Вас картинки в какой папке хранятся?
Адрес слайдера выложите здесь.

justmary
Сообщения: 111
Зарегистрирован: 23 июл 2017, 19:04
Благодарил (а): 2 раза
Поблагодарили: 1 раз

Re: Как правильно настроить robots.txt"

Сообщение justmary » 21 мар 2018, 09:42

Картинки хранятся в папке /upload/. Но я не знаю,как определить, в какой папке хранится слайдер. Есть только URL страницы детального просмотра #SITE_DIR#/services_news/detail.php?ID=#ELEMENT_ID#. Но в каталоге файлов такой папки, как services_news нет. Поэтому даже не знаю, что можно сделать.

Аватара пользователя
Вадим Костин
Сообщения: 211
Зарегистрирован: 28 янв 2017, 18:01
Благодарил (а): 5 раз
Поблагодарили: 7 раз

Re: Как правильно настроить robots.txt"

Сообщение Вадим Костин » 21 мар 2018, 20:57

Наведите мышкой на слайд --> Нажать правой кнопкой мышки на слайд --> Открыть картинку в новой вкладке. Увидите url картинки

Ответить