22:49 Делаем грамотно файл robots.txt на примере. Описание Disallow, User-agent и Host | |
Делаем грамотно robots.txtФайл Robots.txt - располагается в корневой папке сайта (например, site.ru/robots.txt). Он нужен исключительно для правильной индексации сайта поисковыми системами. Обычному пользователю всё равно, что там написано. Основные возможности robots.txt:
Давайте для примера создадим файл robots.txt для Яндекса: User-agent: Yandex Disallow: /cgi-bin Host: www.VASH-SITE.ru Sitemap: http://www.VASH-SITE.ru/sitemap.xml Если бы мы создавали файл robots.txt для Google, то нужно было написать: User-agent: Googlebot Disallow: /cgi-bin Host: www.VASH-SITE.ru Sitemap: http://www.VASH-SITE.ru/sitemap.xml Чтобы учесть всех поисковых роботов, нужно прописать так: User-agent: * Disallow: /cgi-bin Host: www.VASH-SITE.ru # здесь можно написать комментарий Sitemap: http://www.VASH-SITE.ru/sitemap.xml Теперь поясню, что мы прописали выше. Disallow: /cgi-bin - говорит о том, что поисковые роботы не должны индексировать все содержимое папки cgi-bin. Например, документ www.VASH-SITE.ru/cgi-bin/1.html или www.VASH-SITE.ru/cgi-bin/papka/1.html - не будут проиндексированы. Однако, Google может отходить от данного правила, поскольку он воспринимает это лишь как рекомендацию. Host: www.VASH-SITE.ru - указывается главное зеркало Вашего сайта. Например, я не люблю прописывать www и на всех своих сайтах прописываю host без www. Если Вы напишите несколько host-ов, то использоваться будет первый. http://www.VASH-SITE.ru/sitemap.xml - указывается карта сайта в формате xml. Данный формат поисковые системы воспринимают очень хорошо, поэтому владельцам движков стоит использовать такую карту сайта. Для владельцев статических сайтов прописывать все в формате xml я не вижу смысла. # - является признаком начала комментария. Распространяется только на одну строчку. Использование * в robots.txt По умолчанию в конце каждого правила автоматически добавляется "*", однако иногда бывает важно конкретизировать что-то. User-agent: Yandex Disallow: /php-script/*.php Disallow: /*lichnoe
Использование $ в robots.txt User-agent: Yandex Disallow: /primer$ В данном случае будет запрещена индексация /primer, но /primer.php - разрешен. Файл robots.txt является открытой информацией для каждого. Любой пользователь может посмотреть его по адресу сайта с окончанием robots.txt: site.ru/robots.txt | |
Категория: Все о сайтах | Просмотров: 220 | |
Всего комментариев: 0 | |