Подпишись на RSS

Введите ваш email:

Если вам понравился блог, то вы можете разместить кнопку на своем сайте:
El-commercial.Ru - заработок в интернете без вложений

Видеокурсы Joomla

Тут много денег

Sape - лучшая биржа ссылок.
Gogetlinks - высокий заработок.
Miralinks - лучшая биржа статей.
Пресс-релизы - новая биржа статей.
Rotapost и Blogun - $ на блоге.
Begun - контекстная реклама.
Skazkipro - продажа сказок.
Pay-Click - лучшая тизерка.
Popupclick и WebUnder - кликандер.
Goodbody - % от продаж товаров.
VseMayki - % от продаж футболок.
Ad1 и Admitad - все партнерки в одной.

Домены ru 99руб

регистрация доменов
домен RU - 99 руб
домен COM - 350 руб
Зарегистрируй себе домен! имя:
зона:

2domains.ru

Хостинг

Семинары и уроки

Оптимизация

Начнём с самого понятия файла robots.txt. Robots.txt - это такой текстовый файл, который, как правило, находится в корневой папке Вашего сайта (по адресу http://адрес_сайта/robots.txt) и служит для того, чтобы запретить поисковым роботам лазить в каких-то конкретных разделах, папках, страницах и т.д.. Вы можете посмотреть robots.txt совершенно любого сайта просто набрав адрес http://адрес_сайт/robots.txt. Помимо того, чтобы запрещать, robots.txt содержит ещё некоторые команды. Например, чтобы показать поисковым роботам где находится sitemap Вашего сайта, нужно вписать в robots.txt такую команду:
Sitemap: http://адрес_сайта/sitemap.xml

Чтобы уменьшить количество запросов от поисковых систем и тем самым уменьшить нагрузку Вашего сайта на хостинг или сервер, нужно ввести такие строчки для яндекса:

User-agent: Yandex
Crawl-delay: 10

и такие для Гугла:

User-agent: Google
Crawl-delay: 10
Вообще, robots.txt предназначен для того, чтобы запретить поисковым роботам индексиовать разный ненужный хлам на Ваше сайте, например, картинки, административную панель, компоненты, страницу поиска и т.д. У каждого движка есть свои варианты составления файла Robots.txt. Например, для Joomla нормальный robots.txt выглядит так:
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /component/*
Disallow: /component/search/
Disallow: /component/content/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Host: ваш_домен без http:// и www
Sitemap: http://адрес_сайта/sitemap.xml

Интересное:

Удобная и быстрая сдача нулевой отчетности ип. Всего за 1500руб и по времени около 10минут.

Комментарии
Добавить новый Поиск RSS
kol   |2010-08-19 03:50:34
Если запретить Disallow: /images/ то картинки не будут индексироваться, а это не есть хорошо
Tokito   |2010-02-27 15:59:41
avatar Если нужно снизить нагрузку, то оно того стоит. Другое дело если сайт посвящён именно картинкам.
Riker   |2010-08-19 03:22:17
Странно как-то индексирует он мой сайт... вроде robots.txt стандартный ничего не трогал, яндексовский бот просканил главную и все... а так помимо еще куча материала... когда он начнет его сканировать? и будет ли вообще? joomala 1.5.15
Tokito   |2010-03-28 00:45:32
avatar Если ты про сайт naputisili.ru, то в нём проиндексировано 5 страниц яндексом.
Riker   |2010-08-19 03:22:11
Да, про него... последний раз бот яндекса сканил 18 числа, просканили главную и все... а на сайте куча статей, до них не дошел... создал после этого сайтмап, подсунул его гуглу и яше... посмотрим что будет... вообще он у нас висел долго закрытым, если к примеру ввести адрес, в поиске яши, первым что выдаст что сайт закрыт на тех ремонт... я так понял теперь ждать остается... и просканит ли он теперь все статьи?
Да и еще вопрос немного не в тему... на dmos сайту с таким специфичным контентом реально попасть?
Tokito   |2010-03-28 03:58:54
avatar Жди, просканит.
В Dmoz вряд ли сейчас примут.
Riker  - robots.txt   |2010-03-31 03:43:50
Еще вопрос, как правильно открыть доступ в robots.txt для облака тегов которое лежит в modules/mod_joomulus... только для этой папки, а для всех остальных каталогов в modules/ был закрыт....
RANOM  - че не индексирует?!   |2010-04-25 13:58:48
проверьте пожалуйста исходный код страницы моего сайта ranom.ru что не так??
Tokito   |2010-04-25 14:00:13
avatar Судя по всему сайт под фильтром яндекса, проиндексировано 3 страницы.
Дмитрий  - Индексация сайта   |2010-08-19 02:50:27
Уважаемые мастера мой сайт не индексируется , посмотрите пожалуйста может что нетак сделал . Это мой первый сайт. Буду признателен за помошь.
Tokito   |2010-04-28 15:40:42
avatar В гугле проиндексирован. В яндексе видимо нужно подождать. И смени заголовок главной страницы. "Главная страница" - это хреновый заголовок.
Дмитрий  - Спасибо за ответ   |2010-08-19 02:50:13
Огромное спасибо за совет , сменил заголовок. А две недели для яндекса я так понимаю это еще не срок?
Tokito   |2010-04-29 17:09:41
avatar Наполняй сайт, раскручивай и всё будет.
Alex  - Индексация сайта   |2010-08-19 02:50:17
У меня почему то муть индексирует, а не то что надо! Это первый мой сайт, не обессудьте . гляньте плз что не так!!! Заранее благодарен
Tokito   |2010-04-29 00:44:08
avatar Слишком мало страниц, там нечего индексировать.
erfey   |2010-05-03 10:59:06
Для начала оптимизируй внутреннюю структуру сайта, убери не нужные мета-тэги, в оющем приведи все в порядок для поисковика.
Provolod  - запрашиваю поддержку с воздуха ))   |2010-05-27 20:24:59
Приветствую! ))

Ребята, можете глянуть что можно сделать с моим сайтом для поисковиков? В принципе на них сильно не рассчитываю, но все же было бы приятно дополнительный траф получать )
Раньше не работал с джумлой, поэтому сложности возникли =))
provolod(dot)ru

Заранее благодарю! ))
Михаил  - Не индексируется сайт   |2010-05-28 21:21:12
Здравствуйте народ!!!

Прошу вас помочь мне!Сайт уже где-то три недели не индексируется!Посмотрите пожалуйста,может чего не так? вот адрес: www.zavgbi.x10hosting.com
Артём   |2010-06-15 12:27:48
Семён а есть команды robots.txt для вордпреса
Tokito   |2010-06-15 12:48:41
avatar Они везде одинаковые.
Dix  - Спасибо   |2010-07-28 16:04:17
Спасибо, использовал роботс для своего сайта.
Sergic  - Запрет индексации   |2010-08-23 12:27:10
Подскажите как отключить индех определённой статьи в Joomla через
robots.txt
vcenasharu.ru  - индексирование   |2010-08-29 16:36:59
Здравствуйте! проверьте правильность robots.txt, а то уже почти три недели прошло, а яндекс совсем и не торопится индексировать сайт...вот сам сайт - http://vcenasharu.ru/
Tokito   |2010-08-29 17:33:11
avatar Роботс нормальный, да и проиндексировано 9 страниц в яндексе. Если на сайте текст не уникальный, то возможно попали под фильтр и больше яндекс не проиндексирует.
vcenasharu  - индексирование   |2010-09-03 09:28:02
как я понял яндекс индексирует не быстро...а оочень и очень долго...у меня только сейчас (прошло уже больше месяца) проиндексировано 199 страниц...даже половины еще нет
will  - Правильный robots.txt   |2010-09-14 01:07:02
Здравствуйте! Часто вижу,что строчку-Sitemap,в файле-robots.txt, пишут после Host не сразу,а через два Enter.Как правильно:
User-agent: Yandex
...
Host: site.ru
Sitemap: http://site.ru/sitemap.xml

Или:

User-agent: Yandex
...
Host: site.ru


Sitemap: http://site.ru/sitemap.xml

Спасибо!
Tokito   |2010-09-14 10:37:16
avatar Нет никакой разницы.
Nafania   |2010-10-14 16:29:56
админ, а зачем прописывать:
Disallow: /component/search/
Disallow: /component/content/
если мы прописали:
Disallow: /component/*
Булатов Фаиль   |2010-12-04 05:09:45
Думаю он и сам не знает)
zemledelec  - по теме   |2010-12-17 16:35:07
Добрый день. Подскажите пожалуйста вот мой сайт http://stroim-vsem.org.ua - его приняли на биржу миралинкс для размещения статей, приняли на гогет и дали 200 ссылок на месяц, но ни одной поставить я еще не успел, как модераторы его отклонили и не указали причину. добиться от них причины не возможно. А сам я не могу понять в чем причина чтобы ее исправить.
Tokito   |2010-12-19 13:32:29
avatar Попробуй снова добавить.
shurikus  - Индекс страниц   |2011-03-02 15:15:36
Здравствуйте, господа помогите разобраться, создал в жумле сайт www.sv777.ru залил в него приличненько контента, индекс многих страниц прошел смотрел через вебмастер яндекса, после чего было принято решение изменить вид адресной строки т.е. сделал чпу и адреса многих страниц изменились.
Вот уже скоро месяц а яндекс выдает все еще старые страницы с ошибкой 404 как и должно быть, начал создавать страничку со словарями из которой ссылки более чем на 3000 отдельных страниц и этого материала скоро месяц в поиске нет, может посмотрите http://sv777.ru/ в часности страницу словари, в чем может быть проблема что месяц в базе яндекса не обновляются старые ссылки и почему данной страницы со словарями нет вообще,может у меня что с файлом robots не так, заранее спасибо.
Tokito   |2011-03-02 22:45:43
avatar Файл Robots.txt нормальный, возможно просто нужно еще подождать. Новые ссылки долго переиндексируются.
dublikat   |2011-04-11 01:00:56
с какой радости "Host: ваш_домен без http:// и www" ? а если основное зеркало таки с www? результат будет выпадение сайта на 6 недель в никуда..
Tokito   |2011-04-11 01:34:52
avatar >>с какой радости "Host: ваш_домен без http:// и www" ?
Ну вообще это дело каждого. На этом сайте у меня без www, на другом с www.

>>а если основное зеркало таки с www?
Эм.. тут как бы указывается robots.txt для новых сайтов.
dublikat   |2011-04-11 20:13:24
ну, если для новых, тогда думаю стоить отметить еще пару пунктов:
Disallow: /index.php?option=com_mailto
Disallow: /*print=1
Disallow: /*format=pdf
Disallow: /index2.php
1. убирает спам формочек отправки писем с индексации
2. убирает спам формочек печати
3. убирает спам pdf-копий страниц
4. опционально, если вдруг вы включили ЧПУ а потом выключили, чтоб небыло дублей страниц в индексе (не нужен для нового уже настроенного сайта)
п.с. Disallow: /images/ лучше оставить, т.к. в папке находится уйма "смайликов и прочего мусора", луxше сделать отдельно allow для конкретной папки с уникальными имагами
Tokito   |2011-04-12 04:43:02
avatar Спасибо за подсказки.
Шамиль  - Индексация   |2011-05-08 01:50:32
Вы не могли бы проверить мой сайт и подсказать что не так. Уже больше 2 месяца индексирует только одну страницу.
Tokito   |2011-05-08 15:43:00
avatar Могу посмотреть, скажите ссылку.
Шамиль  - Индексация   |2011-05-10 20:21:59
Вот ссылка на мой сайт www.qorosh.ru
Tokito   |2011-05-11 00:06:00
avatar Вашему сайту 2 месяца? Если да, то значит вы купили домен у кого-то, потому что он был зарегистрирован 8 месяцев назад (сентябрь, 2010 года). Если все так, то скорее всего вам просто продали забаненный в яндексе домен. В таком случае, если ваш сайт с уникальным текстом и не нарушает никаких правил РФ, то советую написать в тех поддержку яндекса, и сайт в ближайшее время должны вывести из бана.
Шамиль  - Карта сайта   |2011-05-17 18:55:10
Спасибо, что помогли. Не могли бы Вы помочь мне посоветовать компонент для создания sitemap.xml для яндекса и гугл.
Tokito   |2011-05-17 19:11:08
avatar http://el-commercial.ru/2009-06-13-16-15-47/21--sitemap
Дмитрий  - Если не сложно..   |2011-10-29 13:13:58
Tokito, спасибо за твой сайт и за помощь по другим вопросам. Если не сложно - мог бы посмотреть сайт, просто оценить на сколько это возможно оптимизацию и внутреннюю работу, может есть какие- либо советы, буду очень признателен..
Вот - gamepaintball.ru
Tokito   |2011-10-30 04:30:01
avatar Пожалуйста. Выглядит неплохо, но по оптимизации ничего не могу сказать, так как с Джумлой уже не дружу, да и страниц там очень мало, оптимизация особая не требуется.
Дмитрий  - Выдача карявых ссылок в Гугле   |2011-10-29 13:30:08
Вот еще вопрос: В роботс запретил все корявые ссылки, очень давно, когда проверяю в гугле:
site:gamepaintball.ru
Он показывает все корявые ссылки какие только можно
Tokito   |2011-10-30 04:32:30
avatar Странно, а я вижу что все четко показывается, только две корявые ссылки? Типа такой gamepaintball.ru:8080/ssi
Дмитрий  - Выдача в гугле   |2011-10-30 19:20:04
У меня получается вот это:
http://www.google.ru/#q=site:gamepaintball.ru&hl=ru&newwindow=1&prmd=imvns&ei=aHitTv6RF4b_4QSn0OnvDg&start=50&sa=N&filter=0&bav=on.2,or.r_gc.r_pw.,cf.osb&fp=9b2cf164dd40b66f&biw=2560&bih=1468

Т.е. Результатов: примерно 646 - под окном где вводится текст для поиска.

И вопрос: как в роботс.тхт убрать gamepaintball.ru:8080/ssi ??
Дмитрий  - Если не сложно   |2011-10-30 19:30:00
Согласен, поправлюсь - оптимизация под поисковые системы. Вот проблема к примеру, не знаю как решить: запрос с яше - пейнтбол цены, выдача на 51 странице, причем показывается главная страница, которая ранжируется плохо. А мне нужно чтобы по этому запросу проходила не главная страница, а .../price-paintball - т.е. цены. Причем и название страницы такое и анкорные ссылки сами на себя стоят, вообщем не могу понять как быть с этой ситуацией.
А вот пример: по запросу "пейнтбол ярославское шоссе" - выдача в топе, на нужную страницу, ....ru/proesd-paintball .(буду еще работать, чтобы повыше оказаться)
Tokito   |2011-11-03 06:42:38
avatar В этом и проблема Джумлы, она совершенно не оптимизирована под поисковые системы, все нужно делать ручками.
По поводу "пейнтбол цены" - попробуйте убрать с главной страницы все слова типа "цена, цены, цену" и т.д., а на страницу "price-paintball" добавить побольше ключевой фразы.
Tokito   |2011-11-03 06:34:58
avatar Да не парьтесь вы так, у меня на моем блоге тоже в 2 раза больше страниц. Это для меня мелочи, поэтому я не знаю тонкостей.
Сергей  - Дубли главной   |2011-11-15 04:05:26
Подскажите пожалуйста, у меня главная доступна по 3 адресам :

www.site.ru
www.site.ru/index.php
www.site.ru/home.html

правильно ли я написал в роботе чтобы индексировалась только www.site.ru

Disallow: /index2.php
Disallow: /index.php
Disallow: /home.html
Allow: /index.php?start
Tokito   |2011-11-17 06:33:45
avatar Вроде все правильно
Оставить комментарий
Имя:
Email:
 
Тема:
 
:angry::0:confused::cheer:B):evil::silly::dry::lol::kiss::D:pinch::(:shock:
:X:side::):P:unsure::woohoo::huh::whistle:;):s:!::?::idea::arrow:
 
Пожалуйста, введите проверочный код, который Вы видите на картинке.

3.26 Copyright (C) 2008 Compojoom.com / Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved."

Похожие материалы