|
РАЗДЕЛЫ
Архив
|
Госсайты прячутся от поисковиков≡ Исследования | Новости | 24.11.2009 11:06 Около 3,5% сайтов зоны .gov запрещают всем поисковым роботам индексировать свои страницы. Это удалось выяснить членам некоммерческой организации CommonCrawl Foundation, разработавшим специальный бот ccBot. Как один из руководителей этой организации и известный защитник информации, являющейся общественным достоянием, Карл Маламуд (Carl Malamud), Из 32 000 поддоменов зоны .gov по крайней мере 1188 содержат robots.txt с инструкцией, запрещающей любым "паукам" индексировать страницы расположенных на этих доменах сайтов. По мнению Маламуда, robots.txt должен использоваться на государственных сайтах только в целях безопасности и открытости, а не потому, что какой-то там вебмастер своевольно решил, что их не нужно индексировать. Маламуд также отметил, что в некоторых случаях их ccBot намеренно игнорировал такие инструкции, "поскольку нам показалось, что это было своевольной и незаконной попыткой не допустить общественность". "Ещё более любопытно, — отмечает Маламуд, — что на 175 из этих сайтов, несмотря на глобальный запрет, имеется специальная обходная инструкция для Googlebot, позволяющая ему индексировать данные". Маламуд не видит большого смысла в том, чтобы допускать к информации только некоторых роботов-пауков, а остальных "не пущать". Отметим, впрочем, что некоторые поисковые боты отличаются гиперактивностью, которая может оказать на сайт существенную нагрузку. Не говоря уже о том, что отдельным роботам вообще никакой robots.txt не указ. Что до российских государственных сайтов, то здесь царит практически повсеместная гласность и открытость. Файлом robots.txt здесь вообще не пользуются, за редкими исключениями — например, на сайтах Министерства иностранных дел и Генеральной прокуратуры. Но и здесь блокировку нельзя назвать тотальной. Так, на сайте МИД всем поисковикам индексировать лишь определённые разделы, а в опале по какой-то причине находится только китайский YodaoBot. С другой стороны, российские госсайты используют более надежные способы сокрытия информации - например, они просто не публикуют ее. Кроме того, в этом году получил известность такой трюк пессимизации, как замена некоторых русских букв на латинские - благодаря этому некоторые госзаказы оказались невидимы для поисковиков. комментарии(0) | разделы: Новости | Исследования Материалы по теме Скрытый Интернет "Яндекс" проводит DoS-атаки Другие новостиНовости наших партнеров |
Последние комментарии
Гость про Милиция выключила сервера "Агавы" без разбора (19)
Bitonic про Как не пропасть на сайте знакомств (7)
Гость про Детское порно не умрет без стукачей (70)
Игорь Крейн про 20 уроков программирования (16)
все комментарии Fand отвечает: Мамба - мошенники?! Гость отвечает: Как получить снимок местности со спутника\ Гость отвечает: Как создать браузерную игру? Ульяна отвечает: уже месяц не могу зайти в контакт. Гость19.03.2010.Людмила.2 отвечает: почему я не могу зайти на сайт одноклассники Ambassador отвечает: Что нужно для создания торрент-сервера? Гость отвечает: Вконтакте ворует деньги юзеров?? Псих отвечает: Что за Антиспам блокирует Вконтакте? Юлька=) отвечает: не могу сменить пароль |
Copyright © 2001-2010 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна. Техническая поддержка и дизайн: Sterno.ru