Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июнь 2020  
пн вт ср чт пт сб вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
05.09.2006 15:28 | пишет kiwi | ссылка

Хорошо написано. Особенно понравилось про "ночной/дневной дорвей"

05.09.2006 15:38 | пишет Гость | ссылка

они не требуют. они просят. просят сотрудничества

05.09.2006 15:47 | пишет kiwi | ссылка

При этом выжирая гиги трафа с отдачей близкой к нулю?

05.09.2006 15:54 | пишет http://itman666.livejournal.com | ссылка

А это просто слишком неудобно написать бот, который будет вести себя вежливо. Посему такое отношение. Насколько я знаю, что Гугл, что Яндекс таймауты не используют, действуют по принципу, пришел, увидел, положил.

05.09.2006 15:56 | пишет SergeAx | ссылка

Откуда вы взяли гиги трафика? Вы не дорвейщик, часом? Нормальный сайт а) генерирует максимум полсотни килобайт контента в сутки и б) на старый контент умеет отдавать 304 Not Modified. В таком режиме робот может его индексировать хоть раз в час.

05.09.2006 17:37 | пишет kiwi | ссылка

304 и дорвеи отдают ;)
я часом кто только ни есть :)
но в рунете дорами не занимался. партнерка была, да :)

05.09.2006 17:46 | пишет kiwi | ссылка

кстати
любой открытый форум и 50к новой инфы в день - это вещи несовместимые.
и 304 как раз на нормальные сайты ставят ДАЛЕКО не всегда

05.09.2006 15:51 | пишет artreal.myopenid.com | ссылка

Снижение релевантности ("пессимизация") в практическом смысле - вещь полезная. Но пока непонятно, как ей управлять (не отказался бы от нее в персональной новотеке)

05.09.2006 18:48 | пишет Игорь Ашманов | ссылка

В планах предусмотрено управление порядком выдачи для автора поисковика. Этой осенью сделаем.

06.09.2006 04:45 | пишет Денис Зубо | ссылка

Игорь, здравствуйте.
Не совсем по теме, и не уверен, что прочитаете коммент, но вот нашел случайно прямо то, о чем в том числе Вы говорили в интервью про пути развития поисковых систем - система выдает профиль сайта:
http://adaptivepath.com/images/publications/essays/sphere3.png
В данном случае это поиск по блогам, так что в профиле значения, характерные для блога.

Вот здесь подробнее:
http://adaptivepath.com/publications/essays/archives/000614.php

Процесс пошел.

05.09.2006 16:00 | пишет Гость | ссылка

Я не знаю какими поисковиками пользуетесь вы, я пользуюсь Google.com и он мне показывает то, что я ищу и с большой релевантностью.

05.09.2006 16:06 | пишет Dr Кибрарян | ссылка

Было бы логичнее назвать статью "Манифест Яндексу" )

Уважаемый Алексий, где это вы одном из богатейших оттенками и словами русском языке нашли слово "бенефиты"? И главное - зачем? Корпохрени обчитались? )

05.09.2006 16:31 | пишет Леха Андреев | ссылка

Пардоне муа, но в данном случае язык требовал именно этого слова! Да, это их язык.

05.09.2006 16:06 | пишет djatell | ссылка

Весной запустили сайт, к каждой странице которого можно добраться неограниченным числом путей. Сначала немного беспокоились, уж очень на дорвей похоже. Потом плюнули - кто индексирует тот пусть и мучается, отличает одно от другого. Лишь бы посетителям интересно было, и удобно. Экспериментов с интерфейсом будет ещё много, переживать по поводу роботов некогда ...

05.09.2006 16:40 | пишет Леха Андреев | ссылка

У нас был противоположный случай, когда я еще работал в Medmedia.ru. Там некоторые статьи тоже выдавались разными способами - обычно двумя, не более. И делалось это вовсе не для обмана поисковиков. Просто одни и те же публикации привязывались к разным разделам, с разной тематической "обвязкой". К примеру, статья про грипп могла выдаваться и в общих "Инфекционных заболеваниях", и в "Детских болезнях". То есть по-человечески все было сделано вполне удобно.

Но роботы Яндекса сочли это "спамом" и перестали индексировать сайт.

05.09.2006 17:13 | пишет Юpий Синoдов | ссылка

правда разрулили
правда пришлось подстраиваться под Яндекс, и с ним переписываться

07.09.2006 14:46 | пишет из Яндекса | ссылка

Лех, не надо - забанили вас не за это, а совсем за другое

05.09.2006 16:38 | пишет Double | ссылка

Весёлая статья, особено про старика Тима повеселило. Жаль у меня нет ни одного проекта, чтоб париться по поводу роботов.

05.09.2006 16:40 | пишет minaton.livejournal.com | ссылка

Л е х а, а про миллион на сканирование словарей и справочников забыл?

05.09.2006 17:26 | пишет Леха Андреев | ссылка

Ну дык, это же другое. Это серьезный бузинесс. Каждый советский человек мечтает научиться закрывать багажник, пользуясь инструкцией на испанском, с помощью GPRS-доступа к загадочному слову puerta. Фактически, это вопрос жизни и смерти миллионов россиян в глубоких Пиренеях. Это вам не какие-то там ненужные новости!
http://company.yandex.ru/blog/?msg=100207&month=9&year=2006

05.09.2006 18:39 | пишет Владимир Волошин | ссылка

Алексей, эта история о несоветском человеке. Мы все хорошо знаем, что именно будет делать советский человек с взбунтовавшимся компьютером, тем более испанским. Шарахнет по нему кулаком или толстым горным ботинком! И сразу получит желаемый результат.

И этот пиренейский пример - яркая иллюстрация к докладу Тимура Аитова о засильи иноземных порталов! Ведь на нашем, русском общественном портале ему бы сразу общественность дала правильную рекомендацию, не пришлось бы рыться в словаре!

Мне стыдно за нашего соотечественника, так позорно закончившему битву с заграничным калькулятором. Вместо того, чтобы заставить глупый аппарат подчиниться, он с ним договаривался, да еще и на его языке.

Русские не ведут переговоров с роботами-террористами!

Доктор Волошин

05.09.2006 18:49 | пишет Леха Андреев | ссылка

+5

05.09.2006 16:54 | пишет Игорь | ссылка

Поисковик это моя память, он помнит все мои запросы и помогает мне искать ассоциации в собственной голове. Интернет без поисковиков не нужен.
http://holyhalo.livejournal.com

05.09.2006 17:49 | пишет Леха Андреев | ссылка

Скорее уж, не нужна голова, которая не умеет сама строить ассоциации. Выбросьте свою голову. Купите новую в ИКЕЕ.

05.09.2006 18:17 | пишет Игорь | ссылка

Ассоциации каждого человека субъективны, они ограничены его представлениями о мире. Ассоциации, которые строит поисковая машина основаны на документах, которые в ней проиндексированы и поисковых запросах других людей.
Вы помните то, что вас интересовало год назад ? Я нет, поэтому мне интересно смотреть на мои related searches в моей search history.
http://holyhalo.livejournal.com

05.09.2006 18:53 | пишет Леха Андреев | ссылка

Ну и что? А некоторым интересен кокаин, который воздействует на лобные доли почти как то, о чем вы говорите. А уж эти чудесные ассоциации, которые позволяет строить одна маленькая марочка ЛСД! Это все наверное очень "интересно", правда? Пальцы в розетку, кстати - тоже незабываемый опыт. И главное, измененное состояние сознания достигается и дешевле и быстрей.

05.09.2006 19:04 | пишет Игорь | ссылка

Речь не идёт об изменении своего сознания, речь идёт и находжении взаимопонимания с другими людьми. Ассоциации, которые строятся при помощи поисковой машины основаны на знаниях других людей. Двум наркоманам тяжело понять друг друга, двум людям, работающим над одной и той же проблемой возможно договриться об одинаковом понимании, даже если изначально они говорили с использованием различной терминологии. Важно то как я понимаю других людей и как другие люди понимают меня. Поисковые машины ведут именно к построению взаимопонимания. Я ожидаю в будущем открытия истории запросов пользователей поисковых машин, аналогично тому как это было сделано с social bookmarks.
http://holyhalo.livejournal.com

05.09.2006 19:13 | пишет lastmile | ссылка

Компьютер - как протез мозга. Ужасно.
Значительно интереснее натренировать свой мозг, чтобы он заменял компьютер - а не наоборот. Например, как придумал автор системы запоминания - http://mnemotexnika.narod.ru/

05.09.2006 19:30 | пишет Игорь | ссылка

Да, компьютер это протез мозга, и ничего ужасного в этом нет.
Я не думаю, что автор методики запоминания может запомнить какой-нибудь более-менее развитый API. К тому же информация постоянно меняется и каждый раз придётся запоминать что-то новое, это часто встречается при переходе от версии к версии. Забывать такое же важное свойство памяти как и запоминать.
http://holyhalo.livejournal.com

05.09.2006 20:17 | пишет lastmile | ссылка

Ну, как человек, который этой системой пользуется, скажу - можно запомнить что угодно: текст любой сложности, новую знаковую систему, бессмысленный набор символов, тристациферную последовательность и т.д. на любой срок - от часа, до жизни. И все это с помощью системы ассоциаций, которыми оперирует наш мозг. Стоит тренировать и изучать его, а не перекладывать самые простые навыки на тупую железяку. Имхо.

05.09.2006 19:18 | пишет Владимир Волошин | ссылка

Игорь, спасибо Вам огромное!

Я знаю теперь, чем обрадовать моих коллег-психиатров. Расскажу о новых, перспективных направлениях развития бизнеса. А то им уже скучно лечить простых российских алкоголиков.

Доктор Волошин

05.09.2006 19:37 | пишет Игорь | ссылка

Безусловно, психиаторов должна заинтересовать история поисковых запросов пациента, это очень много говорит о человеке. Я своему психиатру даю возможность посмотреть на свою историю запросов и у него обычно не возникает вопросов.
http://holyhalo.livejournal.com

05.09.2006 19:52 | пишет Владимир Волошин | ссылка

На поисковиках не остановимся. Мы пойдем дальше! Будем анализировать содержание персональных агрегаторов новостей, докторам это сильно подсобит.

Вот, к примеру, такой фрагмент:

19:20 Сканер Fujitsu fi-4860C2 – быстрый, удобный, бесшумный
19:09 У оборудования беспроводных сетей есть «отпечатки пальцев»
17:44 ENlight LP-791 - barebone и ЖК-монитор в одном флаконе
16:48 UFO завалит прилавки бюджетными «10-Мп»
15:30 HTC Artemis поступит на европейский рынок под видом MDA Compact III
11:43 MRV выпускает решения DWDM для коммутаторов OptiSwitch 9000
11:32 HP iPAQ rx4000 - необычный КПК знакомого семейства
11:15 Dell XPS 700 CrossFire: так что же внутри?
10:25 Pioneer может, но пока не хочет: комбо-привод HD-DVD/Blu-ray оказался журналистской уткой

Это покруче, чем "наши жены - пушки заряжены".

Обращение в первобытное состояние.

Атавизм.

Доктор Волошин

05.09.2006 20:15 | пишет Игорь | ссылка

Вы знаете, единственный аггрегатор новостей который я читаю это моя френдлента в LiveJournal. Иногда у меня складывается впечатление, что она представляет собой бред шизофреника, но все главные и интересные новости в ней всегда есть.
Все остальные ленты, которые готовятся другими людьми мне неинтересны, именно потому что они готовятся другими людьми и редакциями.
http://holyhalo.livejournal.com

05.09.2006 17:05 | пишет А что же Рамблер? | ссылка

Умилительно смотрится спонсорство Рамблера над всем этим манифестом сами-знаете-какому поисковику :)

05.09.2006 17:28 | пишет Леха Андреев | ссылка

Спонсорство разделов не влияет на содержание авторских материалов - это написано на нашей странице о размещении рекламы на Вебпланете:
http://webplanet.ru/about/advert

Впрочем, чтобы эта мысль была наглядее - в следущей колонке будет про Рамблер.

05.09.2006 18:38 | пишет Гость | ссылка

На заборе тоже много чего написано :)

05.09.2006 18:54 | пишет Леха Андреев | ссылка

Идите читайте забор.

05.09.2006 19:00 | пишет Ким Евгений | ссылка

Я обычное не читаю заборы. Если уж на то пошло, то читают НА заборе, а не забор как таковой.
:) Вы так активно кричите, что не брали денег, что складывается впечатление, что вы их все таки взяли. :)

Надо проще к жизни относиться :)

05.09.2006 19:14 | пишет Леха Андреев | ссылка

Я кричу, что не брал денег? Где это? Я нормальный человек, я беру деньги. Несите уже скорей, хватит болтать!

05.09.2006 17:11 | пишет Гость | ссылка

Стартер, упей себя ап клавуЁ!
Ходил бы из закладок себе, глядишь и бреда поменьше вылил.
Ссылочки то в статейке откуда нарыл? Правильно, из поисковиков.
Мне хоть и все равно, упал Яша или поднялся, просто ненавижу желчь от людей, которые сами ничего не делают, а только поносят.

05.09.2006 17:35 | пишет Леха Андреев | ссылка

> Ссылочки то в статейке откуда нарыл? Правильно, из поисковиков.

Малыш, ты меня очень насмешил. Покажи мне, какая ссылка в моей статье найдена через поисковик? Я даю тебе 25 попыток. Потом иди обратно в песочницу.

05.09.2006 17:13 | пишет Алексей | ссылка

И вот еще что.

Трафик с поисковиков последнее время приходит отвратительный.

Конверсия гараздо ниже чем у ссылок с других сайтов.
http://OHO.ru

05.09.2006 17:25 | пишет Гость | ссылка

Клёвая статейка. Только вопрос: а где была бы Вебпланета без rss-агрегаторов и поисковиков. Или как, сам раскрутился, а теперь: блин, ребята, это все плохо. Контент копипездят, нах! Так отключи тогда rss-фидеры, и посмотри, что будет с твоей посещаемостью через пару месяцев. Обпишись хоть гениальными статейками. Что в них проку, если никто читать не будет.

05.09.2006 17:39 | пишет Леха Андреев | ссылка

Читай внимательно. Один RSS-фид мы уже отключили - именно тот, который более всего любили пауки и который давал нам всего 1% посещаемости (от "Яндекс.Новостей"). А вот остальные наши фиды - извини, они сделаны как раз для людей, а не для всеобщих поисковиков.

10.02.2007 05:30 | пишет mdgraphic | ссылка

да останется Вебпланета так же...

это все точно подмечено. Сам за статистикой сервера смотрел и по статистике 76% посетителей по прямому набору, 12% поисковики, остальное ссылки.
Вот и стоит подумать, нужноли тратится на раскрутку в поисковике, может дешевле и быстрее подругому...

молью побиты уши и души, изъела ржавчина плоть
http://www.mdgraphic.ru/

05.09.2006 18:06 | пишет Денис Зубо | ссылка

Почему-то многие воспринимают эту статью как наезд на Яндекс, просто потому, что он мол, Яндекс. Шире надо мыслить. Вполне здравые мысли о природе поиска как сервиса в статье высказаны. Фишка только в том, что лучше Яндекса (или Гугла) все равно никого нет, так зачем отказываться от чего-то в пользу менее удобного? Так что жить им еще и жить, до очередной неизвестной пока смены способа коммуникации.

05.09.2006 18:09 | пишет Лемминг | ссылка

Л е х а совсем поехал крышей.

Л е х а, закрой доступ всем роботам, напиши Disallow / в robots.txt!

05.09.2006 19:12 | пишет Леха Андреев | ссылка

Ты тоже невнимательно читал. Достаточно ввести грамотную политику Включения (авторизацию) вместо борьбы с отдельнымим паразитами через Исключение. К примеру, если мы решим, что Гугл нам полезен - можем включить, да.

(Правда, меня немного настораживает Долгов, который слишком часто рассказывает о собаках в офисах; такое чувство, что Гугл высосал его моск и вставил туда программу трехлетней давности для стран третьего мира; я бы прописал ему завести кошку, а точнее, хорошего бойцового кота... хотя это поможет ему лишь на персональном уровне, а на корпоративном в целом это не важно, потому что он все равно ничего не решает в ТЕХНОЛОГИЯХ поиска этой компании):
http://webplanet.ru/news/service/2006/09/03/googlerussiablog.html

06.09.2006 00:23 | пишет Каппа | ссылка

Что заставит Гугл добавлять поддержку вашей авторизации в своего робота? Пример WW показывает, что технически "политику Включения" совместимым образом реализовать нельзя.

И действительно непонятно, почему на Вебпланете нет robots.txt, который запрещал бы всех и вся. Это было бы хорошей иллюстрацией к статье.

06.09.2006 14:39 | пишет Леха Андреев | ссылка

Авторизация вообще-то разная бывает. Начиная от банальной маски по IP-адресам ботов. Им при этом ничего поддерживать особенно не надо.

05.09.2006 18:33 | пишет ACiD | ссылка

занятная статья, спасибо.

05.09.2006 18:48 | пишет Владимир Волошин | ссылка

Леха, пока не поздно - я присоединяюсь к твоему крестовому походу против роботов.

Посмотри, они не только грузят наши сайты, а даже обзавелись солидной группой поддержки! Эта секта поискоидов - как человеческая кожа на Шварценеггере-Терминаторе - маскирует истинную сущность бездушных машин. Еще немного и они споют песню о той грусти-тоске, которая мучит их после разлуки с любимым поисковиком. И о прочих нежных радостях машинного общения.

Доктор Волошин

05.09.2006 18:56 | пишет Леха Андреев | ссылка

А многих яндексоидов, кстати, реально ломает после ухода. С оптимизаторами проще - я знаю простой способ их реабилитации. Ну да ладно, это для другой колонки прибережем.

05.09.2006 19:08 | пишет Jack | ссылка

Пока принципиального прорыва в идее, концепции и алгоритмов у нынешних поисковиков не наблюдается.

Да и плюс к этому наши доморощеные Кулибины загадили инет так что нужную и полезную информацию становится очень сложно найти.

Очень сложно не согласится с тем, что написал главред.

Тупость поисковиков пока беспредельна, но есть надежда, что в недалёком будущем всё изменится в лучшую сторону, в Google это уже понимают и работают над этим.

05.09.2006 19:14 | пишет wastemaster | ссылка

статья супер :)

Все равно вы поисковик никогда не заставите платить. Кому нужен будет траффик, всегда готовы будут предоставить его бесплатно.

05.09.2006 19:26 | пишет lastmile | ссылка

Отлично, Леха! Узнал много нового!

05.09.2006 19:46 | пишет Гость | ссылка

Респект! Матрица не хэз нас!
Надо чтобы стандартом стало правило "фид содержит только лид, саму статью читайте на сайте первоисточника".

05.09.2006 20:03 | пишет Денис Зубо | ссылка

Не соглашусь. Не вижу ничего плохого, что в ленту человеку отдавать всю статью целиком. А человек и так зайдет -- за интересными комментариями. Я вот статью один раз прочитал, а за комментами к этой статье уже десятый раз захожу.

05.09.2006 20:50 | пишет Юpий Синoдов | ссылка

n+1 больше n

05.09.2006 21:05 | пишет Денис Зубо | ссылка

Логично. С другой стороны, если первой единички не случилось (не прочитали), то и n не будет.

Хотя новостных ресурсов наверное логичнее только анонсы отдавать, как на Вебпланете. Потому что новостей и статей много. Плюс я уже как читатель знаю и доверяю, привык к внешнему виду, поэтому кликнуть, перейти на сайт, и продолжить читать там — не сложно.
А вот если пишешь редко — то можно в RSS и весь текст давать.

05.09.2006 20:06 | пишет Каппа | ссылка

Яндекс.Новости ведь умеют сортировать сюжет по дате. Разве это плохой способ не читать вовсе "новостных дорвеев"?

05.09.2006 20:58 | пишет moe | ссылка

ДА! ДА! ДА! старик, ДА!

к несчастью, здесь я не могу в полной мере и именно тем способом, который кажется мне приличествующим, выразить в полной мере, но, блядь, как же всё-таки они все заебали, ну прости меня прости. да.

06.09.2006 00:26 | пишет ThisNight | ссылка

Помоему эта статья просто 3.14-дец.

Все поставлено с ног на голову. Причины спутаны со следствиями. Логических ошибок столько, что даже невозможно их перечислить.

Прикрытие сказочкой (ужастиком) и шутливым стилем несколько скрывает ошибки, но только для тех, кто не вдумывается в смысл статьи.

Алексей, вы же математик. Хотя похоже уже нет.

Похоже, отучится от привычки читать ВП уже легко.

06.09.2006 15:11 | пишет Леха Андреев | ссылка

> Алексей, вы же математик. Хотя похоже уже нет.

Бывших математиков не бывает, как говорил Степашин. Именно поэтому я не приемлю аргументы типа "поставлено с ног на голову". Вы уж для начала определите "голову" и "ноги", а потом поговорим.

И кстати, не забудьте определить "логику", на которую вы так упорно ссылаетесь. Потому что логик много разных. Есть и такие, в которых 2 X 2 = 11 (к примеру, в троичной системе исчисления, которая, кстати, наиболее близка к системе по основанию E и потому более выгодна для некоторых вычислительных алгоритмов).

06.09.2006 20:20 | пишет ThisNight | ссылка

Но всегда есть система счисления по умолчанию.
Так что говоря 2х2=11 вы не правы.
Конечно, апосля вы любите говорить, что ипользовали другую истему счисления. Но это уже потом, а до этой оговорки вы допустили ошибку.

И то в математике. А в реальности, если еще и реальность. А о ней, вы как то забываете. Помните, объективная реальность? Это то, что происходит на самом деле. И конечно можно говорить, что у каждого свое мнение и что в десятичной системе счисления 2х2=11, мол я так это вижу. Но реальностью это не будет.

По повду статьи. Ну хотя бы слова - "робот требует". Да никто от вас не требует. Если не хотите общаться с яндексом - не общайтесь. Ваши слова "робот требует" - это уже не есть реальность.

Про неточность про WebmasterWorld.com Вам уже написали без меня. Но могу добавить, что на основании этой неточности вы сделали вывод об отказе ресурса от индексирования гуглом. А на самом деле WebmasterWorld.com не отказался. А запрет для левых роботов - это не новость для вебмастера. (правда обычно идет от обратного - какой робот грузит, того и отключают. Но итог один - левые боты отключены).

Проблема же с Питерхостом - ну здесь уже все было про него сказано. И уж явно, Питерхост не основоположник запретов, а хостинг, не справляющийся с нагрузкой (первично - не справляется).

Что же касатся "отдачи" - то не так сложно сделать сайт, способный отдавать код - страница не изменена. И это было бы правильно. И траф не жрался бы и коректно бы все работало. И это было бы не "заставление" людей работать для пауков, а нормальное соблюдение правил w3c.
А по вашему, нафига праила дорожного движения - что бы мешать ездить куда хочу?
Так и ваши слова, мол хочу творить все что хочу, не соблюдая стандарты - это переврот с ног на голову.

Да и сама мысль, что роботы нас эксплуатируют - такие полуправдами заманивают в сектанство. Поисковые роботы нам помогают. И пусть они не в состоянии дать ответы на челвеческие вопросы - это не их задача. Их задача найти в огромной массе страниц страницы с нужными словами. И они с этой заачей справляются. А вы решили, что ветряные мельницы не помогают, а ужасные монстры и боретесь с ними. Нет - мельницы, что бы молоть муку, а поиковые роботы и поиск, что бы искать документы в которых встречаются заданые слова. И ничего более.

А уж по поводу "Семантическая Сеть" - может эта идея и не супер. Но она явно для людей, а не для роботов. И ваши слова - просто лепет бабушки, которая боится компьютер и ситает, что там бесы сидят.

Говорить о контентном инете без поиска и поиска без инета... Это просто смешно. Мол резина колес без машины не поедет, а машина на ободах ехать может. Значит давайте ездить без резины.
Есть одно, есть другое. Если вы считаете, что поиск это паразит, то снимайте индексацию.
И многие, не контентные проекты так и делают (например сайты конструкторы вебстраниц - они не индексируются). А контектные проекты оставляют индексацию, потому что от нее есть польза.

Что касается соотношения - трафик и нагрузка на сервер / отдача юзеров поисковиком - ну уж если вы поставили слабенький движок и у вас от робота проц загибается, то это ваша проблема кривого движка. На нормальном движке вряд и проц загнется от одного робота. А траф сейчас вроде как для вас халявный. Так что даже 2 пользователя в день с поиска - окупают и проц и траф.
Так что обобщать не надо. Для большинства сайтов, приход пользователей с поиска с лихвой окупают затраты на индексирование. (вот опять пример неверных оценок).

Ваши мысли про "Да такого человека засмеют! Но никто не смеется, когда роботы-поисковики очень авторитарно наезжают на людей, требуя обеспечить им, паукам, правильную "пищу" за просто так. "
Никто этого не требует. И даже не кто не предлагает быть на первом месте в поиске. Просто поисковик (т.е. програмер и менеджер поисковой фирмы) решили, и правильно решили, что стоит показывать сверху сайты, которые лучше сделаны, которые имеют больше упоминаний искомых слов. И, вы не поверите, пользователи поисковиков тоже этого хотят.
Так что не роботы требуют, а пользователи поисковиков просят о таком ресурсе, где хорошо сделаные сайты в начале выдачи.

И это только часть ваших ошибок в статье. Реально - их намного больше. Но думаю и так сойдет.
Но вряд ли вы с чем нить согласитесь, поэтому и не писал ничего в первый раз.

06.09.2006 21:29 | пишет Леха Андреев | ссылка

Действительно, не соглашусь. Поехали:

> Ну хотя бы слова - "робот требует". Да никто от вас не требует.
> Если не хотите общаться с яндексом - не общайтесь.

Робот создает ситуацию, которая на самом деле - требует. Ситуация у меня описана (про "Яндекс.Новости"). Нам предложен выбор: либо вы участвуете на условиях стандарта, либо мы будем показывать украденные у вас новости, которые нам отдают другие сайты-партнеры.

То же самое касается и общего поиска. У человека был хороший сайт, который выдавался в первых позициях по тем ключевым словам, которые реально связаны с темой. Но через пару лет этот сайт не попадает даже в первую двадцатку: там теперь находятся "хорошо оптимизированные" сайты. И что человеку делать? Нанимать оптимизаторов, изучать язык робота? Вот это и называется - требует.

> на основании этой неточности вы сделали вывод об отказе ресурса
> от индексирования гуглом. А на самом деле WebmasterWorld.com не отказался

Отказался - именно тогда, когда у меня написано (ноябрь). И ссылки там на ноябрьские дискуссии. Хотя потом они действительно ввели свой стандарт Включения вместо Исключения (про эту идею тоже упомянуто). Но подчеркиваю, я в данном случае описывал конкретное событие ноября.

> И это было бы не "заставление" людей работать для пауков,
> а нормальное соблюдение правил w3c. А по вашему, нафига праила
> дорожного движения - что бы мешать ездить куда хочу?

Да, меня очень раздражают правила дорожного движения, согласно которым я, здоровый человек, должен почему-то стоять на переходе несколько минут, а потом сломя голову за 30 секунд бежать через дорогу - потому что-кто там решил, что человек в самоходной инвалидной коляске по определению важнее здорового человека. Я думаю, правило должно быть иное: я жду всего тридцать секунд, а потом несколько минут спокойно горит зеленый свет. А инвалиды на колясках пусть постоят. Куда им спешить-то? На кладбище?

> И пусть они не в состоянии дать ответы на челвеческие вопросы -
> это не их задача. Их задача найти в огромной массе страниц страницы
> с нужными словами.

Вот именно, это ИХ задача. А мне нужны ответы на человеческие вопросы. С какой же стати ИХ задача вдруг полностью подменяет всеобщее представление о поиске в Интернете?

> "Семантическая Сеть" - может эта идея и не супер.
> Но она явно для людей, а не для роботов

Это как это - "явно"? Как учение Маркса, которое "вечно, потому что верно"? Знаете, мне больше Энгельс нравится. Он был образованным человеком все-таки.

> Мол резина колес без машины не поедет, а машина на ободах
> ехать может. Значит давайте ездить без резины

Некорректная аналогия. Мы тут говорим о таких шинах, которые сами выбирают, куда ехать. И если такие шины появятся, то да, лучше без них. Дорогу должен человек выбирать. Пусть лучше на ободах.

Кстати сказать, мои знакомые на тачках в Москве - уже достаточно несамостоятельные люди. Они зачастую вынуждены ломать свои планы, потому что "в это время в центре пробки" или "я не пью, я за рулем". Типичный случай, когда техника уже управляет людьми, а не наоборот. Подробнее тут:
http://www.fuga.ru/articles/2005/08/autocult.htm

> А траф сейчас вроде как для вас халявный.

С чего бы это? Мы платим за хостинг, как все нормальные люди. И нам вовсе не надо, чтобы наш хостинг нам сказал - платите больше, и за пауков тоже. Надо кстати у Кулина из "Петерхоста" спросить, не включили ли они уже новый тарифный план "Паучиный", чтобы ублажить "Вебальту" (кстати, кто-то в этом мире вообще пользуется "Вебальтой"?)

> правильно решили, что стоит показывать сверху сайты, которые лучше
> сделаны, которые имеют больше упоминаний искомых слов. И, вы не поверите,
> пользователи поисковиков тоже этого хотят

Нет, не поверю. Я ежедневно общаюсь с пользователями, которые пересылают друг другу то, что им действительно важно - в виде ссылок на простенькие блоги (ЖЖ) и корявенькие форумы. А вот ссылки на "хорошо сделанные сайты" я как-то редко вижу в употреблении.

Может, мы с вами общаемся с разными пользователеми? Я вообще в курсе, что пользователи из рекламных отделов офлайновых компаний действительно любят ссылки на хорошо оптимизированные сайты. Им ведь надо перед начальством отчитываться "посещаемостью". А то, что после первого клика человек с этого сайта сваливает, ни за что не зацепившись - это ведь не забота рекламщиков, верно?

22.09.2006 15:06 | пишет Phil Kulin | ссылка

Проблема же с Питерхостом - ну здесь уже все было про него сказано. И уж явно, Питерхост не основоположник запретов, а хостинг, не справляющийся с нагрузкой (первично - не справляется).

В данном случае Петерхост только есть транспортная компания. И это не Газель не справляется с перевозкой бетонных блоков, а просто для оной перевозки надо заказывать какой-нибудь МАЗ или Урал. Я уже на http://habr.ru писал, что как только среднестатистический клиент будет готов совершать оплату согласно потреблённым ресурсам, вопрос просто не будет стоять. Пока среднестатистический клиент не готов даже говорить о такой оплате и всё сводит к разговору о том, что его пытаются ободрать как липку, приходится на правах коменданта общежития решать вопрос своими силами.

06.09.2006 01:33 | пишет rewse | ссылка

Чудная статья.
Леха, снимаю шляпу! Респект.

06.09.2006 02:55 | пишет Виталий Бадмин | ссылка

о бедных поисковиках кто бы замолвил слово.
Что й то я не помню, что бы вирус ко мне какой залазил и предлагал воспользоваться Яндексом или Гуглей. Сам лезу, сам ищу. И так делают многие, очень многие. Есть спрос - есть предложение.
А поиск через блоги-рассылки-конференции и т.д. - эт сколько же мне надо перерыть как пользователю? А как создателю сайтов - эт сколько же мне надо попотеть, что бы в эти самые блоги-рассылки-конференции пробиться? Я пробовал - оптимизация проще и надежней. Поисковики - шанс для новичков.
Хотя последний апдейт Яндекса меня здорово уронил даже на самом белом и пушистом сайте - Яндекс рулит. И будет рулить :)

06.09.2006 10:46 | пишет rommka | ссылка

Лёха - всё правильно! У нас сайт время от времени падал по необъяснимой причине, пока не разобрались, что боты, сцуко, валили! Заблокировали нах большую часть - всё стало как часы.

06.09.2006 10:58 | пишет Гость | ссылка

С обязательными полями в стандарте произнесена великая йухня, - или вы не тот стандарт читали, или не поняли, что читали...

Про WebmasterWorld.com тоже недосказано: удивил, но не доступом только авторизваных ботов, а тем, что сначала полностью запретил сайт для ботов. Но очень быстро сообразил, что фигня вышла, - ботов таки пустили до "тела", только не всех, а авторизованых. Во всяком случае в выдачу Гугла сайт вернулся, и весьма быстро.

06.09.2006 15:13 | пишет Леха Андреев | ссылка

> или вы не тот стандарт читали, или не поняли, что читали

...или вы сами прочли невнимательно - потому что в статье указан конкретный стандарт конкретного сервиса, который может почитать любой, кто включится в партнерку "Яндекс.Новостей".

06.09.2006 11:07 | пишет Dr. Yankee Doodle | ссылка

Вот честно скажу: за всё время пользования Сетью ни Гугл, ни Яндекс ничем мне не помогли в серьёзных запросах, вроде поиска научной статьи на заданную тему. Ни разу!
А когда какую-нить развлекательную фиговину: о, пожалуйста!
Тьфу.:)

08.09.2006 11:34 | пишет Гость | ссылка

В СССР в очередной раз не бело секса...

06.09.2006 13:32 | пишет shootking | ссылка

Похоже, текст писался на лету, и это дает ему замечательную свежесть. И из него неизбежно родится манифест. А из манифестов рождаются, все знают что ))) Леха, спасибо.

06.09.2006 14:46 | пишет BuGaGa | ссылка

Да, статья мощная, респект.

Доносы или так называемый ручной отбор, может завалить чёрные дорвеи, но вряд ли завалит белые. Кроме того дорвеестроителям стоит немножко договорится и начать стучать на белые сайты, заявки эти обрабатываются людьми, а людские ресурсы в отличие от машинных ограничены, получим резкое замедление обработки заявок.
А потом разработаем робота который шлёт фальшиыфе заявки о поисковом спаме и дорвеях автоматом а они там пусть 200 лет с ними разбираются :))

Я согласен с тем, что дорвеи исчезнут только тогда, когда исчезнут поисковики, а до этого война будет бесконечной.

06.09.2006 17:18 | пишет решпект | ссылка

статья дельная, порадовал словарик сленгов - мерси!
http://daria.awardspace.com/

06.09.2006 18:01 | пишет CJDomino | ссылка

Статья рульная.Воспринимается именно как наезд конкретно на Яшу. И есть за что.С другой стороны - что вы хотите от сервиса , про который написано в любой книге по интернету? :) Я бы тоже себя крутым считал и условия всем диктовал.
Так что придется нам контент под ботов подстраивать и кормить семьи сотрудников Яндекса

06.09.2006 20:08 | пишет paralell | ссылка

А я для себя ту же идею в начале лета еще озвучил
и запретил всех в robots.txt
пока только для некоммерческих проектов, но...

06.09.2006 21:45 | пишет iseg | ссылка

В целом - весело. спасибо.

Жаль только, что очень примерному совпадению по времени независимых событий внутри Яндекса однозначно (и конспирологично) приписывается причинно-следственная природа. Но если нет никакой связи между новым антидорвейным автоматом и позавчершним сбоем трех роботных серверов, то построения сильно рушатся. За сбой мы извиняемся, починили его уже к вечеру, но к дорвеям и борьбе с ними он совершенно никаким боком не причастен (и наоборот).

06.09.2006 22:30 | пишет CJDomino | ссылка

Да ладно извинятся... Или че , доходы от рекламы упали :))))

07.09.2006 20:38 | пишет iseg | ссылка

яндекс существует 12 лет, а приносит доходы последние 4. ни люди ни их поведение ни их мотивация за это время не изменились. ни наше отношение к сбоям.

"ло аль ха лехем левадо" - как говорится в одной старой книжке.

07.09.2006 14:01 | пишет Леха Андреев | ссылка

Ну ладно, Илья, я все-таки умею различать корреляцию и причинно-следственную связь. В статье описана лишь корреляция, в терминах "Неужели?" и "Яндекс молчит". Никакой связи там не постулируется.

Однако само событие показалось мне подходящим поводом для того, чтобы рассказать общую историю: о ЗАВИСИМОСТИ от поисковиков. Даже если это был просто сбой - пример все равно работает на эту общую идею.

Ну и к тому же вы ведь действительно ничего не рассказываете людям. Приходится применять к вам стандартные научные методы для исследования скрытных животных. Гипотезы, экстраполяции и т.д.

07.09.2006 20:44 | пишет iseg | ссылка

Что значит, молчит? А вы разве спрашивали? Вот Вы ведь не спрашивая чего-то написали -- и в каком формате на это отвечать? Непонятно.

Насчет зависимости от роботов - согласен в целом с опасениями (и даже со стилем :-)). Главное, чтобы люди которые, за роботами стоят, были как можно "прозрачнее". Мы расказываем о себе довольно много, и в корпблоге и в личных блогах. Кто еще столько пишет про себя, как не яндексоиды?

07.09.2006 21:08 | пишет Леха Андреев | ссылка

> Кто еще столько пишет про себя, как не яндексоиды?

Я.

09.09.2006 03:43 | пишет Гость | ссылка

Жжошь! =)))

Ещё Быков много про себя пишет, да.

07.09.2006 01:03 | пишет Lermont | ссылка

Хорошая статья, интересная.
Только не могу во всём согласиться.

Как-то плохо в ней разделены "полнотекстовые транстляции", которые действительно не особо выгодны ресурсу (если абстрагироваться от факта, что распространение той или оной информации вам выгодно независимо от места, где пользователь её прочтёт) с обычными заходами роботов, набирающих индекс и в будущем приносящих халявный трафик на ВАШ сайт и позволяющий увеличить доходы с рекламы на вашем сайте.

Многие хорошие сайты получают с поисковиков 30-50% трафика (про доры молчим), а что в обмен получают поисковики?

Для большинства сайтов именно поисковики являются основным источником трафика -- каталоги, рассылки, банерообмен и прочее плетутся далеко позади. И ситуация имеет тенденцию к ещё большему уменьшению роли тех же каталогов, при ещё большем увеличении роли поисковиков (хоть есть и противоположенная тенденция что многие люди удовлетворяют все свои информационные и комуникативные потребности посредсвом посещения десятка или двух определённых сайтов и больше им ничего не нужно).

07.09.2006 09:12 | пишет CJDomino | ссылка

Что значит "что получают поисковики"? Сколько приносит Яше реклама яндекс директ , которая вставлена почти уже в выдачу? Другое дело , что качество поиска очень низкое. Яша пытается ситуацию улучшить , но все как всегда получается неуклюже , по тому как оптимизаторы тоже не дебилы и забьют рано или позно первую десятку выдачи тем чем надо им а не пользователям поисковика. С другой стороны это даже хорошо. Ведь только в конкурентной борьбе может родиться качественный и нужный пользователю продукт. А найти в яндексе то что вам нужно , с трудом , но всетаки можно. Даже когда доры забивают весь топ выдачи.

07.09.2006 18:17 | пишет Lermont | ссылка

Имелось ввиду -- что они требуют взамен этого трафика с владельца сайта. Вопрос, что они получают вообще -- не рассматривается.

07.09.2006 15:23 | пишет Юрий ака geraxe | ссылка

ab -n 10 http://webplanet.ru/
This is ApacheBench, Version 1.3d apache-1.3
Copyright (c) 1996 Adam Twiss, Zeus Technology Ltd, http://www.zeustech.net/
Copyright (c) 1998-2002 The Apache Software Foundation, http://www.apache.org/

Benchmarking webplanet.ru (be patient).....done
Server Software: Apache/2.0.54
Server Hostname: webplanet.ru
Server Port: 80

Document Path: /
Document Length: 39953 bytes

Concurrency Level: 1
Time taken for tests: 141.507 seconds
Complete requests: 10
Failed requests: 0
Broken pipe errors: 0
Total transferred: 404040 bytes
HTML transferred: 399530 bytes
Requests per second: 0.07 [#/sec] (mean)
Time per request: 14150.70 [ms] (mean)
Time per request: 14150.70 [ms] (mean, across all concurrent requests)
Transfer rate: 2.86 [Kbytes/sec] received

Connnection Times (ms)
min mean[+/-sd] median max
Connect: 0 1 0.0 1 1
Processing: 3282 14150 10377.1 12206 37436
Waiting: 3281 14149 10377.1 12206 37435
Total: 3282 14151 10377.0 12207 37436
ERROR: The median and mean for the initial connection time are more than twice the standard
deviation apart. These results are NOT reliable.

Percentage of the requests served within a certain time (ms)
50% 12207
66% 12664
75% 17912
80% 25852
90% 37436
95% 37436
98% 37436
99% 37436
100% 37436 (last request)

Я смотрю боты вас совсем достали.. Все силы на отбивание от них уходят =)

07.09.2006 19:07 | пишет Виктор Галенко | ссылка

Зато новости там кастрированные - без наших гипер-ссылок на описываемые проекты, без комментариев, иногда просто вообще обрезки какие-то без указания источника... Но бедный робот вынужден собирать этот мусор, все эти новостные дорвеи вместо оригиналов, потому что так велел хозяин!

Супер! Более точно описать Я-Новости не удалось никому. Андрееву респект!

08.09.2006 10:58 | пишет Mover | ссылка

Спасибо огромное за статью! Читал и плакал. =) От радости...
Надо же так точно передать всю мою деятельность, которой я занимаюсь почти 4 года на сайте "Законодавство України" (http://zakon.rada.gov.ua)?! Просто в шоке, если честно.
Одно радует, много умных и опытных людей, помогавших мне, и которым я доверяю, думают именно так же, как Вы - автор этой статьи. Для меня это значит, что я буду теперь больше Вам доверять. =) А доверие - это то, что дизайном не купишь! Доверие в инете - самое ценное, после контента. А может и перед... кто знает? Лично я меняю свою лояльность к сайтам на полезную информацию, которую хочу от них получить. И чем больше мне источник даёт нужной информации, тем я чаще его посещаю. Я также заметил, что аналогично действует большинство моих пользователей. Единственный способ влиять на посещаемость сайта - отдавать или не отдавать интересный контент. А все ссылки-обменники и прочие рекламные кампании, и даже поисковики, не приносят постоянного и существенного (лояльного) трафика. Мне к тому же пришлось бороться с другими роботами, не только поисковыми, а и наглыми воришками, которые за счет нашего сайта пытались составлять свои коммерческие базы данных. Хотя поисковики - это те же комерсанты, они берут наш контент, выдают за свой и насыщают его рекламой. Жуть! Как капитализм в наихудшей его форме. Они совершенно не заботятся о тех людях, кто размещает информацию, и тем самым отдают частичку себя. Поисковики - как "черные дыры" Интернета!!! Заглатывая информацию, они удерживают её в себе и всё, что проходит рядом - искривляется. Поэтому всякая глобализация имеет две стороны: видимую хорошую - её не немного, и невидимую плохую - подводные камни есть у каждого блага. Точнее любое благо можно использовать во вред. Я сейчас пытаюсь описать теорию, что "Информация - это энергия, и к ней применимы почти те же принципы и законы, как и для любой другой энергии". Если кому интересно - милости прошу в свой блог: http://info-energy.blogspot.com

08.09.2006 11:03 | пишет Юpий Синoдов | ссылка

Ну, собственно можно не иметь ни одного человека своей аудитории, и тем не менее зарабатывать бабло. Пример - дорвеи.

10.09.2006 14:38 | пишет CJDomino | ссылка

Какое то время доры еще будут приносить деньги. Но будущее за белыми сайтами с адекватным человеческим постоянно обновляющимся контентом.Аудитория таких сайтов невольно сделает им белую оптимизацию.Я сам уже начал действовать в этом направлении и скажу вам ,что хороший белый сайт по отдаче не хуже любого топового дора. Правда это конечно намного более трудоемкий процесс (не два скрипта написАть :) ) Но что делать... Селяви

12.09.2006 12:25 | пишет Андрей | ссылка

Почитал статейку. Повеселился... Автор заявляет, что о проблемах защиты от роботов у нас только начали задумываться. Он просто не знает реальности.
Оно и понятно - защита более надежна, если о ее существовании никто не догадывается, пока не нарвется.

Я - главный программист сети порталов Preiskurant.ru.
Наши порталы еще с 2002 года используют оригинальную систему защиты от "нежелательных" роботов. Система весьма простая, но эффективная. Работает на эвристическом принципе, что позволяет отлавливать даже новых роботов.
К слову сказать, упомянутый в статье робот "Вебальты" только недавно перестал блокироваться системой.

30.01.2007 02:08 | пишет не Робот | ссылка

Интересно. Вот только про Quintura - зря. Я поначалу тоже воспринял как игрушку, но когда ни гугль ни яндекс не смоглди меня порадовать чудесами релевантности, а редкую вещь инфу ну очень надо было найти, я сделал как все почти отчаявшиеся люди, что обращаются к колдунам - взялся за "дрессировку" куинтуры, причём онлайновой её версии. Факт в том, что через пять минут инфа была найдена.
Вывод. Делая такое серьёзное исследование, как ваше, невольно позволяешь себе неточности в мелочах - а большинство просто и не станет проверять, вам доверятся, как эксперту. Далее - по Сент-Экзюпери, если хотите...

22.01.2008 14:53 | пишет Гость | ссылка

Человечество обречено, роботы победят.

Киборги, изначально будут на стороне людей, но вовремя переметнутся на сторону роботов когда дела у людей станут совсем плохи.

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost