Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июль 2020  
пн вт ср чт пт сб вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          

Google поделится своим индексом

Вебпланета
Сервисы | Новости | 07.08.2006 18:09

На днях стало известно о новой затее Google, которая для многих стала полной неожиданностью. Сотрудники поискового гиганта решили особым образом проанализировать информацию, содержащуюся на проиндексированных страницах.

Специалисты подвергли тщательному анализу свыше триллиона (если быть точным - 1 011 582 453 213) слов, в результате чего был составлен список цепочек из пяти слов, которые встретились как минимум 40 раз. Всего таких цепочек получилось более миллиарда, а если, опять-таки, быть точным, то 1 146 580 664 штуки.

В этих «предложениях», которые таковыми можно назвать весьма условно, участвуют 13 653 070 различных слов, не считая тех, что встретились менее 200 раз. Вся эта информация поместится на 6 DVD-дисках (которые легко умещаются в карман куртки), а приобрести их можно будет в ближайшем будущем.

Полученную в ходе трудового подвига «гугловцев» информацию можно будет использовать при создании систем машинного перевода, проверки правописания и грамотности, сообщают сотрудники проекта, Алекс Франц и Торстен Брентс.

разделы: Новости | Сервисы

Другие новости

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost