|
РАЗДЕЛЫ
Архив
|
Тысяча мух распознают отсканированную книгуИсследователи из предлагают использовать тест Тьюринга и энергию толпы на пользу электронным библиотекам. Для отличия людей от ботов на многих современных сайтах используется Associated Press. Бессмысленное расходование человеческих ресурсов предложено заменить на решение полезной прикладной задачи - распознавание книг для электронных библиотек. Ни одна система распознавания текста (OCR) на данный момент не может обеспечить абсолютно точное распознавание всех слов - на книгах может находиться грязь, буквы могут быть частично стерты или зашумлены. Прочитать такой участок может лишь человек. Университет разработал , которое разделяет нераспознанный участок текста на отдельные слова и отдает на веб-страницы, вместо обычных "картинок с кодовым словом". Тонкость заключается в том, что во время теста пользователю нужно ввести два слова. Одно из них, уже известное системе, используется для проверки, робот это или человек (как обычная CAPTCHA), а второе слово - действительно "зашумленное". Распознавание этого слова и идет на благо библиотек. Наиболее распространенный вариант распознавания система принимает как верное значение распознаваемого слова. Решение имеет законченный вид и уже подготовлено все программное обеспечение для размещения на веб-сайтах. Модуль выполнен с поддержкой всех современных средств CAPTCHA - обновлением нечитаемой картинки и озвучкой изображения. Сразу же после рассмотрения проекта возникает закономерный вопрос борьбы с ботами, которые уже проходят простые тесты Тьюринга. Если с заранее известным словом они справятся успешно, а на втором они будут указывать неверное значение, то весь проект станет бессмысленным - количество обращений роботов к CAPTCHA в разы выше, чем настоящих пользователей. комментарии(0) | Материалы по теме Феномены интернета: обратный тест Тьюринга Другие новости |
Последние комментарии
Гость про Суд велел "Твиттеру" сдать сторонников WikiLeaks (12)
Гость про Книгоиздатели начали судиться с торрентами (2)
l_e_x_a про "ВКонтакте" принудительно протестирует пользователей (35)
andrey_kadetov про Google назвал Facebook "ловушкой без выхода" (6)
volv про День папуасского робошахтёра (14)
l_e_x_a про Русские кликботы признаны самыми активными (11)
все комментарии april1983 спрашивает: Bosch по-прежнему выбирает Elkalub! saotron2012 спрашивает: Стоит ли делать выбор в пользу терминала сбора данных Symbol / Motorola MC3090 1nep спрашивает: «Риски эстетической медицины». april1983 спрашивает: iConText навстречу социальным проектам divostroi отвечает: Мнение о портале? agguggs отвечает: «Красота в Интернете» нашла свою аудиторию. Отчет о конференции. etosvet спрашивает: Интернет-магазин http://www.etosvet.ru max отвечает: Как вам этот сайт? |
Copyright © 2001-2012 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.