|
РАЗДЕЛЫ
Архив
|
Е-книги породили "культуромику" и "цитатную слежку"≡ Исследования | Новости | 17.12.2010 18:57 Проекты оцифровки книг дали побочный результат в виде новой науки, которую её создатели окрестили . Обширная база данных позволяет изучать изменения печатной речи на протяжении десятков и даже сотен лет и оценивать влияние на неё различных факторов, например, цензуры с математической точки зрения, журнал Science. В базе данных Google сейчас 15 миллионов оцифрованных книг, что составляет примерно 12% от общего числа книг, которые были когда-либо напечатаны на каком-либо языке со времён создания печатного станка. Содержимое этих книг было уложено в другую базу данных, построенную на n-грамм-модели, к которой был предоставлен доступ гарвардским исследователям. Всю эту массу информации можно изучать самыми разными способами. Например, можно выяснить, насколько часто употреблялось то или иное слово или имя в тот или иной период в литературе той или иной страны. И учёные уже получили ряд результатов. Например, они выяснили, что за последние сто лет количество английских слов почти удвоилось. Открыли, что примерно половина напечатанных английских слов отсутствует в каком-либо словаре. Убедились, что во времена нацизма из германской литературы практически исчезли имена известных деятелей науки и культуры еврейского происхождения. Узнали, что у человечества постепенно пропадает интерес к Зигмунду Фрейду, и что с 2005 года людей больше интересует Чарльз Дарвин. Самое примечательное, что всё это (точнее, не всё, а только треть — примерно 5,2 млн книг) теперь может "пощупать" любой желающий с помощью онлайн-инструмента , разработанного в Лаборатории Google. К примеру, можно оценить частоту использования слова "" в русскоязычных книгах с 1920 по 2008 годы или же убедиться в том, что в СССР вплоть до перестройки. Как можно заметить, технология очень напоминает анализ поисковых запросов и цитируемости в сетевых публикациях, что позволяет отслеживать новые тенденции в обществе либо персональные вкусы пользователей для таргетированной рекламы. Среди любопытных стартапов такого рода - компания Tynt, которая из сетевых публикаций - например, когда пользователь копирует себе в блог наиболее понравившийся кусок статьи или новости. Это позволяет оценить, какие части публикации наиболее удачны - а заодно и узнать побольше о самом пользователе. комментарии(1) | разделы: Новости | Исследования Материалы по теме Из Google Book Search изъяли европейские книги Другие новости |
Последние комментарии
Гость про Суд велел "Твиттеру" сдать сторонников WikiLeaks (12)
Гость про Книгоиздатели начали судиться с торрентами (2)
l_e_x_a про "ВКонтакте" принудительно протестирует пользователей (35)
andrey_kadetov про Google назвал Facebook "ловушкой без выхода" (6)
volv про День папуасского робошахтёра (14)
l_e_x_a про Русские кликботы признаны самыми активными (11)
все комментарии looli спрашивает: Земля вампиров смотреть онлайн в HD качестве looli спрашивает: Зеленый Фонарь смотреть онлайн в HD качестве looli спрашивает: Защитник смотреть онлайн в HD качестве looli спрашивает: Запретная зона смотреть онлайн в HD качестве looli спрашивает: Закон доблести смотреть онлайн в HD качестве looli спрашивает: Вышибала смотреть онлайн в HD качестве looli спрашивает: Встречный ветер смотреть онлайн в HD качестве looli спрашивает: Все любят китов смотреть онлайн в HD качестве |
Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.