Медиа, Наука и жизнь, Технологии Предсказания по газетам

Автор: Михаил Петров
25.09.11 14:39

Суперкомпьютер Nautilus ретроспективно обнаружил логово Усама Бен Ладена по материалам мировой прессы. Для этого на специальной сетке фиксировалась частота упоминания имени террориста номер один с географической привязкой к городам и странам, а результатом работы стала карта с хорошо заметным сектором на севере Пакистана.

Источниками данных для проекта послужили информационные базы Open Source Center и Summary of World Broadcasts с новостными заметками за 1979–2011 года. 100 миллиардов статей позволили проверить алгоритм и на более сложных задачах, требующих фиксации устойчивых семантических конструкций в информационных текстах. Так, по характеру газетных материалов и заметок новостных лент, оказалось возможным предсказать египетскую революцию или этнические конфликты на Балканах за недели, и даже месяцы до их начала. 

К сожалению, пока исследователям не удается использовать тексты социальных сетей с их перегруженностью сленгом. Серьезные проблемы возникают и с тотальной цензурой некоторых стран. Возможно, поэтому результаты пока не столь впечатляющи. Но автор проекта, исследователь из Университета Иллинойса Калев Лиитару, не унывает и призывает вспомнить, с чего начинались столь ныне привычные предсказания погоды. 

Этому блогу больше 15 лет — за это время многие сайты, на которые я ссылался, перестали работать. Подпишитесь на мою научную рассылку Hypertextual — там много более актуальных материалов.