Предсказания по газетам

25.09.2011 14:39 медиа, наука и жизнь, технологии

Суперкомпьютер Nautilus ретроспективно обнаружил логово Усама Бен Ладена по материалам мировой прессы. Для этого на специальной сетке фиксировалась частота упоминания имени террориста номер один с географической привязкой к городам и странам, а результатом работы стала карта с хорошо заметным сектором на севере Пакистана.

Источниками данных для проекта послужили информационные базы Open Source Center и Summary of World Broadcasts с новостными заметками за 1979—2011 года. 100 миллиардов статей позволили проверить алгоритм и на более сложных задачах, требующих фиксации устойчивых семантических конструкций в информационных текстах. Так, по характеру газетных материалов и заметок новостных лент, оказалось возможным предсказать египетскую революцию или этнические конфликты на Балканах за недели, и даже месяцы до их начала.

К сожалению, пока исследователям не удается использовать тексты социальных сетей с их перегруженностью сленгом. Серьезные проблемы возникают и с тотальной цензурой некоторых стран. Возможно, поэтому результаты пока не столь впечатляющи. Но автор проекта, исследователь из Университета Иллинойса Калев Лиитару, не унывает и призывает вспомнить, с чего начинались столь ныне привычные предсказания погоды.

Автор — Михаил Петров.

Предыдущая заметка:
 
Следующая заметка: