Медиа, Наука и жизнь, Технологии Предсказания по газетам

25.09.11 14:39

Суперкомпьютер Nautilus ретроспективно обнаружил логово Усама Бен Ладена по материалам мировой прессы. Для этого на специальной сетке фиксировалась частота упоминания имени террориста номер один с географической привязкой к городам и странам, а результатом работы стала карта с хорошо заметным сектором на севере Пакистана.

Источниками данных для проекта послужили информационные базы Open Source Center и Summary of World Broadcasts с новостными заметками за 1979–2011 года. 100 миллиардов статей позволили проверить алгоритм и на более сложных задачах, требующих фиксации устойчивых семантических конструкций в информационных текстах. Так, по характеру газетных материалов и заметок новостных лент, оказалось возможным предсказать египетскую революцию или этнические конфликты на Балканах за недели, и даже месяцы до их начала.

К сожалению, пока исследователям не удается использовать тексты социальных сетей с их перегруженностью сленгом. Серьезные проблемы возникают и с тотальной цензурой некоторых стран. Возможно, поэтому результаты пока не столь впечатляющи. Но автор проекта, исследователь из Университета Иллинойса Калев Лиитару, не унывает и призывает вспомнить, с чего начинались столь ныне привычные предсказания погоды.

Автор – Михаил Петров.

Понравилась заметка? Получайте еженедельный дайджест наших лучших материалов: