Угроза для Порошенко: разработан алгоритм определения «пьяных» записей в соцсетях
Разработчики из Рочестерского университета во главе с Набилом Хуссейном создали алгоритм, который позволяет отслеживать «нетрезвую» активность пользователей. Об этом пишет Technology Review.
С 2014 года Хуссейн и его команда отслеживали записи с геотегами, которые могли быть сделаны пользователями в нетрезвом состоянии. Их отбирали по ключевым словам, таким как «пьяный», «пиво», «вечеринка» и так далее. Затем при помощи специального сервиса они отфильтровывали только те твиты, которые имеют отношение к непосредственному употреблению алкоголя.
Такие записи отбирали по следующим критериям: говорится ли в твите об употреблении спиртного, сказано ли в нем о том, что спиртное употребляет сам автор записи, и была ли запись опубликована во время и в месте распития. В процессе поиска «пьяных» твитов программа постоянно учится распознавать такие записи, исходя из их содержания.
Разработчики также создали алгоритм, который позволяет с большой точностью определять, откуда пользователь пишет «пьяные» послания. Исследователи учитывали, откуда блогер пишет чаще всего, откуда он обычно пишет в период между часом ночи и шестью часами утра и где он находился, отправляя последний пост за день. Кроме того, они научили программу распознавать слова и фразы, которые могли бы указывать на то, что пользователь пишет из дома. К таким фразам относятся, например, «наконец-то я дома!».
Всего было обработано около 11 тысяч записей в «Твиттере». При помощи геотегов они отбирали твиты, опубликованные на территории Нью-Йорка и округа Монро (пригородная территория). Выяснилось, что в Нью-Йорке больше народу пишет «пьяные» сообщения. Но это объясняется, в частности, густонаселенностью большого города. Также удалось установить, что горожане чаще выпивают дома или на расстоянии сотни метров от дома, тогда как жители пригорода чаще всего употребляют спиртное на расстоянии более километра от дома.
В будущем исследователи благодаря твитам намерены выяснить, как потребление алкоголя связано с полом, возрастом и национальностью потребителей. Они уверены, что их работа поможет властям в решении вопросов общественного здравоохранения.

Выделите любой фрагмент прямо в тексте статьи и нажмите Ctrl+Insert
Мы весьма признательны всем, кто использует наши тексты в блогах и форумах. Пожалуйста, уважайте труд журналистов: не перепечатывайте в блогах статьи целиком (они всегда доступны по этому адресу), не забывайте ставить ссылки на полный текст на нашем сайте.
|
||||