Ученые из Рочестерского университета в США разработали алгоритм, который способен распознавать записи, посланные в твиттер в нетрезвом виде. За основу исследователи взяли одиннадцать тыс. твитов с привязкой к GPS-координатам, которые были представлены в Нью-Йорке и округе Монро за последний год, а потом отфильтровали их по наличию ключевых слов, связанных с выпивкой (" пьяный", " пиво", " вечеринка" и Т. Д.).
Потом команда, возглавляемая Набилом Хоссейном, обратилась за помощью к краудсорсингому сервису Amazon Mechanical Turk, участники которого позволили выяснить, и в правду ли пользователи были пьяны, когда постили записи в твиттер, либо просто писали о выпивке.
Выработанная американскими учеными методика также позволила вычислить, кто распивал спиртные напитки у себя дома (на основе фраз " наконец-то дома!", " ванная", " диван" и др.), а кто — в иных местах с точностью 80%. К примеру, как оказалось в итоге сопоставления твитов с точками продаж алкоголя, большая часть жителей Нью-Йорка пьянствует в 100 метрах от дома, а жители округа Монро — Более чем в километре.
Ближайшая задача ученых — узнать, как привычка употребления спиртного меняется в зависимости от пола, возраста и национальной принадлежности. Вклад нового алгоритма в изучение влияния алкоголя на здоровье, может быть, поможет предотвратить инциденты и несчастные случаи, связанные с ведением нетрезвого образа жизни.