Создана программа, определяющая пол и возраст twitter-блогеров
Голландские программисты из Университета города Твенте разработали онлайн-программу, способную довольно точно определять пол и возраст пользователя соцсети Twitter, анализируя его сообщения в соцсети, сообщает
"Зеркало недели" со ссылкой на CyberSecurity.
Разработчики говорят, что недавно завершили тестирование программы на базе из 3000 twitter-пользователей, которые регулярно отправляли в соцсеть короткие сообщения на разные темы. В программе была создана база знаний, которая при помощи синтаксического, семантического, словарного и иных типов анализа выявляла половую и возрастную принадлежность отправителя сообщений.
Разработчики говорят, что программе для довольно четкого определения необходимо проанализировать около 200 твитов пользователя и после этого оператор программы может просто ввести ник пользователя, а программа выдаст информацию о том, что может скрываться за этим псевдонимом.
"Наш анализ показал, что разница между блогерами мужчинами и женщинами довольно стереотипна. Проще говоря, мужчины чаще говорят о футболе и политике, женщины - о ногтях", - говорит Донг Нгуен, один из разработчиков программы. "С позиции возраста, молодые пользователи чаще говорят о себе самих и используют много смайликов, тогда как возрастные пользователи применяют более сложные словарные обороты и чаще говорят на нетипичные темы".
Кроме того, Нгуен говорит, что по своей природе твиты молодых пользователей более эмоциональны, часто имеют крайне позитивную или крайне негативную окраску, что редко встречается у пользователей старше 30 лет.
Пока программа анализирует твиты только на голландском и имеет относительную погрешность в 4 года при выявлении возраста.
Подписывайтесь на нас в соц. сетях