Новая программа определяет пол и возраст пользователя Twitter
Источник:
Зеркало неделиГолландцы разработали программу, которая на основе сообщений в "Твиттере" определяет возраст пользователя. Погрешность составляет 4 года. Чтобы определить возраст, программе нужно проанализировать около 200 твитов.
В основу программы положен анализ сообщений 3000 twitter-пользователей. Признаки пользователя определяют по тому, какую лексику он употребляет, в какие часы чаще твитит, ставит запятые и тому подобное.
Один из разработчиков программы Донг Нгуен рассказал об особенностях различных аудиторий, которые уже определила их программа:
"Наш анализ показал, что разница между мужчинами и женщинами достаточно стереотипная. Проще говоря, мужчины чаще говорят о футболе и политике, женщины - о ногтях... Молодые пользователи чаще говорят о себе самих и используют много смайликов".
Также молодые пишут очень эмоционально.
Между тем пользователи, которым уже исполнилось 30, более сдержанные, не бросаются в крайности, употребляют сложную лексику и могут твитить о нетипичных темах.
На данный момент программа приспособлена только к голландскому языку.
Кстати, одним из лидеров американского "Твиттера" является именно пожилой мужчина. Его сын завел аккаунт, где постит только высказывания своего отца. Они настолько остроумные, что их фоловят уже 3 миллиона человек.