Анализ сообществ в социальных сетях: как оценить скрытые данные ВКонтакте. Читайте на Cossa.ru

В этом разделе материалы размещаются пользователями сайта и публикуются после одобрения модератором. Редакция не несет ответственности за орфографические и другие ошибки, хотя и старается исправлять их по мере возможности.
Добавить свою заметку вы можете на этой странице.
03 сентября 2013, 08:33

Анализ сообществ в социальных сетях: как оценить скрытые данные ВКонтакте

Анализ подписчиков пабликов и групп в социальных сетях сегодня привлекает многих специалистов. Что можно извлечь из сообщества, когда многие данные скрыты политикой приватности?

Представители технологических гигантов один за другим рассказывают о Big DataBusiness IntelligenceGraph theory, говорят, что все обо всех знают и могут рассказать о человеке если не все, то очень многое. Почитав новости, блоги и пресс-релизы, возникает естественное желание получить такую информацию о своих клиентах. Кроме того, интерес вызывает большая база подписчиков сообществ в социальных сетях которые уже собрались в группы по интересам. Но что можно получить из социальных сетей, когда пользователи скрывают большинство своих данных? В этой статье речь пойдет о том как можно использовать публичную информацию для восстановления скрытой.

МегаФон ПроБизнес

Получите Кешбэк 100% за запуск рекламы с МегаФон Таргетом!

Узнать больше >>

Реклама. ПАО «МегаФон». ИНН 7812014560. ОГРН 1027809169585

Рассмотрим возраст подписчиков паблика Cossa в ВКонтакте (35538 подписчиков на 03 сентября 2013 года). Паблик не развлекательный и имеет выраженную профессиональную ориентацию на SMM, который, в свою очередь, достаточно молодое направление. По-видимому, возрастное распределение (ВР) должно описываться нормальным законом с математическим ожиданием в диапазоне 20-30 лет. Построим ВР для тех подписчиков, которые указали и не скрыли дату рождения.

standard analysis

Как видно на графике Age distribution, более 60% подписчиков не указали или скрыли свой возраст (значение n/a). Оставшихся же чуть менее 40% должно вполне хватить для оценки возрастного распределения. Однако, на полученном распределении ярко выражена доля 14-15-летних мальчиков и девочек – она такая же, как и 21-летних, в большинстве своем студентов старших курсов, и 28-летних, очевидно, «зрелых» SMM специалистов! Почему так? По-видимому, может быть, как минимум, три причины:

1) Популярное нынче мнение, что ВКонтакте – синоним слов «школота», музыка, и «боты». А те, кто старше и солиднее, пользуются Facebook и, соответственно, не влияют на ВР.

2) Раннее профессиональное «созревание» молодых.

3) 60% подписчиков, не указавших свой возраст, могут сильно изменить представленное распределение. Становиться очевидным, что наиболее точное распределение может получить лишь тот, кто имеет доступ к скрытой информации. Кстати, тоже популярное сегодня мнение.

Первые две причины могут вызвать длинные дискуссии, поэтому перейдем сразу к третьей. Как можно оценить возраст человека по его странице в социальной сети, если законно достать закрытую информацию возможности нет и мы не являемся владельцами/администраторами социальной сети? Определить возраст по фото – наиболее простой способ для человека (хотя и с существенной погрешностью), но сложен для автоматизации. Контент на стене – сложный метод не только для компьютера, но и для человека. И, наконец, рассмотрим вариант по друзьям – «скажи мне кто твой друг и я скажу кто ты»!

Положим, что большая часть друзей пользователя социальной сети – это сверстники или люди, интересы которых совпадают с интересами пользователя. Рассчитав средний возраст друзей человека, можно оценить возраст этого человека.  Таким образом, ВР для Cossa в ВКонтакте будет выглядеть:

extended analysis

Теперь доля подписчиков с невосстановленным возрастом составляет ~12% – в большинстве своем это заблокированные пользователи, у которых закрыт доступ к спискам друзей. Отметим, что характер распределения сильно изменился – молодые школьники уже совсем не выделяются на фоне более старших подписчиков. Основной же возраст интересующихся новостями Cossa в ВКонтакте – это 23-27 лет. Стоит обратить внимание на два скачка для возраста 17 и 23 лет, которые, скорее всего, связаны с окончанием школы и ВУЗа соответственно – выпускники подписываются на паблики по профилю учебы и работы. Экспоненциальный спад после 27 лет, по-видимому, объясняется возрастом пользователей в ВКонтакте.

Нужно сказать, что полученное ВР не является распределением биологического возраста – скорее распределением возраста интересов и будет говорить об интересах подписчика. Например, 45-летний преподаватель ВУЗа добавляет в список друзей своих студентов с целью информирования о предстоящих зачетах/экзаменах. Очевидно, что возраст такого пользователя будет определен в диапазоне 18-23 лет. Однако, несмотря на существенную погрешность, восстановленный возраст будет достаточно точно характеризовать интерес пользователя и ему будет интересен материал о, например, международных студенческих программах.

Рассмотренный метод оценивания возраста пользователя показывает, как публично доступная информация из социальной сети может быть использована для косвенной оценки скрытых данных. Вообще говоря, обработка всех доступных данных со страницы (активность в группе, стена, аудио, фото, видео и т.д.) позволяет определять не только возраст/географию, но и тип пользователя – читатель, меломан, заинтересован в бренде, бот.

Телеграм Коссы — здесь самый быстрый диджитал и самые честные обсуждения: @cossaru

📬 Письма Коссы — рассылка о маркетинге и бизнесе в интернете. Раз в неделю, без инфошума: cossa.pulse.is

✉️✨
Письма Коссы — лаконичная рассылка для тех, кто ценит своё время: cossa.pulse.is


Вход на cossa.ru

Уже есть аккаунт?
Авторизуйся через VK:
Vkontakte
Не забудьте написать email на странице своего профиля для управления рассылкой