Жизнь и боль аналитики медийного контекста

5 сентября 2016, 13:05
0

Жизнь и боль аналитики медийного контекста

Контекстный анализ традиционных СМИ и социальных медиа, есть ли разница? Да. В статье — пять отличий и болей контекстного анализа.

Чем отличается контекстный анализ традиционных СМИ и социальных медиа? Если вы задаетесь этим вопросом, то уже опережаете специалистов, которые убеждены в том, что подход к мониторингу абсолютно одинаков для обоих случаев. Наш опыт подтверждает обратное.Глава нашего аналитического отдела Светлана Подгорная рассказала о пяти основных отличиях контекстного анализа.

История о том, зачем медийному контексту нужны отдельные аналитики

Технологии непрерывно развиваются, вместе с ними не стоят на месте и инструменты медиа-анализа. Автоматизированный мониторинг и анализ соцмедиа существует около 6 лет, анализ СМИ  больше 20.Это два совершенно разных и уникальных инструмента. И нужны оба. Но есть одно НО….

О чем мы говорим, если многие до сих пор не знают, что такое медийный контекст?

Эта история имеет три предисловия.

Первое предисловие — веселое.

Я ходила на встречу с адептами Programmatic: мне была интересна их Data. Тогда они, узнав, чем я занимаюсь, впервые открыли для себя контекстный анализ.

- А ты чем занимаешься?

- Аналитикой. Контекстной аналитикой... 

- На контекст уже заводят отдельных аналитиков?

 И тут я понимаю, что они о контекстной рекламе, а я — о медийном контексте, о том, где буквы и слова…

- Ты тот самый человек, который все эти статьи читает?! И у тебя кровь из глаз не идет?! 
- Ну… да, и соцмедиа еще. Знаю, где и что читать, понимаю, как отделить то, на что надо обращать внимание, от того, на что не надо.

Их восхищенное и удивленное: «Серьезно?! Вот это у тебя работа!» — повергло меня в недоумение. С лицом, на котором невооруженным взглядом читается растерянность, я начинаю рассказывать о временах, когда земля была маленькая и по ней бегали динозавры, то есть про эру до соцмедиа, до Яндекс.Новостей, до поисковых систем и в целом до интернета. Рассказываю, как тогда «добывали» и обрабатывали информацию, которую сейчас можно получить буквально за пару кликов. В процессе меня ни на минуту не покидает чувство, что мы как будто существуем в двух параллельных реальностях. Вроде бы, я пришла за их Data, их способами получения информации и их картиной мира, чтобы дополнить свою, — а они о моей даже не подозревают.

Второе предисловие — философское. Как-то я рассказывала об аналитике в социальных медиа на одном из профильных образовательных курсов. Большая часть слушателей были представителями небольших интернет-бизнесов, в основном связанных с прямыми продажами. Способы выявления информационных атак, боты и особенности анализа площадок в соцмедиа — я понятно и подробно рассказывала обо всем этом, а в ответ получила вопрос: «Оке, круто, а зачем оно нам надо?»

Третье предисловие — сугубо практическое. Сегодня мы получаем всё больше интегрированных запросов, когда клиенту необходимо провести аудит и по СМИ, и по социальным медиа. Также нам приходилось сталкиваться и  с ситуацией, когда клиент у нас заказывает аудит социальных медиа и параллельно у другого подрядчика - аналогичный аудит по СМИ.Форматом и итогами проведённого нами исследования заказчик полностью удовлетворён, однако, ему не сразу до конца ясно,почему у коллег при аудите по СМИ данные представлены за год, а у нас только за три месяца, почему их показатель ИИБ нельзя сравнить с нашим ER, почему информационные всплески в СМИ и соцмедиа не совпадают. Стало очевидно, что эти явления необходимо объяснять подробно — на пальцах.

5 «болей» аналитика медийного контекста

Сегодня материалы в СМИ собирают публичные агрегаторы: Яндекс.Новости,  Рамблер,Mail.ruи коммерческие базы мониторинга и анализа: Медиалогия, Интегрум, Паблик и другие. Русскоязычные социальные медиа в открытом доступе агрегируют Яндекс.Блоги, Google-блоги и коммерческие системы мониторинга Brand AnalyticsYouscanIQBuzzи другие. В открытом доступе Яндекс.Новости выдают информацию за несколько лет, Яндекс.Блоги — всего за два месяца. Получается, по трудозатратности анализ социальных медиа пока сложнее и дороже за счет большего количества ручной обработки, но отказаться от этого массива информации сложно и зачастую невозможно.

Боль 1. Объемы информации

Яндекс.Новости агрегируют 100 тыс. материалов СМИ  в сутки. А по данным одной из систем мониторинга и анализа Brand Analytics, в социальных медиа создается около 40-45 млн сообщений в сутки.

Боль 2. Доступ к ретроспективе

Базы мониторинга СМИ работают по принципу электронной библиотеки — физически выкачивают все статьи в каталог и открывают к ним доступ, как в библиотеке данных. Базы мониторинга соцмедиа также выкачивают информацию, но ее поиск происходит, как у поисковиков: то, что загружено недавно, найдется быстрее и в более полном объеме, чем то, что загружено год назад. То есть к выкачанному архиву СМИ можно задать поисковый запрос и получить почти мгновенно все статьи за год. А для соцмедиа другой принцип: можно получить все статьи за вчера, большую часть за прошлые 2-3 месяца, около 60% — за 6-9 месяцев и только около 40% за прошедшие 10-12 месяцев. В основном, базы по мониторингу соцмедиа предоставляются бесплатно в рамках пакета платных услуг за 1-2 месяца, а остальное — за деньги (чем глубже ретроспектива, тем дороже), или за 1-2 года, но с гарантией выдачи только 15-30% всего контента.Tакже есть варианты дополнительной оплаты за сбор ретроспективы в рамках стандартного пакета услуг. Процесс сбора контента весьма трудоёмкий, и при этом качество от базы к базе ощутимо разнится. Поэтому здесь важно учитывать все нюансы и уметь оптимально сочетать разные методики для получения наилучшего результата.

Боль 3. Сбор массива данных

Для того, чтобы что-то проанализировать, надо что-то найти. Чтобы что-то найти, надо провести предварительный анализ по выявлению нейминга. Для СМИ надо просто задать объект, потому что, как правило, статьи пишут, соблюдая нормы русского языка и указывая полностью объекты публикации, используя официальные названия или самоназвания объектов (персоны, компании, события и т.п.). В соцмедиа пишут, как бог на душу положит…

Боль 4. Определение смысла, тематики и тональности написанного

Во многих системах анализа СМИ есть группирование по информационным поводам, например, по сюжетам в Яндекс.Новостях. Там можно выгрузить стандартный отчет и отдать заказчику. В системах анализа соцмедиа пока есть только определение полных дублей (что уже хлеб!). Автоматически можно выделить лишь отдельные популярные материалы, но нельзя оценить долю определенной темы в общем массиве. То есть для того, чтобы разобрать массив по темам и инфоповодам, его надо ПОЛНОСТЬЮ ЧИТАТЬ.

В СМИ же можно прочитать основные статьи в рамках уже дружно сгруппированных машиной сюжетов. То же самое с тональностью — оттенки эмоций в соцмедиа не определить никаким алгоритмом. Опять придется читать весь массив! Это дорого и нерентабельно — отсюда вытекает следующая «боль».

Боль 5. Кто все эти люди?!

В СМИ — это Ведомости, «КоммерсантЪ», «Компропат.ру», в конце концов – предельно ясно с кем ты имеешь дело. В соцмедиа — кто авторы всех этих материалов, и почему их мнение стоит принимать в расчет? И кого из них принимать во внимание, а кого отправить в спам?

Отвечая на этот вопрос, при составлении медиааудита в соцмедиа приходится не просто просмотреть все источники, но и  дополнительно проводить аудит самих этих источников.

Но, если вернуться на  5 - 6 лет назад весь этот огромный массив информации приходилось собирать вручную: искать по ЖЖ и различным форумам, группировать и заносить в базу. Тогда все современные сервисы были из разряда фантастики. Интересно, а, что я назову «болью» ещё через 5 лет?…

Ответить?
Введите капчу