О чём «говорят» изображения: анализ визуального контента на базе технологий машинного обучения. Читайте на Cossa.ru

27 августа, 19:39
1

О чём «говорят» изображения: анализ визуального контента на базе технологий машинного обучения

Что бизнесу в ближайшей перспективе даст анализ потока изображений и видео с помощью Machine Learning? Узнаем на примерах изучения визуального контента в соцсетях на темы «красота» и «пандемия».

О чём «говорят» изображения: анализ визуального контента на базе технологий машинного обучения

Эпоха визуальных форматов

Количество информации, производимой человечеством, продолжает стремительно расти. По оценкам Seagate и IDC объем информации к 2025 году составит более 160 зеттабайт. Для сравнения, ещё в 2006 году он составлял 0,16 зеттабайт, что было сравнимо с вместимостью встроенной памяти приблизительно 5,5 млрд современных смартфонов.

Несмотря на то, что наибольший удельный вес в структуре мировых данных занимает коммерческий сектор, потребители не остаются в стороне. Успешные проекты всё быстрее набирают свой первый миллиард пользователей. Например, гиганту Facebook для этого понадобилось 7 лет, а TikTok преодолел этот порог менее, чем за 3 года.

Каждый день объём данных, созданных пользователями, продолжает увеличиваться. При этом всё большую часть с точки зрения медиа-потребления занимают визуальные форматы. К примеру, доля видео в мобильном интернет-трафике возрастёт до 79% уже к 2022 году.

Динамика роста доли видео в мобильном трафике с 2017 года

Динамика роста доли видео в мобильном трафике с 2017 года

Свяжите сервисы между собой без программистов за 5 минут!


Cossa рекомендует использовать ApiX-Drive для самостоятельной интеграции разных сервисов между собой. Доступно 200+ готовых интеграций!

  • Автоматизируйте работу интернет-магазина или лендинга;
  • Расширяйте возможности за счёт интеграций;
  • Не тратьте деньги на программистов и интеграторов;
  • Экономьте время за счёт автоматизации рутинных задач.

Бесплатно протестируйте работу сервиса прямо сейчас и начните экономить до 30% времени! Перейти

Реклама

Революция медиа-потребления уже произошла. Сегодня визуальные форматы — основной способ познавать мир и общаться. Почему это так? Зрение — основной врожденный способ восприятия информации. При этом чтение, то есть восприятие текста — навык более сложный, ему учатся. В известном смысле общаться с помощью картинок и видео попросту проще. В то же самое время современные технологии делают создание такого контента всё более и доступным для любого человека.

Бизнес наряду с результатами опросов широко использует цифровые данные для понимания потребителя. Контент, создаваемый пользователями (в первую очередь, конечно же, в социальных медиа) — один из ключевых источников инсайтов о предпочтениях, стиле жизни и отношении людей к брендам и продуктам.

Однако «гонка вооружений» между непрекращающимся ростом объёма данных и методов их исследования бросает бизнесу серьезный вызов. Что в таких условиях исследовательские технологии могут предложить брендам?

Как брендам использовать обилие визуальной информации

Ответ на этот вопрос дают современные методы автоматического анализа контента.

Изначально эти методы были созданы для выделения тематики и ключевых слов в текстах. Однако сегодняшние алгоритмы анализируют содержание не только текстов, но и визуальной составляющей — изображений и видео.

Эти технологии создаются для самых разных задач: от компьютерного зрения до автоматизации создания креативов. Посмотрим подробнее на анализ контента пользователей соцмедиа.

Как машины помогают человеку исследовать визуальный контент

Как машины помогают человеку исследовать визуальный контент

В основе анализа изображений лежат технологии машинного обучения.

  1. Главным отличием применения методологии является возможность работать с большими объемами данных: десятками и сотнями тысяч публикаций.

  2. Для этого из публикаций сначала выделяется контент, созданный пользователями.

  3. Изображения и тексты анализируются, из них извлекаются смысловые элементы (темы, объекты и так далее).

  4. После этого контент автоматически сегментируется на основе смыслового содержания. Сегментировать можно по-разному. Это зависит от того, что мы хотим узнать. Например, это может быть композиция объектов, образов, наличие конкретных предметов, в том числе логотипов, цветовая гамма.

Полученные результаты описывают эксперты. Связка машина–человек позволяет с одной стороны охватить огромные объемы данных, с другой — исключать возможные ошибки при автоматическом анализе, а также интерпретировать результаты с применением знаний, накопленных в предметной области и психологии поведения людей.

Свет мой, зеркальце, скажи...

Анализ визуальной составляющей контента пользователей соцмедиа помогает ответить на целый ряд вопросов бизнеса.

  • Какой формат в соцмедиа выгоднее всего покажет преимущества использования продукта? Изучив пользовательский контент перед запуском продукта, можно подготовить актуальные контексты и ракурсы использования и рассказать о продукте понятным для аудитории языком.

  • Как донести глубинные ценности бренда, не нарушая границ и универсальных правил категории? Так можно избежать подводных камней, адаптировать рассказ о бренде к привычным для аудитории форматам, не выглядеть искусственно и при этом не потерять в глубине.

  • Какие визуальные образы и темы использовать, чтобы создать привлекательный и актуальный для людей контент? Для этого можно изучить тренды на интересующей смысловой территории, понять, как на ней общаются люди и бренды. Может быть, есть ещё незанятые ниши, которые помогут отличиться на фоне конкурентов?

Сферы применения технологии анализа визуальной составляющей контента

Сферы применения технологии

Однажды мы задались вопросом: какие визуальные образы доминируют сегодня на такой территории, как «красота»? Мы проанализировали несколько десятков тысяч изображений из русскоязычного Инстаграм, чтобы понять, с чем красота ассоциируется у людей.

Такой анализ можно проводить регулярно. Это даёт возможность отслеживать изменение трендов во внешнем облике или потребностях людей, оценить популярность тех или иных продуктов или целых категорий, «поймать» появление конкурента на территории.

Как происходит сегментация визуального контента по теме «Красота»

Размер фото означает размер так называемого кластера (группы схожих сегментов картинок/фото). Часть данных ожидаемо попадает в сегменты, связанные с косметологией и услугами в этой области. Другой сегмент уже больше отражает поведение пользователей — люди делятся своими «модными» решениями. Третья группа выявила темы, которые могут потеряться на фоне остальных, если смотреть только на ключевые слова.

Анализ визуального контента - Как происходит сегментация визуального контента по теме «Красота»

Каждый анализируемый сегмент можно описать подробнее. Посмотрим, из чего состоит сегмент «Аксессуары».

Сначала мы оценили его размер, то есть долю в общем объёме контента и выделили близкие по смыслу сегменты. Мы также изучили состав сегмента: сколько в нём контента от людей, а сколько клаттера. Анализ цветовой гаммы показывает популярные в текущий момент оттенки.

С помощью дополнительных инструментов автоматического анализа на базе искусственного интеллекта можно оценить доминирующие эмоциональные потребности в сегменте. Мы также смотрели на используемую людьми лексику и наиболее популярные типы продуктов.

Содержание изображений можно анализировать в связке с показателями взаимодействия аудитории с контентом (количество комментариев, лайков). Это позволяет строить и проверять гипотезы о привлекательности темы, продукта, способа их представления в соцсети.

Анализ смыслового сегмента


Размер сегмента «Аксессуары»: 7%. Похожие сегменты: «Стильные фото». В сегменте высокое содержание рекламного материала: 73%, доля UGC невелика. Отличительные визуальные образы: кольца, серьги, броши, подвески, сумочки

Если смотреть только на текст, возникает риск упустить важные нюансы. Без дополнительного анализа содержания изображений становится сложнее увидеть другие смыслы, отражённые в digital-среде.

В категории «Красоты» мы заметили, что текст в основном отражает лишь самые крупные смысловые сегменты, которые можно охарактеризовать как «процедуры для поддержания красоты»: макияж, маски, маникюр.

Это означает, что, выбирая темы для позиционирования продукта или бренда, мы рискуем остаться только на территории «внешней красоты» и не заметить возможностей для общения с аудиторией на языке более глубинных ценностей, например, естественной красоты природы.

Этот смысл был выражен в словах не так ярко, как на картинках. Кроме того, фото природы больше отражали голос людей, а «процедуры для поддержания красоты» закономерным образом составляли рекламный клаттер. Тему природы, в свою очередь, легко позиционировать вокруг естественной красоты. Такие неочевидные параллели создают базу идей для небанального креатива.

Вот лишь некоторые из подобных идей на смысловой территории красоты.


Красота — это необходимость. Как и здоровье, красота делает жизнь лучше. Люди хотят, чтобы каждый день был красивым. Бренд может стать источником вдохновения для аудитории, помогая привносить больше красоты в рутину — от покупки продуктов питания до выбора подарков.

Красота вдохновляет делиться ею. Люди не стыдятся показывать друг другу, что они красивы. Бренды, поддерживающие самовыражение, строят более глубокие отношения с аудиторией.

Натуральная красота. Всё больше людей устаёт от навязанных стереотипов во внешности, отдавая предпочтение естественному, натуральному облику. Бренды могут объединить силы с природой, отвечая на потребность аудитории раскрывать заложенную изначально красоту.

Красота как награда. Люди ищут красоту во всём. Тяжёлый труд в фитнес-зале стоит того, потому что помогает достичь красоты. Помогая аудитории понять, какая награда ждёт после трудностей, бренд становится к ней ближе.

Лучше дома

Иногда очень важно понять текущее настроение аудитории, чтобы знать, о чём и как с ней общаться. Современные методы анализа контента помогают решить эту задачу.

Исследование визуальной стороны контента способно находить нюансы, подчас недоступные для вопросно-ответных методов.

Например, анализ реакции аудитории на глобальные события, такие как пандемия Covid-19, проясняет способы адаптации к сложившимся обстоятельствам, предоставляя брендам понимание того, как оставаться в контакте с аудиторией в сложное время.

Мы изучили изображения, размещенные в соцмедиа жителями Великобритании весной 2020 года и выяснили, как люди приспосабливаются к изменившимся обстоятельствам, какие высказанные и не высказанные нужды отражены в контенте, который они создают. Мы выделили множество тем в потоке обсуждений и объединили их в шесть сегментов:

Автоматический анализ визуального контента - как понять текущее настроение аудитории

  • «Отрицание» — обилие мемов и шуток как форма защиты с помощью юмора;

  • «Тоска по природе» — необходимость оставаться дома обостряет желание очутиться снаружи и знать, что будет дальше;

  • «Ни дня без гаджета» — digital приходит на помощь людям, современные возможности оставаться на связи помогают стремительно перестроить работу и досуг;

  • «Спасение в уюте» — близкие люди и домашние любимцы как символ надежной безопасности в условиях неопределённости;

  • «Повод для креатива» — творчество как внутренний ресурс помогает скоротать дни в изоляции и возместить отсутствие социализации;

  • «Новая норма» — вещи, ставшие необходимостью в изменившихся условиях.

Анализ изображений в социальных медиа выявляет сегменты потребностей и способы адаптации к меняющейся социальной норме.

Например, тоскующие по природе люди напоминают себе о ней с помощью украшения дома и воспоминаний о прошлых путешествиях. Это помогает им чувствовать, что всё рано или поздно вернется в привычное русло. Бренды могут оказаться рядом с человеком в самый нужный момент.

Автоматический анализ визуального контента - как понять текущее настроение аудитории

Особенно интересным может быть изучение динамики отношения аудитории к тому или иному явлению, например, до ключевого события, во время и после его завершения. Такой анализ возможен благодаря доступности архивных данных соцмедиа.

Чем полезен анализ визуального контента

Современный анализ визуального контента строится на технологиях машинного обучения и позволяет обрабатывать значительные объёмы данных. Он предоставляет бизнесу возможность более точно управлять маркетинговыми коммуникациями. С помощью подобных инструментов бизнес может глубже понимать:

  • наиболее привлекательные для людей визуальные темы и тренды в категории;

  • смысловые территории для позиционирования бренда;

  • нужды, стиль жизни, предпочтения аудитории, контекст использования продукта;

  • стилевые особенности потенциальных амбассадоров.

Результаты анализа могут интегрироваться в современные системы управления знаниями о рынке и потребительских трендах (интерактивные дашборды) вместе с любой другой актуальной для бизнеса информацией.

Синергия методов автоматического анализа данных и экспертного подхода на этапе интерпретации помогут по-новому получать инсайты о возможностях развития бренда и продукта.

Мнение редакции может не совпадать с мнением автора. Ваши статьи присылайте нам на 42@cossa.ru. А наши требования к ним — вот тут.





Чем живёт диджитал?
Главное — в рассылке: