ВКонтакте открыла доступ сторонним разработчикам к собственной технологии распознавания речи. Читайте на Cossa.ru

22 сентября 2022, 14:10

ВКонтакте открыла доступ сторонним разработчикам к собственной технологии распознавания речи

Automatic Speech Recognition внедряется в несколько кликов и хорошо справляется с аудио с посторонними шумами, большим количеством сленга и сокращений.

Теперь разработчики смогут бесплатно использовать в своих проектах технологию Вконтакте, которая считывает голос и переводит его в текст. Нейросеть используется соцсетью для расшифровки голосовых сообщений на русском языке, генерации субтитров в видео и многого другого.

ASR или Automatic Speech Recognition внедряется в несколько кликов, обрабатывает файлы за несколько секунд, умеет удалять из расшифровки шумы и паузы, а также понимает неразборчивую речь, сленг и сокращения. Для распознавания можно использовать две модели: нейтральную — для чёткой речи, как, например, в телешоу или интервью, и спонтанную — для оживлённых бесед и разговоров с ненормативной лексикой.


Решение подойдёт для стартапов, инди-проектов, личных pet-проектов для обучения и саморазвития. Версию с распознаванием аудио до 100 минут в сутки можно использовать для любых целей. Поддерживаемые форматы аудиозаписи: OGG, WAV, MP3 в качестве от 16 бит. Подробнее читайте в Справке.

Присылайте свои комментарии к ситуации на digital-рынке (короткие или развёрнутые, во втором случае сделаем вам полноценную колонку в статейной ленте Коссы):

Email: 42@cossa.ru
Телеграм: @cossawer
VK: vk.com/cossa

Телеграм Коссы — здесь самый быстрый диджитал и самые честные обсуждения: @cossaru

📬 Письма Коссы — рассылка о маркетинге и бизнесе в интернете. Раз в неделю, без инфошума: cossa.pulse.is

✉️✨
Письма Коссы — лаконичная рассылка для тех, кто ценит своё время: cossa.pulse.is

Вход на cossa.ru

Уже есть аккаунт?
Авторизуйся через VK:
Vkontakte
Не забудьте написать email на странице своего профиля для управления рассылкой