ВКонтакте открыла доступ сторонним разработчикам к собственной технологии распознавания речи
Automatic Speech Recognition внедряется в несколько кликов и хорошо справляется с аудио с посторонними шумами, большим количеством сленга и сокращений.
Теперь разработчики смогут бесплатно использовать в своих проектах технологию Вконтакте, которая считывает голос и переводит его в текст. Нейросеть используется соцсетью для расшифровки голосовых сообщений на русском языке, генерации субтитров в видео и многого другого.
ASR или Automatic Speech Recognition внедряется в несколько кликов, обрабатывает файлы за несколько секунд, умеет удалять из расшифровки шумы и паузы, а также понимает неразборчивую речь, сленг и сокращения. Для распознавания можно использовать две модели: нейтральную — для чёткой речи, как, например, в телешоу или интервью, и спонтанную — для оживлённых бесед и разговоров с ненормативной лексикой.
Решение подойдёт для стартапов, инди-проектов, личных pet-проектов для обучения и саморазвития. Версию с распознаванием аудио до 100 минут в сутки можно использовать для любых целей. Поддерживаемые форматы аудиозаписи: OGG, WAV, MP3 в качестве от 16 бит. Подробнее читайте в Справке.
Присылайте свои комментарии к ситуации на digital-рынке (короткие или развёрнутые, во втором случае сделаем вам полноценную колонку в статейной ленте Коссы):
Email: 42@cossa.ru
Телеграм: @cossawer
VK: vk.com/cossa
Эффективная и выгодная реклама с сервисом от МегаФона
Широкий выбор рекламных каналов, более 100 параметров по интересам, подробная аналитика и другие возможности уже ждут в Личном кабинете. А еще кешбэк 100% за запуск рекламы в первый месяц и еще 10% — каждый месяц.