Редакция Cossa,
17 июля 2017, 10:30, 1348 просмотров

Нейросеть научила президента правдоподобно говорить под фонограмму

И теперь у каждого может появиться цифровой двойник.

Алгоритм исследователей из Вашингтонского университета позволяет создавать реалистичное видео с говорящим человеком на основе записи какого-либо голоса.

цифровой двойник

Новая разработка может улучшить видеосвязь, кинематограф и виртуальную реальность. Система основана на нейросети с обратной связью. Для обучения разработчики показали программе 17 часов видео с выступлениями Барака Обамы. Затем из записей извлекли отдельные фонемы. На их основе воссоздали мимику и артикуляцию. Цифровую область рта наложили на другой видеоряд, а движения губ, глаз и головы синхронизировали до естественного вида.

В демонстрационном ролике на видеоряд обращения Барака Обамы к американским гражданам добавлены аудиодорожки из других его выступлений.

Технология синтеза речи для видео существовала и раньше. Однако для этого использовались записи людей в экспериментальных условиях. Учёным впервые удалось совместить естественные и различные аудио- и видеозаписи реального человека.

Хотите подсказать новость или поделиться экспертным мнением? Пишите: news@cossa.ru

Автор иконки на тизере: Simon Child, Noun Project

Комментарии:

Ответить?

Самые интересные статьи, обзоры и размышления —
в рассылке!

Email *


Подпишись!


Вход на cossa.ru

Уже есть аккаунт?
Выбирай любой вариант входа:
Facebook Twitter Vkontakte

Используйте свой аккаунт в социальной сети Facebook или Twitter, чтобы пользоваться сайтом

Не забудьте написать email на странице своего профиля для управления рассылкой