Google представила ШІ для озвучування відео

20.06.2024, 02:36 — Технології&Авто

365

Google представила ШІ для озвучування відео

Команда Google DeepMind представила інструмент для генерації саундтреків до відео за допомогою штучного інтелекту.

Як зазначають розробники, ШІ-моделі для створення відео розвиваються семимильними кроками, але здебільшого це «німі» відео. Технологія V2A («video-to-audio») дає змогу оживити їх.

Технологія дає можливість згенерувати музику в дусі ролика, звукові ефекти і навіть діалоги для персонажів за текстовим описом. ШІ-модель в основі технології навчали на базі звуків, розшифровок діалогів і відео.

Моделями для породження музики і звуків сьогодні нікого не здивуєш. Але за словами розробників V2A, відмінність їхньої технології в тому, що вона здатна розуміти відеоряд і автоматично синхронізувати згенерований аудіосупровід конкретно під нього з урахуванням запиту користувача.

У DeepMind визнають, що технологія небездоганна. А оскільки в навчальному датасеті було мало відео з артефактами та іншими дефектами, створювати аудіо для них у V2A виходить не дуже.

За матеріалами:

Процес

Місце для вашої реклами

Якщо Ви помітили помилку, виділіть необхідний текст і натисніть Ctrl+Enter , щоб повідомити про це.

Поділитися новиною

Також за темою

Рейтинг найпопулярніших марок нових авто в Україні

Сьогодні 19:21

103

Які зарплати отримують ІТ-фахівці, які працюють в Anthropic

Сьогодні 07:15

1420