1138
Google створив генератор мовлення, який не відрізнити від голосу людини
— Технології&Авто
У статті, опублікованій Google, описується комп’ютерна програма, здатна в точності імітувати людський голос. Вона називається Tacotron 2 і служить для перетворення тексту на мовлення. Про розробку розповідає Quartz.
Програма складається з двох нейромереж глибокого навчання. Перша перетворює текст на спектрограмму і передає алгоритмом WaveNet, який озвучує її, генеруючи відповідні звукові елементи. Tacotron 2 справляється з важкими для вимови словами і назвами, а також змінює мовлення в залежності від пунктуації. Наприклад, вона може за допомогою інтонації підкреслити слово, написане з великої літери.
Зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Ця технологія, швидше за все, відразу почне використовуватися в продуктах компанії. WaveNet, вперше анонсована в 2016 році, тепер служить для генерації голосу в Google Assistant. Tacotron 2 може стати ще більш потужним доповненням до сервісу.
На жаль, поки що програма може говорити тільки єдиним жіночим голосом. На відміну від Tacotron 2, продукт канадського ШІ-стартапу Lyrebird, за словами розробників, здатний точно імітувати голос будь-якої людини. Для цього достатньо звукового файлу тривалістю 1 хвилина.
За матеріалами: hightech.fm
Поділитися новиною
Також за темою
Експерти назвали найкращий недорогий кросовер з пробігом
Франція заборонить держслужбовцям американські Google Meet, Zoom та Teams — Politico
Футуристичне саудівське «місто-лінію» перетворять на ШІ-датацентр
ЄС інвестує понад €10 млрд у супутникову альтернативу Starlink
5G запустили в Бородянці на Київщині
Як перереєструвати авто з аукціону — пояснення МВС
