Google створив генератор мовлення, який не відрізнити від голосу людини


Google створив генератор мовлення, який не відрізнити від голосу людини

У статті, опублікованій Google, описується комп’ютерна програма, здатна в точності імітувати людський голос. Вона називається Tacotron 2 і служить для перетворення тексту на мовлення. Про розробку розповідає Quartz.

Програма складається з двох нейромереж глибокого навчання. Перша перетворює текст на спектрограмму і передає алгоритмом WaveNet, який озвучує її, генеруючи відповідні звукові елементи. Tacotron 2 справляється з важкими для вимови словами і назвами, а також змінює мовлення в залежності від пунктуації. Наприклад, вона може за допомогою інтонації підкреслити слово, написане з великої літери.

Зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Ця технологія, швидше за все, відразу почне використовуватися в продуктах компанії. WaveNet, вперше анонсована в 2016 році, тепер служить для генерації голосу в Google Assistant. Tacotron 2 може стати ще більш потужним доповненням до сервісу.

На жаль, поки що програма може говорити тільки єдиним жіночим голосом. На відміну від Tacotron 2, продукт канадського ШІ-стартапу Lyrebird, за словами розробників, здатний точно імітувати голос будь-якої людини. Для цього достатньо звукового файлу тривалістю 1 хвилина.

  • i

    Якшо Ви помітили помилку, виділіть необхідну частину тексту й натисніть Ctrl+Enter, щоб повідомити про це нам.

Дивись також
В Контексті Finance.ua
Опитування