Статьи

Google розробила синтезатор мови нового покоління

Google випустив новий продукт.

Фото: pixabay

Компанія Google розробила синтезатор мови нового покоління Tacotron 2, який заснований на нейромережі. Дана система перетворення тексту в природно чуже мовлення Tacotron 2 справляється з цим завданням ефективніше своїх попередників Tacotron і WaveNet, передає " Новий час ".

Попередні системи генерації мови володіли низкою суттєвих недоліків. WaveNet, наприклад, видавала дуже різкі звуки. Tacotron краще справлявся з інтонаціями, але не міг видавати повноцінний "мовної продукт".

Алгоритм Tacotron 2, який представлений командою розробників Google за участю Джонатана Шена, працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограму, в якій розподіляються ритм і наголоси, а слова генеруються в аналогу WaveNet. Крім того, додана система збору даних для навчання нейромережі.

Відзначається, що аудіозапис дійсно схожа на мову живого людина. Темп мовлення звучить вельми переконливо, а основні запинки відбуваються на словах з незвичайним вимовою. Правда, частина слухачів в коментарях стверджує, що деякі слова система вимовляє "ламано".

Поки зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Але, швидше за все, ця технологія відразу почне використовуватися в продуктах компанії.

Однією з основних проблем нового алгоритму є відсутність регулювання тону мови. Не можна передбачити, яка фраза буде виголошена піднесено, а яка - грубо.

Тим часом Microsoft заборонила встановлювати Google Chrome . У корпорації зазначили, що програма має бути "унікальним і відмітним".

Читайте найважливіші та найцікавіші новини в нашому Telegram

Новости