Microsoft представила технологію перекладу промови із збереженням особливостей голосу
Корпорація Microsoft працює над технологією, яка дозволяє розпізнавати мову, перекладати її іншою мовою і відтворювати її новою мовою із збереженням особливостей голосу мовця.
Про це написав у корпоративному блозі директор Microsoft із розробок Рік Рашид.
Рашид вперше продемонстрував роботу технології, виступаючи на презентації в Китаї. Спершу його промова на заході розпізнавалася в реальному часі і виводилася на екран у вигляді оновлюваного тексту англійською мовою.
Далі він показав, що нова програмна технологія Microsoft дозволяє перекладати зміст цієї промови китайською мовою з урахуванням її лексичних та граматичних особливостей - при цьому переклад йшов також у реальному часі.
Нарешті, фінальним етапом став голосовий переклад його промови - Рашид вимовляв речення англійською мовою, а програма відтворювала його китайською мовою із збереженням особливостей голосу топ-менеджера Microsoft.
"Найбільш значним є те, що ми добилися важливої мети - змогли дозволити англомовній людині, мені подібній, провести презентацію китайською, зберігаючи свій голос", - відзначає в блозі Рашид.
За словами Рашида, компанія Microsoft веде розробки в цій галузі спільно з університетом Торонто близько двох років. Водночас, незважаючи на досягнуті успіхи, технологія як і раніше робить помилки в одному слові із 7-8.
"Результати як і раніше не ідеальні, і нас очікує серйозна робота в цій сфері, проте технологія є вельми багатообіцяючою. Ми сподіваємося, що через кілька років у нас будуть системи, які зможуть повністю зруйнувати мовні бар'єри", - наголосив він.
Коли технологія розпізнавання і перекладу мовлення із збереженням голосу надійде в комерційне використання, і чи надійде взагалі, топ-менеджер Microsoft не уточнив.