Фото: АР
Технологія робить поки помилки в одному слові із 7-8
Корпорація Microsoft працює над технологією, яка дозволяє розпізнавати мову, перекладати її іншою мовою і відтворювати її новою мовою із збереженням особливостей голосу мовця.
Про це написав у корпоративному блозі директор
Microsoft із розробок Рік Рашид.
Рашид вперше продемонстрував роботу
технології, виступаючи на презентації в Китаї. Спершу його промова на заході
розпізнавалася в реальному часі і виводилася на екран у вигляді оновлюваного
тексту англійською мовою.
Далі він показав, що нова програмна технологія
Microsoft дозволяє перекладати зміст цієї промови китайською мовою з
урахуванням її лексичних та граматичних особливостей - при цьому переклад йшов
також у реальному часі.
Нарешті, фінальним етапом став голосовий
переклад його промови - Рашид вимовляв речення англійською мовою, а програма
відтворювала його китайською мовою із збереженням особливостей голосу
топ-менеджера Microsoft.
"Найбільш значним є те, що ми добилися
важливої мети - змогли дозволити англомовній людині, мені подібній, провести
презентацію китайською, зберігаючи свій голос", - відзначає в блозі Рашид.
За словами Рашида, компанія Microsoft веде
розробки в цій галузі спільно з університетом Торонто близько двох років. Водночас,
незважаючи на досягнуті успіхи, технологія як і раніше робить помилки в одному
слові із 7-8.
"Результати як і раніше не ідеальні, і нас
очікує серйозна робота в цій сфері, проте технологія є вельми багатообіцяючою.
Ми сподіваємося, що через кілька років у нас будуть системи, які зможуть повністю
зруйнувати мовні бар'єри", - наголосив він.
Коли технологія розпізнавання і перекладу
мовлення із збереженням голосу надійде в комерційне використання, і чи надійде взагалі, топ-менеджер Microsoft не
уточнив.