Несколько дней назад исследователи из корпорации Microsoft продемонстрировали
весьма интересную технологическую разработку. Компьютерная программа, созданная
Фрэнком Сунгом (Frank Soong) и его коллегами из Microsoft Research Asia,
представляет собой инструмент для автоматического перевода устной речи на любой
из поддерживаемых иностранных языков. Однако, в отличие от аналогичных решений
новый компьютерный синхронист способен не только переводить произносимый вслух
текст, но и имитировать голос пользователя. По мнению разработчиков, система
окажется идеальным помощником для туриста, путешествующего по чужой стране и не
владеющего местным языком.
Новое технологическое решение также пригодится студентам,
изучающим иностранные языки. Учащиеся смогут с большей легкостью повторять
фразы на незнакомом языке, воспроизводимые знакомым голосом. Кроме того, Сунг
уверен, что новая разработка может использоваться для усовершенствования
мобильных навигационных систем.
Программа разделяет исходный образец речи на отдельные звуки
и использует их в качестве «кирпичиков» для построения новых слов и
предложений. Процесс построения индивидуальной голосовой модели занимает около
часа. После этого приложение сможет воспроизводить любой текст голосом,
предельно похожим на голос пользователя. Как утверждает Фрэнк Сунг,
используемая методика обеспечивает возможность быстрого и аккуратного перевода
текста на любой из 26 поддерживаемых языков, включая мандаринский китайский,
испанский и итальянский.
«Сохранение индивидуальных особенностей голоса в синтезированной
речи сделает любые коммуникации, осуществляемые при участии электронного переводчика,
уникальными и более эффективными, — уверен Шрикант Нарайанан (Shrikanth
Narayanan), профессор Университета Южной Калифорнии и один из членов
исследовательской группы. — В некоторых ситуациях, таких как общение между
доктором и пациентом, важно не только правильно перевести слова, но и передать
нужную интонацию».
Сейчас сотрудники исследовательской лаборатории Microsoft в
Пекине заняты разработкой методик, которые сделают синтезированную на
компьютере речь еще более реалистичной. Ученые намерены добиться желаемого
результата с помощью новых алгоритмов, позволяющих выделять голосом важные
фрагменты, использовать паузы и другие приемы.
|