В 2013 году Яндекс представил собственную технологию распознавания речи Yandex SpeechKit. Сейчас эта технология задействована примерно в 400 приложениях для смартфонов и планшетов. В их числе — и приложения Яндекса (Навигатор, Браузер, Город, Карты и Поиск), и программы сторонних разработчиков.
Однако умение понимать голос может пригодиться не только смартфонам и планшетам. Поэтому сегодня Яндекс запустил SpeechKit Cloud — облачный сервис распознавания речи, сообщается в блоге компании.
SpeechKit Cloud позволяет добавить функцию распознавания речи в самые разные программы и устройства — от компьютерной игры до робота. Всё, что для этого требуется, — встроить в продукт поддержку SpeechKit Cloud. О том, как это сделать, разработчики могут узнать на странице API SpeechKit Cloud.
Технология распознавания речи Яндекса способна понимать запросы на русском и турецком языках. В ближайшем будущем Яндекс планирует добавить английский.
Как отмечают в Яндексе, качество распознавания речи зависит от тематики запроса: если вы диктуете СМС или заметку, оно составляет 82%, если произносите короткий запрос – 85%, а «географические» запросы (например, адреса и названия организаций) Yandex SpeechKit понимает с точностью, близкой к способностям человека, — 95%.
Распознавание осуществляется на серверах Яндекса, рассчитанных на высокие нагрузки. Оно происходит в режиме реального времени: с момента отправки данных (то есть голоса) в «облако» до получения ответа проходит в среднем одна секунда.
Распознавание речи — относительно новая возможность. Выполнять распознавание с приемлемым уровнем качества компьютеры научились только в 2000-х годах. Раньше для таких задач не хватало вычислительных мощностей. Поэтому можно уверенно сказать, что самые впечатляющие сферы применения этой технологии еще впереди, отмечают в Яндексе.
У Яндекса есть несколько партнеров, которые уже используют SpeechKit Cloud в своих продуктах.
Один из партнеров — это компания Cubic Robotics. Она разрабатывает домашнего робота-помощника CUBIC. Используя технологию Яндекса, CUBIC распознает вопросы человека и отвечает на них. Он может, к примеру, включить или выключить свет в комнате, зачитать последние новости или рассказать о пробках на дорогах.
|