30 октября на конференции для разработчиков Yet Another Conference компания Яндекс представила собственные технологии синтеза речи, выделения смысловых объектов и голосовой активации. Об этом сообщает портал Цукерберг позвонит.
Протестировать работу технологии под названием Yandex SpeechKit можно с помощью мобильного приложения Яндекс.Диктовка, доступного для пользователей устройств, работающих на платформе Android. Версия приложения для iOS появится в скором времени.
Yandex SpeechKit поддерживает основные возможные сценарии речевого взаимодействия человека с устройством: голосовую активацию, распознавание речи произвольной тематики и её перевод в текст, синтез речи, а также голосовое управление с выделением смысловых объектов. Так, при помощи мобильного приложения пользователи могут не только надиктовать произвольный текст, но и отдать ряд команд, например, допускаются команды добавь веселый смайлик, удали последнее слово, замени слово осень на весна, начни с новой строки.
Представители Яндекса также отметили, что технология понимания языка позволяет выделить в распознанном тексте различные объекты, включая дату, время, фамилию или адрес. Кроме того, приложение способно расставить в надиктованном тексте знаки препинания и по команде отправить текст в стороннее приложение. Наконец, с помощью технологии голосовой активации любое приложение может создать собственную голосовую команду активации голосового взаимодействия.
В сообщении, опубликованном в официальном блоге Яндекса, о 1000 тмечается, что все элементы технологии были включены в библиотеку SpeechKit Mobile SDK и облачный сервис SpeechKit Cloud и доступны сторонним разработчикам, которые смогут встраивать их в свои продукты: мобильные приложения, игры, компьютерные программы и корпоративные сервисы.