Яндекс научит машины понимать речь человека

Наука и технология Дата 31-05-2017, 13:33
Яндекс научит машины понимать речь человека

Яндекс запустил облачный сервис распознавания речи SpeechKit Cloud. С его помощью разработчики, в том числе из Беларуси, смогут научить свои продукты понимать человеческий голос. Об этом сообщили в пресс-службе компании Яндекс.
Облачный сервис распознавания речи уже использует Cubic Robotics — разработчик домашнего робота CUBIC. Дроид понимает заданные голосом вопросы и отвечает на них. А вот компания Oktell, выпускающая программное обеспечение для колл-центров, использует технологию Яндекса, чтобы распознавать речь звонящего в колл-центр человека и соединять его с нужным специалистом.
В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую Яндекс запустил в 2013 году. Сейчас она используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов. Поддержку SpeechKit Cloud можно добавить в самые разные программы, сервисы и устройства: от компьютерной игры до автомобильной навигационной системы.
Качество распознавания речи зависит от тематики запроса. Если вы диктуете смс или заметку, оно составляет 82%, если произносите короткий запрос – 85%. А «географические» запросы (например, адреса и названия организаций) Yandex SpeechKit понимает с точностью, близкой к способностям человека, — 95%.
«В мире есть всего несколько разработчиков систем распознавания голоса – некоторые из них используются, например, в приложениях для смартфонов и планшетов. Однако систем, понимающих русскую речь, значительно меньше: адаптация подобной технологии под конкретный язык занимает очень много времени, так что иностранные разработчики до нашего языка часто «не доходят», –  отметил руководитель отдела разработки голосовых сервисов и продуктов Яндекса Денис Филиппов.
SpeechKit Cloud понимает русский и турецкий языки, однако в планах Яндекса «обучить» технологию и другим языкам. Обработка голосовых запросов производится на серверах Яндекса, рассчитанных на высокие нагрузки. Распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа. Разработчикам предоставили возможность бесплатно использовать SpeechKit Cloud в течение месяца.


шаблоны для dleскачать фильмы