Yandex SpeechKit

Внешние аудиофайлы
Внешние аудиофайлы
	Железки начали понимать // Интернет-кафе «Соб@ка»
	Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы

Yandex.SpeechKit
Yandex.SpeechKit
Разработчик	Яндекс
Языки интерфейса	русский, турецкий, английский
Первый выпуск	2013
Сайт	tech.yandex.ru/speechkit…

Yandex SpeechKit (произносится как Яндекс СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс^[1].

Краткие сведения

Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года^[2].

SpeechKit^[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC^[1].

Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8^[1] и понимает запросы на русском и турецком языках^[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно^[5]. Скорость распознавания — 1,1 секунды^[5].

SpeechKit^[3] используется в приложениях «Яндекс Браузер», «Яндекс Город», «Яндекс Карты», «Яндекс Навигатор» и ещё около 400 приложениях^[4].

4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)^[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы^[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов^[4].

Возможности

Голосовая активация

Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне^[6].

Выделение смысловых объектов

Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город^[6].

Синтез речи

Преобразование текста в речь на базе скрытых марковских моделей^[6].

Применение технологии

Комплекс речевых технологий Яндекса успешно применяется в различных направлениях^[7]:

Персональный помощник «Алиса»^[8];
Мультимедийная система голосового управления автомобилем, являющаяся конкурентом Car Play и Android Auto (подписаны контракты с «КАМАЗом», «Toyota» и «Honda»)^[9];
Перевод денежных средств голосом у Бинбанка^[10];
Автоматическое тегирование звонков впервые внедренное c Calltouch^[11];
Автоозвучка текстов (на сайте газеты «Известия»)^[12].

Примечания

↑ ^1,0 ^1,1 ^1,2 «Яндекс» разработал собственную технологию распознавания речи (неопр.). Дата обращения: 30 декабря 2013. Архивировано 30 декабря 2013 года.
↑ Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса Архивная копия от 29 апреля 2015 на Wayback Machine // радио Эхо Москвы
↑ ^3,0 ^3,1 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация. (неопр.). speechkit.yandex.ru. Дата обращения: 29 сентября 2015.
↑ ^4,0 ^4,1 ^4,2 ^4,3 ^4,4 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи (неопр.) (недоступная ссылка). Дата обращения: 4 августа 2014. Архивировано 6 августа 2014 года.
↑ ^5,0 ^5,1 «Яндекс» распознает речь на iOS и Android (неопр.). Дата обращения: 30 декабря 2013. Архивировано 1 января 2014 года.
↑ ^6,0 ^6,1 ^6,2 Право голоса (неопр.) (недоступная ссылка). Дата обращения: 31 октября 2014. Архивировано 14 сентября 2015 года.
↑ Вести.net: синтез речи от «Яндекса» и плата за репосты. (неопр.). Дата обращения: 13 сентября 2016. Архивировано 10 мая 2017 года.
↑ «Яндекс» выпустил голосового помощника «Алиса». (неопр.). Дата обращения: 30 октября 2017. Архивировано 21 июня 2018 года.
↑ «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины. (неопр.). Дата обращения: 30 октября 2017. Архивировано 20 октября 2020 года.
↑ Россияне смогут переводить деньги с помощью голосовых команд. (неопр.). Дата обращения: 30 октября 2017. Архивировано 7 августа 2020 года.
↑ Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса». (неопр.). Дата обращения: 30 октября 2017. Архивировано 29 октября 2021 года.
↑ НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна. (неопр.). Дата обращения: 30 октября 2017. Архивировано 7 ноября 2017 года.

См. также

Ссылки

[лентару-1] 1,0 ^1,1 ^1,2 «Яндекс» разработал собственную технологию распознавания речи (неопр.). Дата обращения: 30 декабря 2013. Архивировано 30 декабря 2013 года.

[2] Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса Архивная копия от 29 апреля 2015 на Wayback Machine // радио Эхо Москвы

[autogenerated1-3] 3,0 ^3,1 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация. (неопр.). speechkit.yandex.ru. Дата обращения: 29 сентября 2015.

[серч-4] 4,0 ^4,1 ^4,2 ^4,3 ^4,4 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи (неопр.) (недоступная ссылка). Дата обращения: 4 августа 2014. Архивировано 6 августа 2014 года.

[вестиру-5] 5,0 ^5,1 «Яндекс» распознает речь на iOS и Android (неопр.). Дата обращения: 30 декабря 2013. Архивировано 1 января 2014 года.

[право-6] 6,0 ^6,1 ^6,2 Право голоса (неопр.) (недоступная ссылка). Дата обращения: 31 октября 2014. Архивировано 14 сентября 2015 года.

[Камаз-7] Вести.net: синтез речи от «Яндекса» и плата за репосты. (неопр.). Дата обращения: 13 сентября 2016. Архивировано 10 мая 2017 года.

[8] «Яндекс» выпустил голосового помощника «Алиса». (неопр.). Дата обращения: 30 октября 2017. Архивировано 21 июня 2018 года.

[9] «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины. (неопр.). Дата обращения: 30 октября 2017. Архивировано 20 октября 2020 года.

[10] Россияне смогут переводить деньги с помощью голосовых команд. (неопр.). Дата обращения: 30 октября 2017. Архивировано 7 августа 2020 года.

[11] Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса». (неопр.). Дата обращения: 30 октября 2017. Архивировано 29 октября 2021 года.

[12] НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна. (неопр.). Дата обращения: 30 октября 2017. Архивировано 7 ноября 2017 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]