Перейти к содержанию

Yandex SpeechKit

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
Yandex.SpeechKit
Логотип программы Yandex.SpeechKit
Разработчик Яндекс
Языки интерфейса русский, турецкий, английский
Первый выпуск 2013
Сайт tech.yandex.ru/speechkit…

Yandex SpeechKit (произносится как Яндекс СпичКит) — технология распознавания речи и синтеза речи от российской компании Яндекс[1].

Краткие сведения

Демонстрация новых возможностей СпичКита на YaC-2014

Разработками в области обработки естественной речи компания «Яндекс» занимается с 2012 года[2].

SpeechKit[3] был представлен 2 октября 2013 года на ежегодной технологической конференции Яндекса YaC[1].

Мобильный голосовой поиск на основе этой платформы доступен для смартфонов под управлением iOS, «Андроид» и Windows Phone 8[1] и понимает запросы на русском и турецком языках[4]. Поддерживаются две темы запросов: «общая» (обычные запросы) и «гео» (адреса и названия организаций), причём, по словам разработчиков, точность распознавания составляет 84 % и 94 % соответственно[5]. Скорость распознавания — 1,1 секунды[5].

SpeechKit[3] используется в приложениях «Яндекс Браузер», «Яндекс Город», «Яндекс Карты», «Яндекс Навигатор» и ещё около 400 приложениях[4].

4 августа 2014 годы был представлен облачный сервис SpeechKit Cloud SDK (произносится как СпичКит Клауд, СДК)[4]. Разработка предназначена для встраивания в игры, развлекательные и навигационные сервисы[4]. Первый месяц использования СДК бесплатный, далее стоимость будет рассчитываться, исходя из количества запросов[4].

Возможности

Голосовая активация

Система распознавания речи в миниатюре — возможность привязывать к любому слову или фразе любую команду для устройства; не требует доступа в интернет, для запуска не нужно нажимать какие-либо кнопки: программа постоянно работает в фоне[6].

Выделение смысловых объектов

Способность извлекать из слов смысл и анализировать контекст: к примеру, система поймёт, что во фразе «Позвони Владимиру» имеется в виду человек, а во фразе «Поехали во Владимир» — город[6].

Синтез речи

Преобразование текста в речь на базе скрытых марковских моделей[6].

Применение технологии

Комплекс речевых технологий Яндекса успешно применяется в различных направлениях[7]:

Примечания

  1. 1,0 1,1 1,2 «Яндекс» разработал собственную технологию распознавания речи. Дата обращения: 30 декабря 2013. Архивировано 30 декабря 2013 года.
  2. Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса Архивная копия от 29 апреля 2015 на Wayback Machine // радио Эхо Москвы
  3. 3,0 3,1 Речевые технологии Yandex SpeechKit – распознавание речи, синтез речи, смысловой разбор сказанного, голосовая активация.. speechkit.yandex.ru. Дата обращения: 29 сентября 2015.
  4. 4,0 4,1 4,2 4,3 4,4 Яндекс представил SpeechKit Cloud — облачный сервис распознавания речи (недоступная ссылка). Дата обращения: 4 августа 2014. Архивировано 6 августа 2014 года.
  5. 5,0 5,1 «Яндекс» распознает речь на iOS и Android. Дата обращения: 30 декабря 2013. Архивировано 1 января 2014 года.
  6. 6,0 6,1 6,2 Право голоса (недоступная ссылка). Дата обращения: 31 октября 2014. Архивировано 14 сентября 2015 года.
  7. Вести.net: синтез речи от «Яндекса» и плата за репосты.. Дата обращения: 13 сентября 2016. Архивировано 10 мая 2017 года.
  8. «Яндекс» выпустил голосового помощника «Алиса».. Дата обращения: 30 октября 2017. Архивировано 21 июня 2018 года.
  9. «Яндекс» готовит на экспорт речевые технологии: для автопрома, телекомов и медицины.. Дата обращения: 30 октября 2017. Архивировано 20 октября 2020 года.
  10. Россияне смогут переводить деньги с помощью голосовых команд.. Дата обращения: 30 октября 2017. Архивировано 7 августа 2020 года.
  11. Коллтрекинговый сервис Calltouch запустил услугу распознавания качества звонков при помощи технологий «Яндекса».. Дата обращения: 30 октября 2017. Архивировано 29 октября 2021 года.
  12. НМГ перезапустила сайт «Известий» через два месяца после предыдущего редизайна.. Дата обращения: 30 октября 2017. Архивировано 7 ноября 2017 года.

См. также

Ссылки

Внешние аудиофайлы
Железки начали понимать // Интернет-кафе «Соб@ка»
Технологии распознавания речи. Денис Филиппов, руководитель речевых технологий Яндекса // радио Эхо Москвы