Лобанов, Борис Мефодьевич

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
Борис Лобанов
Страна  СССР,  Белоруссия
Научная сфера компьютерный анализ, синтез речи, распознавание речи
Место работы Объединённый институт проблем информатики Национальной академии наук Беларуси
Альма-матер Минский радиотехнический институт
Учёная степень доктор технических наук
Награды и премии Нагрудный знак «Почётный радист СССР»; 1 серебряная і 2 бронзовые медали ВДНХ СССР; Юбилейная медаль «В честь 80-летия Национальной академии наук Беларуси»

Бори́с Мефо́дьевич Лоба́нов (род. 18 июля 1938) — советский и белорусский учёный в области технической кибернетики[1]. Разработал теоретические основы и методы анализа, синтеза и распознавания речи. Разработал первые в СССР устройства для синтеза русской и белорусской речи[2]. Автор более 300 научных работ по проблемам анализа, распознавания и синтеза речи[3][4][5]. Автор трёх глав первого справочника по искусственному интеллекту, изданного в СССР, посвящённых системам речевого общения[6]. Совершил ряд изобретений в данной сфере[7].

Биография

Борис Мефодьевич Лобанов родился 18 июля 1938 года в городе Прокопьевск (на территории современной Кемеровской области). В 1948 году семья переехала в Минск на постоянное место жительства[8].

Учёба и начало научных исследований

Уже в школе Борис Лобанов увлекся конструированием радиоаппаратуры: в 6-м классе построил свой первый детекторный радиоприемник, в 8-м — ламповый, а в 10-м сконструировал собственную УКВ-радиостанцию. В 1955 году окончил среднюю школу № 13 города Минска и окончательно определился в выборе своей будущей специальности[9][8].

В это время в Минске не существовало вуза подходящего профиля, и Борис Лобанов поступил на отделение «Радиосвязь и радиовещание» Минского электротехникума связи. В техникуме он продолжал оставаться радиолюбителем, организовал первые Республиканские радиосоревнования по «охоте на лис», получил первый разряд по радиоспорту и удостоверение радионаблюдателя за сигналами первого спутника Земли[8].

После окончания техникума в 1958 году Борис Лобанов получил диплом с отличием, но вместо продолжения учебы в вузе был призван на срочную службу в Советскую армию в должности старшего радиомастера (Петрозаводск). Уже в 1959 году, имея достаточную специальную подготовку и хорошо оборудованную приборами радиомастерскую, Борис Лобанов занялся исследованием речи, изучая его с помощью микрофона и осциллографа. В то же время он вступил в переписку с известным учёным, профессором Л. А. Чистович, от которой получил ряд ценных советов по проведению исследований речи. Сохранилась документальная запись в дневнике Лобанова, датированная 25 октября 1959 года: «Фонемофон ведет к фонемографу». Из этой записи видно, что уже тогда Борис Лобанов осознал и определил генеральную стратегию своих будущих речевых исследований: «К распознаванию речи через синтез», которой неизменно придерживался всю дальнейшую научную деятельность[8].

После окончания службы в армии в 1961 году Борис Лобанов поступил в Минский радиотехнический институт (МРТИ) на специальность «Радиотехника» и уже на первом курсе стал председателем студенческого научного общества института, в рамках которого вместе с группой студентов начал разработку анализатора речевых сигналов. В 1965 году, будучи студентом четвертого курса, Лобанов опубликовал свои первые четыре научные работы по анализу речевых сигналов, которые были засчитаны как дипломный проект, что позволило ему закончить институт досрочно. Предложенный в этих работах метод улучшения основных параметров параллельного спектрального анализа эффективно использовался затем при разработке систем распознавания речи[8].

Закончив в 1965 году МРТИ, Борис Лобанов поступил в аспирантуру института и продолжил работать над задачами первичного анализа речевых сигналов для систем распознавания и синтеза речи. В 1968 году он окончил аспирантуру и защитил кандидатскую диссертацию по теме «Некоторые вопросы анализа речевых сигналов»[10].

Научная деятельность в 60-е и 70-е годы

Ещё обучаясь в аспирантуре, в 1966 году Б. М. Лобанов организовал хозрасчетную научную лабораторию анализа и синтеза речевых сигналов при кафедре радиоприемных устройств МРТИ, многие из сотрудников которой еще длительное время продолжали заниматься речевыми исследованиями. В лаборатории под руководством Лобанова впервые в СССР были сконструированы спектроанализатор для речевых исследований «Спектр-1» и прибор для интонографических исследований речи «Интонограф». В это же время в лаборатории проводились исследования методов автоматического выделения фонетических признаков звуков речи, например таких, как «шумный», «звонкий», «гласный», «взрывной». На их основе впервые в СССР было разработано устройство распознавания речевых команд «Сезам-1», отмеченное серебряной медалью ВДНХ СССР[10].

Во второй половине 1960-х годов Б. М. Лобанов принял участие в решении фундаментальной проблемы распознавания речи, связанной с нелинейными искажениями временной оси в процессе произнесения звуков речи. Такого рода искажения создавали существенные трудности при сопоставлении произносимых слов с их эталонами в процессе распознавания речи. В 1968 году независимо и практически одновременно Г. С. Слуцкер (Московский государственный научно-исследовательский институт радио) и Т. К. Винцюк (Институт кибернетики АН УССР) для решения данной проблемы предложили воспользоваться методом динамического программирования (ДП-методом)[10]. В 1969 году Б. М. Лобанов в соавторстве с Г. С. Слуцкером опубликовал статью, в которой было дано дальнейшее развитие ДП-метода для исключительно важного практического случая, когда границы распознаваемого слова неизвестны, то есть для решения задачи обнаружения и распознавания звукосочетаний в непрерывном речевом сигнале. ДП-метод получил в дальнейшем широкое признание зарубежных исследователей[11].

На следующий год после успешной защиты диссертации, в ноябре 1969 года Б. М. Лобанов был направлен на научную стажировку сроком на 10 месяцев в Великобританию. Стажировку по проблемам анализа речевых сигналов Б. М. Лобанов проходил под руководством профессора К. Чери в Имперском колледже науки и технологии (Лондон), а по проблемам синтеза речи — под руководством профессора Р. Лоренца в Эдинбургском университете[11].

После прохождения стажировки в Великобритании основным направлением научной работы Б. М. Лобанова стала разработка методов и устройств синтеза речи по тексту. Еще во время стажировки в Эдинбургском университете им были проведены успешные эксперименты по синтезу звуков русской речи, позволившие заложить основы формантного синтеза речи по фонемному тексту. В результате уже в 1972 году под руководством Б. М. Лобанова был разработан первый в СССР синтезатор русской речи «Фонемофон-1», отмеченный двумя медалями ВДНХ СССР[11]. «Фонемофон» был способен не только синтезировать русскую речь, но и читать введённый текст на нескольких иностранных языках, а также синтезировать пение[12].

В 1973 году Б. М. Лобанову присвоено звание «старший научный сотрудник». В связи с открывающимися перспективами внедрения речевых технологий в отрасли «Связь» на работы Б. М. Лобанова по синтезу русской речи обратило внимание руководство Московского отделения Центрального научно-исследовательского института связи (ЦНИИС). В результате в 1974 году на базе Минского отдела ЦНИИС была открыта Лаборатория речевых систем, руководителем которой Б. М. Лобанов оставался последующие 15 лет. Основным направлением работ лаборатории являлось развитие методов и создание систем автоматического распознавания и синтеза речи, ориентированных на их практическое использование в отрасли «Связь»[13].

Наряду с практической деятельностью по созданию речевых диалоговых систем Б. М. Лобанов уделял большое внимание научно-организационной работе. В 1976 году он организовал и провел в Минске Всесоюзную школу-семинар «Автоматическое распознавание слуховых образов» (АРСО), на которой присутствовало более 200 участников из 75 различных научных организаций СССР. Школа-семинар АРСО проводилась регулярно (каждые два года) до 1991 года, а Б. М. Лобанов с 1976 года входил в постоянно действующий программный комитет АРСО. На семинаре участникам АРСО в Минске был впервые продемонстрирован прототип телефонной справочной системы с синтезированным речевым ответом[14].

В 1978 году Лобанов по приглашению французских ученых был направлен в двухмесячную командировку во Францию для научной работы и ознакомления с работой ведущих научных центров речевых исследований: университетов в Париже, Нанси и Экс-ан-Провансе, а также речевых лабораторий в Тулузе, Гренобле, Орсее и Ланионе. В период пребывания во Франции Лобанов принял участие в конференции по речевой связи и был принят в члены Акустического общества франкоязычных стран[14].

В 1979 году Б. М. Лобанов представлял на Всемирной выставке «Телеком-79» в Женеве новую модель синтезатора речи — «Фонемофон-3», отмеченную дипломом выставки. Известный фантаст Артур Кларк, посетив павильон СССР и ознакомившись с синтезатором речи, записал в книгу отзывов: «Вы предвосхитили мои фантазии из фильма „Космическая одиссея 2001 года»[14][15], а швейцарская газета «Обозреватель» опубликовала статью: «Теперь русские изучают иностранные языки с помощью компьютера, который говорит». За комплекс работ по созданию синтезаторов речи в 1981 году Лобанову присвоено звание «Почетный радист СССР»[14].

Научная деятельность в 80-е годы

В начале 1980-х годов Б. М. Лобанов начал развивать предложенный им метод артикуляторно-формантного синтеза речи по тексту, который был положен в основу нового поколения синтезаторов речи. В 1983 году Б. М. Лобанов в соавторстве с В. Я. Кучеровым издал книгу «Синтезированная речь в системах массового обслуживания»[16].

К началу 1984 года Лобанов создал окончательную формулировку и осуществил теоретическую и экспериментальную разработку единого лингвоакустического подхода к решению проблемы синтеза речи по тексту. Разработанные методы и алгоритмы их реализации легли в основу докторской диссертации «Исследование и разработка методов автоматического синтеза речи по фонемному тексту», которую Лобанов успешно защитил в 1984 году в Институте электроники и вычислительной техники Академии наук Латвийской ССР в Риге. Позднее полученные теоретические и экспериментальные результаты были адаптированы для систем синтеза речи на других европейских языках. В частности, к 1987 году была разработана англоязычная версия синтезатора, демонстрировавшаяся на Всемирном конгрессе фонетических наук и получившая высокую оценку англоязычных специалистов[17].

На 1980-е годы приходится период создания первых промышленных систем синтеза и распознавания речи и их широкого внедрения в отрасли «Связь» СССР при непосредственном участии Б. М. Лобанова и его коллег — Б. В. Панченко, Н. П. Дегтярёва, В. П. Афанасьева. В Калининградском ПО «Кварц» была проведена опытно-конструкторская разработка с последующим серийным производством речевого терминала «Марс-1», включающего подсистемы распознавания речи «Сезам» и синтеза речи «Фонемофон». На базе речевого терминала «Марс-1» была разработана система автоматического информирования абонентов междугородной телефонной сети (АИАМТС) о задолженности за переговоры. Система АИАМТС была успешно внедрена и длительное время эксплуатировалась в ряде крупных городов: Минске, Новосибирске, Алма-Ате, Фрунзе, Петропавловске-Камчатском. Другая система — система контроля за параметрами аппаратуры телефонных и радиостанций с оперативным оповещением дежурного персонала о возникших неполадках — была внедрена на Минской, Московской и Зеленоградской АТС, а также на Белорусской республиканской радиоретрансляционной станции РТС-5[18].

Лаборатория распознавания и синтеза речи

В 1988 году Б. М. Лобанов поступил на работу в Институт технической кибернетики АН БССР по приглашению директора института В. С. Танаева и возглавил вновь созданную Лабораторию распознавания и синтеза речи. Переход Б. М. Лобанова в Институт технической кибернетики совпал по времени с появлением первых персональных компьютеров (ПК) и в планах работ лаборатории появилась тематика, связанная с оснащением ПК системами речевого ввода-вывода информации. Формантный метод, который долгое время играл ключевую роль в системах синтеза речи по тексту, не подходил для этой цели из-за необходимости большого объема вычислений в реальном времени. В 1989 году Б. М. Лобановым был предложен новый микроволновой метод (МВ-метод) синтеза речевых сигналов, в котором вместо вычислений формантных колебаний использовался подготовленный заранее набор микроволн естественного речевого сигнала. Под руководством Б. М. Лобанова МВ-метод был реализован сотрудником лаборатории А. Н. Ивановым в синтезаторе «Фонемофон-5». Компактность его программного обеспечения (всего 64 Кб) позволила оснастить синтезом речи уже первые IBM PC/XT и даже отечественные ПК ЕС-1840. Синтезатор речи был востребован во многих практических приложениях незрячими пользователями. В дальнейшем на основе МВ-метода были разработаны версии для чешского и польского языков, а также автономный одноплатный модуль синтеза речи, украинскоязычная версия которого некоторое время работала на линии киевского метро[19].

Учёные степени и звания

  • 13 сентября 1968 года решением Государственного НИИ радио присвоена учёная степень кандидата технических наук по специальности «Радиотехника и связь».
  • 3 октября 1973 года решением Высшей аттестационной комиссии утверждён в учёном звании старшего научного сотрудника по специальности «Радиоприёмные устройства».
  • 26 апреля 1985 года решением Высшей аттестационной комиссии при Совете министров СССР присвоена учёная степень доктора технических наук по специальности «Техническая кибернетика и теория информации».
  • 19 января 1995 года избран действительным членом (академиком) Международной академии информационных процессов и технологий.

Основные публикации

Монографии

Диссертации

  • Кандидатская (1968): «Некоторые вопросы анализа речевых сигналов» по специальности «Радиотехника и связь». Количество страниц: 150.
  • Докторская (1984): «Исследование и разработка методов автоматического синтеза речи по фонемному тексту» по специальности «Техническая кибернетика и теория информации». Количество страниц: 340.[20]

Некоторые статьи в журналах и материалах конференций

  • Лобанов, Б. М. Автоматическое распознавание звукосочетаний в текущем речевом сигнале / Б. М. Лобанов, Г. С. Слуцкер, А. П. Тизик // Труды НИИР. — 1969. — № 4. — C. 67-74.
  • Лобанов, Б. М. Об автоматическом выделении шумных звуков методом фазовой плоскости / Б. М. Лобанов // Акустический журнал. — М., 1970. — Вып. 3. — С. 24-31.
  • Lobanov, B. Classification of Russian Vowels Spoken by Different Speakers // Journal of the Acoustical Society of America. — 1971. — Vol. 2, № 4 (2). — P. 606—608.
  • Lobanov, B. The Phonemophon Text-to-Speech System // Proceedings of the XI-th International Congress of Phonetic Sciences ICPhS’87. — Tallinn, 1987. — P. 120—124.
  • Lobanov, B. TTS-Synthesizer as a Computer Means for Personal Voice Cloning // Phonetics and its Applications. — Stuttgart: Steiner. — 2002. — P. 445—452.
  • Lobanov, B. A Prototype of the Software System for Study, Training and Analysis of Speech Intonation / B. Lobanov, V. Zhitko, V. Zahariev // Speech and Computer: 20th International Conference, SPECOM 2018, Leipzig, Germany, September 18-22, 2018, Proceedings. — Springer, 2018. — P. 337—346.

Примечания

  1. Белорусская энциклопедия = Беларуская энцыклапедыя / Редкол. Г.П. Пашков и др. — Минск: Белорусская энциклопедия имени Петруся Бровки. — Т. 9. — С. 80. — 560 с.
  2. Lobanov B. History and Development of Speech Science and Technology in USSR (англ.) // Eds. D. Mehnert, D. Kordon, M. Wolff Systemtheorie Signalverarbeitung Sprachtechnologie: Rüdiger Hoffmann zum 65. Geburtstag. — Dresden: TUDpress, 2013. — P. 327—338. — ISBN 9783944331195.
  3. Boris Lobanov (англ.). «ResearchGate». Дата обращения: 8 октября 2018.
  4. Б.М. Лабанаў (белор.). Лаборатория распознавания и синтеза речи. Дата обращения: 8 октября 2018. Архивировано 11 сентября 2018 года.
  5. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008.
  6. Искусственный интеллект: Системы общения и экспертные системы, 1990.
  7. Патенты автора ЛОБАНОВ БОРИС МЕФОДЬЕВИЧ. «findpatent.ru». Дата обращения: 8 октября 2018.
  8. 8,0 8,1 8,2 8,3 8,4 Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 7.
  9. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 3.
  10. 10,0 10,1 10,2 Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 8.
  11. 11,0 11,1 11,2 Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 9.
  12. Фонемофон - Синтезатор человеческой речи созданный в институте связи. 1976 год. Дата обращения: 18 марта 2019.
  13. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 9—10.
  14. 14,0 14,1 14,2 14,3 Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 10.
  15. Лобанов, Б.М. К истории русскоговорящих машин (От голоса робота - к персональному клону голоса человека) // Новости искусственного интеллекта. — Москва, 2003. — № 1 (55). — С. 3—9.
  16. Синтезированная речь в системах массового обслуживания, 1983.
  17. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 10—11.
  18. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 11.
  19. Борис Мефодьевич Лобанов: к 70-летию со дня рождения, 2008, с. 11—12.
  20. Исследование и разработка методов автоматического синтеза речи по фонемному тексту. «dslib.net». Дата обращения: 9 октября 2018. Архивировано 30 июня 2018 года.

Литература