направление.RU / интернет-системы / НИР «Синтез речи» |
Интернет-технологии "Направление РУ" |
||||||||||||||||||
|
Синтез русской речиТо, что вчера было фантастикой, сегодня становится удивительной реальностью, а завтра привычным бытом ... Мудрость жизни
Направление РУ и МФТИ начали совместную НИР по созданию алгоритма синтеза русской речи. Позвонить нам бесплатно |
Во многих фантастических рассказах существуют роботы, машины с искусственным интеллектом и всякие другие штучки, которые понимают то, что вы им говорите и как-то на это реагируют, и даже отвечают вполне разумно.
Сегодня многие устройства могут сообщать информацию человеческим голосом, например, классно это делают автомобильные навигаторы. Правда, с пониманием речи компьютерами сегодня все еще проблемы. Да собственно и голосовые сообщения, как правило, не синтезируются, а составляются из заранее записанных человеком фраз. Но, как говориться, лед тронулся, и на рынке появились и даже стали востребованы синтезаторы речи на основе произвольного текста. Однако стать массовыми и популярными им мешает, выражаясь не научно, отсутствие души, а что нужно сделать с научной точки зрения разрабатывают совместно сотрудники и ученые из Направления и МФТИ. С этой целью мы открыли проект - «Создание синтезатора русской речи с естественным произношением». Что имеемСегодня можно найти довольно много программ, синтезирующих речь по произвольному тексту. Некоторые из них показывают довольно неплохие результаты при первом знакомстве, однако после достаточно непродолжительного использования, большинство приобретателей перестают ими пользоваться, почему?: Искусственность речи Т.е. достаточно качественный синтезатор с хорошо подобранной фонетической базой будет прекрасно восприниматься на слух в течение 15 – 20 минут, но потом абсолютное большинство людей перестает воспринимать смысл того, что произносится. А просходит это из-за того, что для прослушивания синтезированной речи используются дополнительные центры обработки головного мозга, и мозг просто устает. Т.о. головной мозг не воспринимает синтезированную речь как естественную, которая сразу обрабатывается в речевом центре. Подобный эффект многие испытывали на себе изучая иностранный язык. Вспомните институт и лингафонный кабинет – через те же 15 – 20 минут прослушивания иностранного текста в нем очень хорошо засыпалось :-). Эмоции Очевидно, для решения этой задачи требуются технологии из области создания искусственного интеллекта, а именно первая ступенька - «извлечение смысла» из воспроизводимого текста. Т.е. необходимо делать синтезатор на стыке наук. Столкновение с реальностью Это объясняется тоже достаточно просто. Т.к. для обработки синтезированной речи головной мозг использует дополнительные центры, то при наличии постороннего шума, разговора или необходимости слушателю делать какую-то работу, мозг просто не справляется («перегружается») и человек перестает понимать смысл произносимого. Эффект помех существенно ограничивает возможности применения синтезатора в реальных условиях техногенных, производственных и других шумов. Что хотим
А хотим мы получить в результате выполнения НИР новую технологию синтеза русской речи, которая бы решала перечисленные выше задачи. И таким образом сделать очередной небольшой шажок к будущему, к созданию систем с искусственным интеллектом.
Сроки выполнения 2007 - 2009 гг. Что потом
А потом второй небольшой шажок к распознаванию речи ...
|
|
© 2000-2024 Направление.RU |
|
|||||||||||||||||
(495) 212 13 02 117997, Москва, ул. Профсоюзная, дом 84/32 Наши вакансии |