Попробовал сделать распознавание голоса в текст и наоборот – из текста в голос с целью применить это для поиска номера участка по адресу для системы общения с участковыми. До применения дело пока не дошло, но побаловаться уже можно 🙂
Для того чтобы попробовать качество распознавания наберите городской номер (4932)586161 и когда девушка начнёт отвечать донабрать тоновым набором номер 0399. Ну и следовать подсказкам 🙂
Не торопитесь вешать трубку: вначале говорите Вы (до 30 секунд или до 2 секунд тишины), после небольшой паузы сообщают как Вас поняли (голос->текст->голос). Не перезванивая, пробовать можно несколько раз.
Отзывы и комментарии можно оставлять тут 🙂
Работает на ура.
Слова- названия улиц с двойными согласными, например “Сакко” (улица Сакко), всё-же лучше произносить медленнее, чем привычно, подчёркивая “К-К” произношением: “СаК-Ко”.
Дмитрий, молодец! Так держать! 🙂
Описанный выше способ надиктовки способствует корректному, 100%-ному разпознаванию названия вашей улицы! 🙂
Мне много лет уже интересна тема “Синтез и распознавание речи”.
В поисках единомышленников и собеседников на данную тему, я в декабре 2001 года создал тему на крупнейшем форуме Ивановской области:
http://ivbb.ru/viewtopic.php?f=33&t=492244
Пока я сам не опубликовал в этом посте свои познания и мысли в этой сфере, также не осмелился никто другой, хотя прочтений темы было предостаточно.
В ближайшее время я напишу все “интересности”, которые знаю. я надеюсь, что из данной темы получится достойное обсуждение,- хороший обмен знаниями среди знающих, интересующихся темой людей.
Пытливые умы- добро пожаловать! 🙂
Алексей, я очень рад, что реализованное в этом тесте Вам понравилось.
Но в этом больше заслуга Гугла.. он делает распознавание и синтез. Синтез возможен так же через сервера MS…
Я был очень удивлён “до чего дошла техника” и с радостью попытался применить эти достижения к решаемой задаче. Правда, не уверен что оно будет приемлимо для распознавания широкого круга людей, которые не подготовлены и не жаждут произносить адреса чётко, с расстановками.
Прошу прощения,…в декабре 2011 года создал тему… 🙂
Работает. Но в дальнейшем если это будет использоваться, несколько тысяч адресов лучше переозвучить 🙂
их никто и не озвучивал. Это воспроизведение по тексту… без ударений и прочего.
Воспроизведение есть ещё от MS, можно и им попробовать.