Побалуемся? :)

Попробовал сделать распознавание голоса в текст и наоборот – из текста в голос с целью применить это для поиска номера участка по адресу для системы общения с участковыми. До применения дело пока не дошло, но побаловаться уже можно 🙂

Для того чтобы попробовать качество распознавания наберите городской номер (4932)586161 и когда девушка начнёт отвечать донабрать тоновым набором номер 0399. Ну и следовать подсказкам 🙂

Не торопитесь вешать трубку: вначале говорите Вы (до 30 секунд или до 2 секунд тишины), после небольшой паузы сообщают как Вас поняли (голос->текст->голос). Не перезванивая, пробовать можно несколько раз.

Отзывы и комментарии можно оставлять тут 🙂

Вам понравилось? Поделитесь с другими:
  1. Работает на ура.
    Слова- названия улиц с двойными согласными, например “Сакко” (улица Сакко), всё-же лучше произносить медленнее, чем привычно, подчёркивая “К-К” произношением: “СаК-Ко”.
    Дмитрий, молодец! Так держать! 🙂

  2. Описанный выше способ надиктовки способствует корректному, 100%-ному разпознаванию названия вашей улицы! 🙂

  3. Мне много лет уже интересна тема “Синтез и распознавание речи”.
    В поисках единомышленников и собеседников на данную тему, я в декабре 2001 года создал тему на крупнейшем форуме Ивановской области:
    http://ivbb.ru/viewtopic.php?f=33&t=492244

    Пока я сам не опубликовал в этом посте свои познания и мысли в этой сфере, также не осмелился никто другой, хотя прочтений темы было предостаточно.
    В ближайшее время я напишу все “интересности”, которые знаю. я надеюсь, что из данной темы получится достойное обсуждение,- хороший обмен знаниями среди знающих, интересующихся темой людей.
    Пытливые умы- добро пожаловать! 🙂

    • Алексей, я очень рад, что реализованное в этом тесте Вам понравилось.
      Но в этом больше заслуга Гугла.. он делает распознавание и синтез. Синтез возможен так же через сервера MS…

      Я был очень удивлён “до чего дошла техника” и с радостью попытался применить эти достижения к решаемой задаче. Правда, не уверен что оно будет приемлимо для распознавания широкого круга людей, которые не подготовлены и не жаждут произносить адреса чётко, с расстановками.

  4. Прошу прощения,…в декабре 2011 года создал тему… 🙂

  5. Работает. Но в дальнейшем если это будет использоваться, несколько тысяч адресов лучше переозвучить 🙂

    • их никто и не озвучивал. Это воспроизведение по тексту… без ударений и прочего.
      Воспроизведение есть ещё от MS, можно и им попробовать.

Оставить комментарий


Примечание - Вы можете использовать эти HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>