语音XML开发的例子及规范 This document specifies VoiceXML, the Voice Extensible Markup Language. VoiceXML is designed for creating audio dialogs that feature synthesized speech, digitized audio, recognition of spoken and DTMF key input, recording of spoken inp
这是语音识别技术的第一个例子。 语音技术的概念实际包括两个技术:合成器和识别器(参见图 1)。语音合成器将文本作为输入,并产生 音频流作为输出。语音合成也称为“文本到语音”(text-to-speech,TTS)。另一方面,语音识别器的行 探究 Windows Vista 中新的语音识别与合成 API 为刚好相反。它将音频流作为输入,并将其转换为文本副本。 对于合成器而言,将一串字符转换为听起来符合规范的音频流需要做大量工作。想象其工作方式的最简单 的方法是分析一个两部分系统的前端和后端。
在windows平台上使用pyhton编写语音识别程序需要用到speech模块,speech模块支持的主要功能有:文本合成语音,将键盘输入的文本信息转换为语音信号方式输出;语音识别,将输入的语音信号转为文本等功能
1、安装pywin32,pywin32即Python for Windows Extensions,提供了Pyhton访问和调用Windows底层功能函数的接口,pywin32包括了win32api、win32com、win32gui、win32process等模块,下载地址:http