TIMIT语音库有着准确的音素标注,因此可以应用于语音分割性能评价,同时该数据库又含有几百个说话人语音,所以也是评价说话人识别常用的权威语音库,但该语音库的商业用途是要花钱买的.下面的资源来自与MIT教学实验使用,大概有430多M. 下载地址:http://web.mit.edu/course/6/6.863/share/nltk_lite/ 不需要单个文件下载,可以使用下面的下载工具批量下载. 下载工具:http://www.onlinedown.net/soft/53010.htm The
最近一个web项目中,需要进行语音播报,将动态的文字转换为语音(TTS)存为WAV文件后通过web播放给用户.选择了微软所提供的SAPI (The Microsoft Speech API),只需要几行代码即可实现.主要的问题是选择一个好的中文语音库,让播放的声音更贴近真人.各个中文版操作系统自带的中文语音包如下(通过控制面板的语音属性进行查看): Windows 2000/XP/Vista:无 Windows 7中文版.Windows 2008中文版:Microsoft lili Window