Open sourcing wav2letter++, the fastest state-of-the-art speech system, and flashlight, an ML library going native WHAT THE RESEARCH IS: A new fully convolutional approach to automatic speech recognition and wav2letter++, the fastest state-of-the-…
最近,Facebook AI Research(FAIR)宣布了第一个全收敛语音识别工具包wav2letter++.该系统基于完全卷积方法进行语音识别,训练语音识别端到端神经网络的速度是其他框架的两倍以上.他们在博客中详细介绍了这个开源软件. 由于端到端语音识别技术可以容易地扩展到多种语言并且同时保证在各种环境中的识别质量,因此通常认为它是一种有效且稳定的语音识别技术.虽然递归卷积神经网络在处理具有远程依赖性的建模任务(例如语言建模,机器翻译和语音合成)中占主导地位,但是循环架构是端到端语音识别…
http://www.lupaworld.com/proj.php?mod=view&cid=&id=824 语音识别系统 Simon:Simon 是一个开源的语音识别系统,它不仅可以输入文字,而且可以代替键盘.鼠标操作电脑.Simon 基于 Qt 用 C++ 开发,因为某些支持库与 KDE 相同,所以可完美的集成到 KDE 4 中.除 KDE 之外,Simon 也可在 GNOME.Xfce.及其他 X11 环境下运行.…