最近发现有声读物能极大促进我的睡眠,但每个前面都有一段开场语,想把它剪掉,但是有多个开场语,所以就要用到语音识别判断一下再剪. 前两年在本地搭建过识别的环境,奈何识别准确率不行,只能找找API了,后面有时间再弄本地的吧.下面是几个大厂提供的服务,就我个人使用来看,讯飞 > Google > IBM, 但在中文识别准确度上,讯飞是最强的. Oracle: 被它的Always Free计划吸了一波粉,但是提供的转写服务不支持中文,pass IBM 优点:有一定的持续免费额度 缺点:准确度不够,官网…