人耳能听到自然界的声音是20HZ-20KHZ,一般高保真音质采样率只有达到最高采样率的2倍以上即可,平时电话采样率8KHZ,CD音质的采样率44.1KHZ. IBM 的Watson的音频转文字接口支持的音频文件类型为wav.flac.opus,其中前面两个是无损压缩算法,后面一个opus是最新的有损压缩算法. 常见的有损音频算法是MP3,它是MEPG1的音频编码算法,在互联网音频有广泛的应用.然后再MPEG2.MPEG4推荐的音频编码算法是AAC,同样码率下比Mp3的音质更好,同样音质下比MP3