科大讯飞语音转文字，ffmpeg将wav转成pcm二进制音频文件

百度和讯飞和其他厂都提供了语音识别的接口，这里使用讯飞的识别将本地手机录的音频文件转成文字

以下注意事项：

1.X_Param 参数开始的时候带了空格导致验证不过，原因是讯飞将字符串做了repelce处理

2.讯飞后台设置白名单IP

3.本地的文件请使用ffmpeg转码成pcm标准格式，

参考：http://ai.baidu.com/docs#/ASR-Tool-convert/top

1.在本地将wav等上传的音频文件ffmpeg转码成pcm格式，方法如下

  /// <summary>

        /// 将Wav音频转成pcm手机音频

        /// </summary>

        /// <param name="applicationPath">ffmeg.exe文件路径</param>

        /// <param name="fileName">WAV文件的路径(带文件名)</param>

        /// <param name="targetFilName">生成目前amr文件路径（带文件名）</param>

        public void ConvertToPcm(string applicationPath, string fileName, string targetFilName)

        {

            string c = applicationPath + @"\\ffmpeg.exe -y -i " + fileName + " -acodec pcm_s16le -f s16le -ac 1 -ar 16000 " + targetFilName;

            var res = Cmd(c);

        }

        /// <summary>

        /// 执行Cmd命令

        /// </summary>

        private string Cmd(string c)

        {

            string strOuput = string.Empty;

            try

            {

                Process p = new Process();

                //设置要启动的应用程序

                p.StartInfo.FileName = "cmd.exe";

                //是否使用操作系统shell启动

                p.StartInfo.UseShellExecute = false;

                // 接受来自调用程序的输入信息

                p.StartInfo.RedirectStandardInput = true;

                //输出信息

                p.StartInfo.RedirectStandardOutput = true;

                // 输出错误

                p.StartInfo.RedirectStandardError = true;

                //不显示程序窗口

                p.StartInfo.CreateNoWindow = true;

                //启动程序

                p.Start();

                //向cmd窗口发送输入信息

                p.StandardInput.WriteLine(c + "&exit");

                p.StandardInput.AutoFlush = true;

                //获取输出信息

                strOuput = p.StandardOutput.ReadToEnd();

                //等待程序执行完退出进程

                p.WaitForExit();

                p.Close();

            }

            catch

            { }

            return strOuput;

        }

2.调用讯飞语音识别转文字，代码如下

            var appid = "xxx";//讯飞申请的appid

            var apikey = "xxxxxxxxxxxxxxxxxxxxx";

            var data = File.ReadAllBytes(path);//path为转化后的pcm文件路径

            string base64_audio = Convert.ToBase64String(data);//将二进制的语音文件转base64

            string body = "audio=" + System.Web.HttpUtility.UrlEncode(base64_audio);

            string url = "http://api.xfyun.cn/v1/service/v1/iat";

            string X_Param = ToBase64String("{ \"engine_type\": \"sms16k\", \"aue\": \"raw\"}");//转base64，注意要保去除空格，因为讯飞后台有去空格操作

            string X_Time = GetTimeStamp(true);//获取时间戳

            HttpContent httpContent = new StringContent(body, Encoding.UTF8, "application/x-www-form-urlencoded");

            httpContent.Headers.Add("X-Param", X_Param);

            httpContent.Headers.Add("X-CurTime", X_Time);

            httpContent.Headers.Add("X-Appid", appid);

            httpContent.Headers.Add("X-CheckSum", MD5String(apikey, X_Time, X_Param));

            var httpClient = new HttpClient();

            HttpResponseMessage response = httpClient.PostAsync(url, httpContent).Result;

            var content = "对不起，识别不出来...";

            if (response.IsSuccessStatusCode)

            {

                var responseJson = JsonHelper.Deserialize<XfResponse>(response.Content.ReadAsStringAsync().Result);

                if (responseJson.code == "0")

                {

                    content = responseJson.data;

                }

                else

                {

                    content = responseJson.code;

                }

            }

科大讯飞语音转文字，ffmpeg将wav转成pcm二进制音频文件的更多相关文章

科大讯飞语音转文字以及中文分词的Java测试代码
我录了一段音存储在这个test.m4a文件里,语音内容为"测试一下Netweaver对于并发请求的响应性能". 使用如下Java代码进行测试: package com.iflyte ...
ffmpeg音频文件转换之使用stdin/stdout或BytesIO对象输入输出
最近在搞小程序录音,然后使用百度接口做语音识别. 小程序目前仅支持mp3和aac编码格式.虽然百度接口提供的m4a格式支持能直接识别小程序的录音文件,但由于自己还有其他一系列需求(比如直接读取数据,根 ...
UI进阶科大讯飞(2) 语音合成(文字转换成语音)
科大讯飞开放平台.SDK下载.添加静态库.初始化见UI进阶科大讯飞(1) 语音听写(语音转换成文字) 实现语音合成功能实现步骤: 导入头文件创建文字识别对象指定文字识别后的回调代理对象开启文 ...
基于科大讯飞语音云windows平台开发
前记: 前段时间公司没事干,突发奇想想做一个语音识别系统,看起来应该非常easy的,但做起来却是各种问题,这个对电气毕业的我,却是挺为难的.谷姐已经离我们而去,感谢度娘,感谢CSDN各位大神,好歹也做 ...
ROS语音交互（三）科大讯飞语音在ROS平台下使用
以上节tts语音输出为例下载sdk链接:http://www.xfyun.cn/sdk/dispatcher 1.下载SDK,解压: 2.在ROS工作空间下创建一个Package: catkin_c ...
AngularJS进阶(十八)在AngularJS应用中集成科大讯飞语音输入功能
在AngularJS应用中集成科大讯飞语音输入功能注:请点击此处进行充电! 前言根据项目需求,需要在首页搜索框中添加语音输入功能,考虑到科大讯飞语音业务的强大能力,遂决定使用科大讯飞语音输入第三方 ...
人工智能-baidu-aip语音识别(语音转文字)
做这个之前,需要在电脑上安装FFmpeg工具,将要转的语音格式转为PCM格式.FFmpeg不需要安装,下载后,打开bin文件夹,然后将路径放在系统环境变量里.记住,要关闭所有打开的Pycharm,然后 ...
Python使用websocket调用语音识别，语音转文字
@ 目录 0. 太长不看系列,直接使用 1. Python调用标贝科技语音识别websocket接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1 ...
手把手使用Python语音识别，进行语音转文字
0. 太长不看系列,直接使用在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_s ...

随机推荐

编写程序来实现实现strcat()功能
strcat(字符数组1,字符串2) 字符串2的内容复制连接在字符数组1的后面,其返回值为字符数组1的地址 /* strcat(字符数组1,字符串2) 字符串2的内容复制连接在字符数组1的后面,其返回 ...
5.Linux常用排查命令
可以使用一下命令查使用内存最多的10个线程 ps aux | sort -k4nr | head -n 10 可以使用一下命令查使用CPU最多的10个线程 ps aux | sor ...
javascript 仿jQuery的无new构造函数
/* 匿名函数传入 window 值全局变量成为局部变量 */ (function(window,undefined) { /* 申明一个名为jQuery 的函数*/ function jQuery ...
linux安装字体库（simSun为例）
在开发过程中,发现报表打印,字体和默认字体不一样.本地开发环境(windows)没问题,但是远程linux一直出现这样的问题.经过排查发现linux没有安装中文字体库宋体. linux查看当前的字体库 ...
MyBatis 源码篇-资源加载
本章主要描述 MyBatis 资源加载模块中的 ClassLoaderWrapper 类和 Java 加载配置文件的三种方式. ClassLoaderWrapper 上一章的案例,使用 org.apa ...
.NET Core 3.0 发布单文件可执行程序
Windows dotnet publish -r win10-x64 /p:PublishSingleFile=true maxOS dotnet publish -r osx-x64 /p:Pub ...
最简单的一个win32程序
#include <windows.h> HINSTANCE g_hInst = NULL; //2 窗口处理函数 LRESULT CALLBACK WndProc( HWND hWnd, ...
微信小程序异步回调
场景如下:现有一个方法需要等待其他N个异步函数执行完毕后执行,callback麻烦的头大,翻了一波API原来小程序已经支持 async函数,那一切就好办了. 废话不多说,直接开始撸... 第一步:打开 ...
c++容易混淆知识点
C ++令人困惑的知识点1 函数传递指针和传递引用之间的区别? 1 GT;指针定义可能未初始化,但引用不可能; 2 - ;引用只能与一个实体组合,指针可以与多个实体组合; 3 GT;加法和减法的含义是 ...
如何使用JDBC连接数据库
1 JDBC:java database connectivity,是java程序与数据库系统通信的标准api 2 下载mysql JDBC驱动,解压缩找到mysql-connector-java-5 ...

科大讯飞语音转文字，ffmpeg将wav转成pcm二进制音频文件

1.在本地将wav等上传的音频文件ffmpeg转码成pcm格式，方法如下

2.调用讯飞语音识别转文字，代码如下

科大讯飞语音转文字，ffmpeg将wav转成pcm二进制音频文件的更多相关文章

随机推荐

热门专题