一、百度语音合成

百度语音合成C# SDK主要是基于Rest API,需要互联网调用HTTP接口,Rest API 仅支持最多512个汉字,合成的格式文件为MP3,没有其它的格式。如果想离线使用需下载SDK,Android 或IOS。

1、安装语音合成 C# SDK

C# SDK 现已开源! https://github.com/Baidu-AIP/dotnet-sdk

** 支持平台:.Net Framework 3.5 4.0 4.5, .Net Core 2.0 **

2、方法一:使用Nuget管理依赖 (推荐)

在NuGet中搜索 Baidu.AI,安装最新版即可。

packet地址 https://www.nuget.org/packages/Baidu.AI/

3、源程序界面及代码

  1. #region 百度语音
  2.  
  3. private void simpleButton1_Click(object sender, EventArgs e)
  4. {
  5. if (spinEdit1.Value <= )
  6. {
  7. spinEdit1.Focus();
  8. return;
  9. }
  10. if (trackBarControl1.Value <= )
  11. {
  12. trackBarControl1.Focus();
  13. return;
  14. }
  15.  
  16. if (string.IsNullOrEmpty(textBox1.Text.Trim()))
  17. {
  18. textBox1.Focus();
  19. textBox1.Select();
  20. return;
  21. }
  22.  
  23. // 设置APPID/AK/SK
  24. var APP_ID = "******";
  25. var API_KEY = "******";
  26. var SECRET_KEY = "*****";
  27.  
  28. var client = new Baidu.Aip.Speech.Tts(API_KEY, SECRET_KEY);
  29. client.Timeout = ; // 修改超时时间
  30.  
  31. // 可选参数
  32. var option = new Dictionary<string, object>()
  33. {
  34. {"spd", spinEdit1.Value}, // 语速
  35. {"vol", trackBarControl1.Value}, // 音量
  36. {"per", comboBoxEdit1.SelectedIndex} // 发音人,4:情感度丫丫童声
  37. };
  38. var result = client.Synthesis(textBox1.Text, option);
  39.  
  40. if (xtraSaveFileDialog1.ShowDialog() == System.Windows.Forms.DialogResult.OK)
  41. {
  42.  
  43. if (result.ErrorCode == ) // 或 result.Success
  44. {
  45. File.WriteAllBytes(xtraSaveFileDialog1.FileName, result.Data);
  46. }
  47. }
  48. }
  49.  
  50. #endregion

接口参数说明:

二、科大讯飞语音合成

科大讯飞没有c# SDK,采用WebAPi的形式调用。不过请注意该接口使用的HTTP API协议不支持跨域。

1、接口调用流程

注: 调用接口前需配置IP白名单,IP白名单规则请参照 IP白名单。(由于我之前没有设置正确的IP,导致接口调用不成功)可以在百度里面输入IP将会显示你的互联网IP

  1. 通过接口密钥基于MD5计算签名,将签名以及其他参数放在Http Request Header中 。
  2. 将文本数据放在Http Request Body中 。
  3. 向服务器端发送Http请求后,接收服务器端的返回结果。

注: 在控制台添加服务后,点击“发音人管理”可自行添加并试用发音人,添加后会显示该发音人参数值,设置参数voice_name为相应的发音人参数值即可。

2、程序界面及源代码

源代码

  1. public class Rootobject
  2. {
  3. public string auf { get; set; }
  4. public string aue { get; set; }
  5. public string voice_name { get; set; }
  6. public string speed { get; set; }
  7. public string volume { get; set; }
  8. public string pitch { get; set; }
  9. public string engine_type { get; set; }
  10. public string text_type { get; set; }
  11. }
  1. String Md5(string s)
  2. {
  3. System.Security.Cryptography.MD5 md5 = new System.Security.Cryptography.MD5CryptoServiceProvider();
  4. byte[] bytes = System.Text.Encoding.UTF8.GetBytes(s);
  5. bytes = md5.ComputeHash(bytes);
  6. md5.Clear();
  7. string ret = "";
  8. for (int i = ; i < bytes.Length; i++)
  9. {
  10. ret += Convert.ToString(bytes[i], ).PadLeft(, '');
  11. }
  12. return ret.PadLeft(, '');
  13. }
  1. #region 把流转换成缓存流
  2. MemoryStream StreamToMemoryStream(Stream instream)
  3. {
  4. MemoryStream outstream = new MemoryStream();
  5. const int bufferLen = ;
  6. byte[] buffer = new byte[bufferLen];
  7. int count = ;
  8. while ((count = instream.Read(buffer, , bufferLen)) > )
  9. {
  10. outstream.Write(buffer, , count);
  11. }
  12. return outstream;
  13. }
  14. #endregion
  1. #region 把缓存流转换成字节组
  2. public static byte[] streamTobyte(MemoryStream memoryStream)
  3. {
  4. byte[] buffer = new byte[memoryStream.Length];
  5. memoryStream.Seek(, SeekOrigin.Begin);
  6. memoryStream.Read(buffer, , buffer.Length);
  7. return buffer;
  8. }
  9. #endregion
  1. private void simpleButton2_Click(object sender, EventArgs e)
  2. {
  3.  
  4. // 应用APPID(必须为webapi类型应用,并开通语音合成服务,参考帖子如何创建一个webapi应用:http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=36481)
  5. string appID = "****";
  6. // 接口密钥(webapi类型应用开通合成服务后,控制台--我的应用---语音合成---相应服务的apikey)
  7. string APIKey = "****";
  8. // 语音合成webapi接口地址
  9. String url = "http://api.xfyun.cn/v1/service/v1/tts";
  10. String bodys;
  11. // 待合成文本
  12. string text = memoEdit1.Text;
  13. // 对要合成语音的文字先用utf-8然后进行URL加密
  14. byte[] textData = Encoding.UTF8.GetBytes(text);
  15.  
  16. text = HttpUtility.UrlEncode(textData);
  17. bodys = string.Format("text={0}", text);
  18.  
  19. //aue = raw, 音频文件保存类型为 wav或者pcm
  20. //aue = lame, 音频文件保存类型为 mp3
  21. string AUE = "lame";
  22.  
  23. Rootobject root = new Rootobject();
  24. root.aue = AUE;
  25. root.auf = "audio/L16;rate=16000";
  26. root.speed = speed.Value.ToString();
  27. root.pitch = pitch.Value.ToString();
  28. root.volume = volume.Value.ToString();
  29. root.voice_name = voice_name.Text.Split('-')[];
  30. root.engine_type = engine_type.Text.Split('-')[];
  31. root.text_type = "text";
  32. string param = Newtonsoft.Json.JsonConvert.SerializeObject(root);
  33. // 获取十位的时间戳
  34. TimeSpan ts = DateTime.UtcNow - new DateTime(, , , , , , );
  35. string curTime = Convert.ToInt64(ts.TotalSeconds).ToString();
  36. // 对参数先utf-8然后用base64编码
  37. byte[] paramData = Encoding.UTF8.GetBytes(param);
  38. string paraBase64 = Convert.ToBase64String(paramData);
  39. // 形成签名
  40. string checkSum = Md5(APIKey + curTime + paraBase64);
  41. // 组装http请求头
  42. HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
  43. request = (HttpWebRequest)WebRequest.Create(url);
  44. request.Method = "POST";
  45. request.ContentType = "application/x-www-form-urlencoded";
  46. request.Headers.Add("X-Param", paraBase64);
  47. request.Headers.Add("X-CurTime", curTime);
  48. request.Headers.Add("X-Appid", appID);
  49. request.Headers.Add("X-CheckSum", checkSum);
  50.  
  51. Stream requestStream = request.GetRequestStream();
  52. StreamWriter streamWriter = new StreamWriter(requestStream, Encoding.GetEncoding("gb2312"));
  53. streamWriter.Write(bodys);
  54. streamWriter.Close();
  55.  
  56. String htmlStr = string.Empty;
  57. HttpWebResponse response = request.GetResponse() as HttpWebResponse;
  58. Stream responseStream = response.GetResponseStream();
  59.  
  60. using (StreamReader reader = new StreamReader(responseStream, Encoding.GetEncoding("UTF-8")))
  61. {
  62. string header_type = response.Headers["Content-Type"];
  63. if (header_type == "audio/mpeg")
  64. {
  65. Stream st = response.GetResponseStream();
  66. MemoryStream memoryStream = StreamToMemoryStream(st);
  67.  
  68. if (xtraSaveFileDialog2.ShowDialog() == System.Windows.Forms.DialogResult.OK)
  69. {
  70. // 保存音频文件地址和音频格式类型
  71. File.WriteAllBytes(xtraSaveFileDialog2.FileName, streamTobyte(memoryStream));
  72. }
  73.  
  74. Console.WriteLine(response.Headers);
  75. Console.ReadLine();
  76. }
  77. else
  78. {
  79. htmlStr = reader.ReadToEnd();
  80. Console.WriteLine(htmlStr);
  81. Console.ReadLine();
  82. }
  83. }
  84. responseStream.Close();
  85. }
  86.  
  87. #endregion
  88. }

通过尝试百度和科大讯飞两个语音合成接口,发现科大讯飞语音比较好一些,百度有些词语会读错。

基于C# 百度AI和科大汛飞语音合成SDK的更多相关文章

  1. 基于百度AI开放平台的人脸识别及语音合成

    基于百度AI的人脸识别及语音合成课题 课题需求 (1)人脸识别 在Web界面上传人的照片,后台使用Java技术接收图片,然后对图片进行解码,调用云平台接口识别人脸特征,接收平台返回的人员年龄.性别.颜 ...

  2. 百度ai 基于node 语音识别 音频文件类型转换

    百度ai 基于node 语音识别 音频文件类型转换 项目简介 源代码移步:https://github.com/xuess/ai-baidu-node 本项目主要功能为,本地音频语音识别和文件类型转换 ...

  3. 基于Flask和百度AI实现与机器人对话

    实现对话机器人主要有个步骤 : 一.前端收集语音传入后端 二.后端基于百度AI接口进行语音识别,转换成文字 三.对文字进行自定义验证或通过图灵端口进行处理,生成回复内容 四.将文字通过百度AI接口合成 ...

  4. python基于百度AI开发文字识别

    很多场景都会用到文字识别,比如app或者网站里都会上传身份证等证件以及财务系统识别报销证件等等 第一步,你需要去百度AI里去注册一个账号,然后新建一个文字识别的应用 然后你将得到一个API Key 和 ...

  5. 基于百度ai,图灵机器人,Flask 实现的网站语音智能问答

    准备以下模块中的函数 from aip import AipSpeech import time import os import requests APP_ID = '15420654' API_K ...

  6. Python人工智能-基于百度AI接口

    参考百度AI官网:http://ai.baidu.com/ 准备工作: 支持Python版本:2.7.+ ,3.+ 安装使用Python SDK有如下方式 >如果已经安装了pip,执行 pip ...

  7. 基于百度AI人脸识别技术的Demo

    编写demo之前首先浏览官方API:http://ai.baidu.com/docs#/Face-API/top 下面是源码: package com.examsafety.test; import ...

  8. 全干货!百度AI快车道艾尼专场成都站开启报名

    成都市自年初出台<成都市加快人工智能产业发展推进方案(2019-2022年)>以来,便积极推动相关企业落地.强化人才培养并推进人工智能与传统行业融合应用,在AI赛道上不断"加速& ...

  9. 了解人工智能?-百度AI

    了解人工智能? 什么是人工智能? 由人创造的"智慧能力",同样具备智慧生物的能力 耳朵=倾听=麦克风=语音识别 ASR Automatic Speech Recognition 嘴 ...

随机推荐

  1. 七种CSS左侧固定,右侧自适应两栏布局

    一 两栏布局基本HTML和CSS 首先创建基本的HTML布局和最基本的样式. 基本的样式是,两个盒子相距20px, 左侧盒子宽120px,右侧盒子宽度自适应 <div class="w ...

  2. [TimLinux] Python Django myblog启动

    1. myblog介绍 自己给自己定的一个学习项目,用于: 使用学到的Python Web开发技术,框架django 使用学到的CSS技术,实现前端功能 使用学到的Axure工具,画出前端页面功能草图 ...

  3. Orleans 序列化遇到的坑

    真的是巨坑 搞明白问题的我简直无法用言语来描述我的心情 先上架构图 理想中的架构 服务随便上 网关只负责分发 然后跟随官方教程写遇到了序列化问题 以前有经验,不慌,以前稀里糊涂就搞定了. 再然后遇到一 ...

  4. Everspin非易失性MRAM切换技术

    切换MRAM技术 切换MRAM使用1个晶体管,1个MTJ单元来提供简单的高密度存储器.Everspin使用获得专利的Toggle电池设计,可提供高可靠性.数据在温度下20年始终是非易失性的. 在读取期 ...

  5. Spring 学习,看松哥这一篇万余字干货就够了!

    1. Spring 简介 我们常说的 Spring 实际上是指 Spring Framework,而 Spring Framework 只是 Spring 家族中的一个分支而已.那么 Spring 家 ...

  6. 关于页面打印window.print()的样式问题

    当我们打印网页的时候.有时候会发现.打印出来的.跟网页上看到的样式的差别有点大.这其中可能有的问题是.样式问题. 当调用打印(window.print())方法时.打印机会在网页的样式中查找 @med ...

  7. Elasticsearch系列---初识搜索

    概要 本篇主要介绍搜索的报文结构含义.搜索超时时间的处理过程,提及了一下多索引搜索和轻量搜索,最后将精确搜索与全文搜索做了简单的对比. 空搜索 搜索API最简单的形式是不指定索引和类型的空搜索,它将返 ...

  8. 《Java知识应用》Java Excel读取(xls、xlsx)和写入

    第一步: 链接: https://pan.baidu.com/s/1emJpl7cpvKZyRMzWccAhJA 提取码: p3a7 复制这段内容后打开百度网盘手机App,操作更方便哦 下载jar包: ...

  9. 微信小程序视图层介绍及用法

    一. 视图层 WXML(WeiXin Markup Language)是框架设计的一套标签语言,结合基础组件.事件系统,可以构建出页面的结构. 1.1. 数据绑定 1.1.1. 普通写法 <vi ...

  10. Ajax 的基本使用

    Ajax简介 一门异步的加载技术,局部刷新 异步加载,可以在不重载整个网页的前提下,进行局部刷新 分为原生和JQ两种 JSON数据格式 Json对象转字符串: JSON.stringify() 字符串 ...