语音语音合成科大讯飞和Tizen-TTS语音合成引擎

废话就不多说了，开始。。。

最近在做一个文本转语音TTS(Text to Speech)的第三方软件封装，应用的是海内语音技术龙头安徽科大讯飞公司提供的离线引擎AiSound5.0，重要用于汽车导航用途。科大讯飞还提供了AiTalk用于语音识别，AiWrite用于手写识别服务等。另外还有针对6种平台的SDK和开辟示例。

一、科大讯飞语音平台

科大讯飞目前有不少产品应用在移动终端上了，比如说用在手机上的讯飞语点，可方便语音拨打电话和发送短信，查气候、股票等信息。

在上面讯飞语音云这个网站可以找到科大讯飞针对6种平台的SDK，http://open.voicecloud.cn/download.php，包含Android、Iphone、Windows、Linux、Java、Flash这些平台的语音合成、语音识别和语音听写的开辟文档和SDK下载，不过应用之前须要请求AppID(每一个语音应用程序须要一个Appid来独一标识，您须要通过注册帐号来获得自己应用的Appid，未注册的语音应用将无法正常获取语音服务。)，通过考核后就可以下载响应的开辟文档和SDK并用于自己的软件系统中了。

二、科大讯飞语音合成、识别-在线文档和应用程序示例网址

从这里可以查看在线的开辟文档http://open.voicecloud.cn/developer.php?column=aW50ZV9zZGs%3D

Android平台的开辟文档和应用程序示例：http://open.voicecloud.cn/developer.php?category=YW5kcm9pZA%3D%3D&column=ZG9jdW1lbnQ%3D&type=d2lkZ2V0#a38

Windows和Linux平台的开辟文档和程序示例：http://open.voicecloud.cn/developer.php?category=b3RoZXI%3D&column=ZG9jdW1lbnQ%3D&type=YXBp

三、科大讯飞语音产品的移动应用

这里有一个科大讯飞的在线语音合成系统演示程序：ViViVoice 2.1在线演示系统

http://www.iflytek.com/TtsDemo/viviVoiceShow.aspx

1、讯飞语点的应用，官网下载网址如下：http://yudian.voicecloud.cn/yudian.htm，支持Android和Iphone两大平台。

2、讯飞输入法应用：http://ime.voicecloud.cn/index.html

3、讯飞语音输入法应用：http://kouxun.voicecloud.cn/index.html

4、开辟者社区：http://open.voicecloud.cn/index.php

四、官网的Windows平台-语音合成和识别示例代码

网址如下：http://open.voicecloud.cn/developer.php?category=b3RoZXI%3D&column=c2FtcGxl&type=YXBp

以Windows下的开辟为例，给出了语音合成、语音识别和语音听写的编程示例。

1、语音合成开辟例程

#include <stdio.h>

 #include <string.h>

 #include "qtts.h"

 #define END_SYNTH( reason ) \

 { \

 ret = QTTSSessionEnd( session_id, #reason ); \

 if( 0 != ret ) \

 { \

 printf("QTTSSessionEnd failed, error code is %d", ret ); \

 } \

 \

 ret = QTTSFini(); \

 if( 0 != ret ) \

 { \

 printf("QTTSFini failed, error code is %d", ret ); \

 } \

 }

 int main()

 {

 const char* configs = NULL;

 const char* session_id = NULL;

 const char* synth_params = NULL;

 const char* synth_text = NULL;

 unsigned int text_len = 0;

 const char* synth_speech = NULL;

 unsigned int synth_speech_len = 0;

 FILE* f_speech = NULL;

 int synth_status = 0;

 int ret = 0;

 printf( "===================================================================\n"

 " Mobile Speech Platform 2.0 Client SDK Demo for TTS \n"

 "===================================================================\n" );

 /* 初始化 */

configs = "server_url=dev.voicecloud.cn/index.htm, timeout=10000, coding_libs=speex.dll";

 ret = QTTSInit( configs );

 if( 0 != ret )

 {

 printf( "QTTSInit failed, error code is %d", ret );

 return -1;

 }

 /* 开始一路会话，应用会话模式 */

synth_params = "ssm=1, auf=audio/L16;rate=16000, aue=speex-wb;7, ent=intp65";

 session_id = QTTSSessionBegin( synth_params, &ret );

 if( 0 != ret )

 {

 printf( "QTTSSessionBegin failed, error code is %d", ret );

 return -1;

 }

 /* 写入合成文本 */

synth_text = "讯飞语音云为您提供了最新最好的语音技术休会，"

 "我们在互联网上开放科大讯飞最新研发的各种语音技术，"

 "包含世界领先的语音合成技术、语音识别技术、声纹识别技术等。";

text_len = strlen( synth_text );

 ret = QTTSTextPut( session_id, synth_text, text_len, NULL );

 if( 0 != ret )

 {

 printf( "QTTSTextPut failed, error code is %d", ret );

 END_SYNTH( QTTSTextPut failed! );

 return -1;

 }

 /* 获取合成音频 */

f_speech = fopen( "synth_speech.pcm", "wb" );

 if( NULL == f_speech )

 {

 printf( "Can not open file \"synth_speech.pcm\"" );

 END_SYNTH( open file );

 return -1;

 }

 while( TTS_FLAG_DATA_END != synth_status )

 {

 synth_speech = QTTSAudioGet( session_id, &synth_speech_len, &synth_status, &ret );

 if( 0 != ret )

 {

 printf( "QTTSAudioGet failed, error code is: %d", ret );

 break;

 }

 printf( "QTTSAudioGet ok, speech length = %d\n", synth_speech_len );

 if( NULL != synth_speech && 0 != synth_speech_len )

 {

 fwrite( synth_speech, 1, synth_speech_len, f_speech );

 }

 }

 fclose( f_speech );

 /* 结束会话，释放资源 */

ret = QTTSSessionEnd( session_id, "normal end" );

 if( NULL == f_speech )

 {

 printf( "QTTSSessionEnd failed, error code is %d", ret );

 }

 session_id = NULL;

 ret = QTTSFini();

 if( 0 != ret )

 {

 printf( "QTTSFini failed, error code is %d", ret );

 }

 return 0;

 }

2、语音识别开辟例程

每日一道理
流逝的日子像一片片凋零的枯叶与花瓣，渐去渐远的是青春的纯情与浪漫。不记得曾有多少雨飘在胸前风响在耳畔，只知道沧桑早已漫进了我的心爬上了我的脸。当一个人与追求同行，便坎坷是伴，磨难也是伴。

#include <stdio.h>

 #include <string.h>

 #include <Windows.h>

 #include "qisr.h"

 #define END_RECOG( reason ) \

 { \ ret = QISRSessionEnd( session_id, #reason ); \

 if( 0 != ret ) \

 { \ printf("QISRSessionEnd failed, error code is %d", ret ); \

 } \

 \

 ret = QISRFini(); \

 if( 0 != ret ) \

 { \

 printf("QISRFini failed, error code is %d", ret ); \

 } \

 }

 #define BLOCK_LEN 5 * 1024

 int main()

 {

 const char* configs = NULL;

 const char* session_id = NULL;

 const char* recog_grammar = NULL;

 const char* recog_params = NULL;

 char recog_audio[ BLOCK_LEN ];

 FILE* f_speech = NULL;

 int audio_status = 0;

 int ep_status = 0;

 int rec_status = 0;

 int rslt_status = 0;

 const char* rec_result = NULL;

 unsigned int audio_len = 0;

 int ret = 0;

 printf( "===================================================================\n"

 " Mobile Speech Platform 2.0 Client SDK Demo for IAT \n"

 "===================================================================\n" );

 /* 初始化 */

configs = "server_url=dev.voicecloud.cn/index.htm, coding_libs=speex.dll, vad_enable=true";

 ret = QISRInit( configs );

 if( 0 != ret )

 {

 printf( "QISRInit failed, error code is %d\n", ret );

 return -1;

 }

 /* 开始一路会话，应用会话模式，应用引擎内置的语法停止识别 */

recog_grammar = "builtin:grammar/../search/location.abnf?language=zh-cn";

 recog_params = "ssm=1, aue=speex-wb;7, auf=audio/L16;rate=16000, “

 ”ent=map, vad_speech_tail=900";

 session_id = QISRSessionBegin( recog_grammar, recog_params, &ret );

 if( 0 != ret )

 {

 printf( "QISRSessionBegin failed, error code is %d\n", ret );

 return -1;

 }

 /* 打开用来停止识别的语音文件，用户可以采取其他的获取音频的方式比如实时采集音频 */

f_speech = fopen( "sxk_16k.pcm", "rb" );

 if( NULL == f_speech )

 {

 printf( "Can not open file \"sxk_16k.pcm\"\n" );

 END_RECOG( open file );

 return -1;

 }

 /* 发送音频数据，获取语音听写结果 */

while( ISR_AUDIO_SAMPLE_LAST != audio_status )

 {

 audio_len = fread( recog_audio, 1, BLOCK_LEN, f_speech );

 audio_status = ( audio_len == BLOCK_LEN ) ?

 ISR_AUDIO_SAMPLE_CONTINUE :ISR_AUDIO_SAMPLE_LAST;

 ret = QISRAudioWrite( session_id, recog_audio, audio_len

 , audio_status, &ep_status, &rslt_status );

 if( 0 != ret )

 {

 printf( "QISRSessionBegin failed, error code is %d\n", ret );

 rslt_status = ISR_REC_STATUS_SPEECH_COMPLETE;

 break;

 }

 printf( "write audio data ok! len=%d, status=%d\n", audio_len, audio_status );

 /* 已经有结果缓存在MSC中了，可以获取了 */

if( ISR_REC_STATUS_SUCCESS == rslt_status )

 {

 rec_result = QISRGetResult( session_id, &rslt_status, 5000, &ret );

 if( 0 != ret )

 {

 printf( "QISRGetResult failed, error code is %d\n", ret );

 rslt_status = ISR_REC_STATUS_SPEECH_COMPLETE;

 break;

 }

 if( NULL != rec_result )

 { printf( "got a result: %s\n", rec_result );

 }

 /* 全部结果已经取完了 */

if( ISR_REC_STATUS_SPEECH_COMPLETE == rslt_status )

 {

 printf( "the result has been got completely!\n" );

 break;

 }

 }

 /* 检测到音频后端点，结束音频发送 */

if( ISR_EP_AFTER_SPEECH == ep_status )

 { printf( "end point of speech has been detected!\n" );

 break;

 }

 Sleep( 160 );

 }

 fclose( f_speech );

 /* 获取余下的识别结果 */

while( ISR_REC_STATUS_SPEECH_COMPLETE != rslt_status )

 {

 rec_result = QISRGetResult( session_id, &rslt_status, 5000, &ret );

 if( 0 != ret )

 {

 printf( "QISRGetResult failed, error code is: %d\n", ret );

 break;

 }

 if( NULL != rec_result )

 {

 printf( "got a result: %s\n", rec_result );

 }

 /* sleep一下很有必要，防止MSC端无缓存的识别结果时浪费CPU资源 */

Sleep( 200 );

 }

 /* 结束会话，释放资源 */

ret = QISRSessionEnd( session_id, "normal end" );

 if( NULL == f_speech )

 {

 printf( "QISRSessionEnd failed, error code is %d\n", ret );

 }

 session_id = NULL;

 ret = QISRFini();

 if( 0 != ret )

 {

 printf( "QISRFini failed, error code is %d\n", ret );

 }

 return 0;

 }

3、语音听写开辟例程

#include <stdio.h>

 #include <string.h>

 #include <Windows.h>

 #include "qisr.h"

 #define END_RECOG( reason ) \

 { \

 ret = QISRSessionEnd( session_id, #reason ); \

 if( 0 != ret ) \

 { \

 printf("QISRSessionEnd failed, error code is %d", ret ); \

 } \

 \

 ret = QISRFini(); \

 if( 0 != ret ) \

 { \

 printf("QISRFini failed, error code is %d", ret ); \

 } \

 }

 #define BLOCK_LEN 5 * 1024

 int main()

 {

 const char* configs = NULL;

 const char* session_id = NULL;

 const char* recog_params = NULL;

 char recog_audio[ BLOCK_LEN ];

 FILE* f_speech = NULL;

 int audio_status = 0;

 int ep_status = 0;

 int rec_status = 0;

 int rslt_status = 0;

 const char* rec_result = NULL;

 unsigned int audio_len = 0;

 int ret = 0;

 printf( "===================================================================\n"

 " Mobile Speech Platform 2.0 Client SDK Demo for IAT \n"

 "===================================================================\n" );

 /* 初始化 */

configs = "server_url=dev.voicecloud.cn/index.htm, coding_libs=speex.dll, vad_enable=true";

 ret = QISRInit( configs );

 if( 0 != ret )

 {

 printf( "QISRInit failed, error code is %d\n", ret );

 return -1;

 }

 /* 开始一路会话 */

recog_params = "ssm=1, sub=iat, aue=speex-wb;7, auf=audio/L16;rate=16000, “

 “ent=sms16k, rst=plain, vad_speech_tail=1500";

 session_id = QISRSessionBegin( NULL, recog_params, &ret );

 if( 0 != ret )

 {

 printf( "QISRSessionBegin failed, error code is %d\n", ret );

 return -1;

 }

 /* 打开用来停止识别的语音文件，用户可以采取其他的获取音频的方式比如实时采集音频 */

f_speech = fopen( "IAT_16KPCM_10s_0.pcm", "rb" );

 if( NULL == f_speech )

 {

 printf( "Can not open file \"IAT_16KPCM_10s_0.pcm\"\n" );

 END_RECOG( open file );

 return -1;

 }

 /* 发送音频数据，获取语音听写结果 */

while( ISR_AUDIO_SAMPLE_LAST != audio_status )

 {

 audio_len = fread( recog_audio, 1, BLOCK_LEN, f_speech );

 audio_status = ( audio_len == BLOCK_LEN ) ?

 ISR_AUDIO_SAMPLE_CONTINUE :ISR_AUDIO_SAMPLE_LAST;

 ret = QISRAudioWrite( session_id, recog_audio, audio_len, audio_status, &ep_status, &rslt_status );

 if( 0 != ret )

 {

 printf( "QISRSessionBegin failed, error code is %d\n", ret );

 rslt_status = ISR_REC_STATUS_SPEECH_COMPLETE;

 break;

 }

 printf( "write audio data ok! len=%d, status=%d\n", audio_len, audio_status );

 /* 已经有结果缓存在MSC中了，可以获取了 */

if( ISR_REC_STATUS_SUCCESS == rslt_status )

 { rec_result = QISRGetResult( session_id, &rslt_status, 5000, &ret );

 if( 0 != ret )

 {

 printf( "QISRGetResult failed, error code is %d\n", ret );

 rslt_status = ISR_REC_STATUS_SPEECH_COMPLETE;

 break;

 }

 if( NULL != rec_result )

 {

 printf( "got a result: %s\n", rec_result );

 }

 /* 全部结果已经取完了 */

if( ISR_REC_STATUS_SPEECH_COMPLETE == rslt_status )

 {

 printf( "the result has been got completely!\n" );

 break;

 }

 }

 /* 检测到音频后端点，结束音频发送 */

if( ISR_EP_AFTER_SPEECH == ep_status )

 {

 printf( "end point of speech has been detected!\n" );

 break;

 }

 Sleep( 160 );

 }

 fclose( f_speech );

 /* 获取余下的识别结果 */

while( ISR_REC_STATUS_SPEECH_COMPLETE != rslt_status )

 {

 rec_result = QISRGetResult( session_id, &rslt_status, 5000, &ret );

 if( 0 != ret )

 {

 printf( "QISRGetResult failed, error code is: %d\n", ret );

 break;

 }

 if( NULL != rec_result )

 {

 printf( "got a result: %s\n", rec_result );

 }

 /* sleep一下很有必要，防止MSC端无缓存的识别结果时浪费CPU资源 */

Sleep( 200 );

 }

 /* 结束会话，释放资源 */

ret = QISRSessionEnd( session_id, "normal end" );

 if( NULL == f_speech )

 {

 printf( "QISRSessionEnd failed, error code is %d\n", ret );

 }

 session_id = NULL;

 ret = QISRFini();

 if( 0 != ret )

 {

 printf( "QISRFini failed, error code is %d\n", ret );

 }

 return 0;

 }

五、Tizen(泰泽)提供的TTS和STT语音合成、语音识别接口

泰泽是三星和英特尔合作开辟的一款操作系统。

1、Tizen SDK官网：https://developer.tizen.org/downloads/tizen-sdk

2、Tizen项目：https://review.tizen.org/git/

3、tts-api:https://review.tizen.org/git/?p=framework/api/tts-api.git;a=summary

其对应的tts.h头文件api接口在线网址为：https://review.tizen.org/git/?p=framework/api/tts-api.git;a=blob;f=include/tts.h;h=636470d923555a30d164cc09ceff841b72187e20;hb=98aee0bab00a418af162a0314ef931f8fd620892

4、stt-api：https://review.tizen.org/git/?p=framework/api/stt-api.git;a=summary

文章结束给大家分享下程序员的一些笑话语录：

问路
有一个驾驶热气球的人发现他迷路了。他降低了飞行的高度，并认出了地面上的一个人。他继续下降高度并对着那个人大叫，“打扰一下，你能告诉我我在哪吗？”
下面那个人说：“是的。你在热气球里啊，盘旋在 30 英尺的空中”。
热气球上的人说：“你一定是在 IT 部门做技术工作”。
“没错”，地面上的人说到，“你是怎么知道的？”
“呵呵”，热气球上的人说，“你告诉我的每件事在技术上都是对的，但对都没有用”。
地面上的人说，“你一定是管理层的人”。
“没错”，热气球上的人说，“可是你是怎么知道的？”
“呵呵”，地面上的那人说到，“你不知道你在哪里，你也不知道你要去哪，你总希望我能帮你。你现在和我们刚见面时还在原来那个地方，但现在却是我错了”。

---------------------------------
原创文章 By
语音和语音合成
---------------------------------

语音语音合成科大讯飞和Tizen-TTS语音合成引擎的更多相关文章

android用讯飞实现TTS语音合成实现中文版
Android系统从1.6版本开始就支持TTS(Text-To-Speech),即语音合成.但是android系统默认的TTS引擎:Pic TTS不支持中文.所以我们得安装自己的TTS引擎和语音包. ...
ROS语音交互——科大讯飞语音合成TTS（二）
之前我用过科大讯飞的语音包,为了记录一下我重新使用一下首先注册科大讯飞账号及应用,以后每个下载的在线使用SDK都是以此账户ID登录讯飞语音服务器. 下载科大讯飞在线合成包. $ unzip Linu ...
安卓TTS语音合成经验分享（科大讯飞语音+）集成
应用场景:足浴软件,技师钟房安排调派和队列排序查看,语音播报提醒.老程序是使用双屏显卡,windows系统PC上运行一个无人值守桌面程序.如今安卓机顶盒(WIFI)和MINI电视棒通过HDMI接口和支 ...
解读 Android TTS 语音合成播报
随着从事 Android 开发年限增加,负责的工作项目也从应用层开发逐步过渡到 Android Framework 层开发.虽然一开始就知道 Android 知识体系的庞大,但是当你逐渐从 Appli ...
在C#中使用科大讯飞Web API进行语音合成
最近工作中需要用到讯飞语音合成接口,网上看了下基本都是Java,PHP,Python版本的,正好补上C# 版本,代码比较简单. 首先在讯飞开放平台上创建一个WebApi项目,取到APPID与APIK ...
speechSynthesis，TTS语音合成。
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
Android 通过调用系统，如接口谷歌语音、百度语音、科大讯飞语音等语音识别方法对话框
现在app在发展过程中会集成一些语音识别功能,不具有其自己的显影剂一般正在开发的语音识别引擎,所以在大多数情况下,它是选择一个成熟的语音识别引擎SDK集成到他们的app在. 平时,这种整合被分成两个, ...
ROS(indigo) 语音工具科大讯飞百度 pocketsphinx julius rospeex 16.11.22更新 ROS中文语音
ROS语音工具汇总,目前先给出链接,只用过一些简单的命令. 中文语音: 参考链接:使用科大讯飞库 1 http://www.ncnynl.com/archives/201611/1069.html 2 ...
科大讯飞和Tizen-TTS语音合成引擎
最近在做一个文本转语音TTS(Text to Speech)的第三方软件封装,使用的是国内语音技术龙头安徽科大讯飞公司提供的离线引擎AiSound5.0,主要用于汽车导航用途.科大讯飞还提供了AiT ...

随机推荐

C#创建服务及使用程序自动安装服务
.NET创建一个即是可执行程序又是Windows服务的exe 不得不说,.NET中安装服务很麻烦,即要创建Service,又要创建ServiceInstall,最后还要弄一堆命令来安装和卸载. 今天给 ...
大约xib连接错误bug正确
今天code什么时候,发现xib除了加载问题,研究发现的一个问题在连接的时候, object一定要选择,您连接view,代替 File's Owner 版权声明:本文博客原创文章,博客,未经同意,不 ...
PHP程序猿必备的七种武器
作为一个程序猿(又或者是程序媛),出来闯荡江湖,没有几种必杀技在手,那是肯定无法赢得江湖名声的,除了必杀技之外,武器也是很重要的,但是一把青钢剑,肯定是无法赢得万千少男少女的欢心的.就连小李飞刀,人家 ...
解决Postman发送post数据但是Node.js中req.body接收不到数据的问题[已解决]
之前编写后台接口,测试数据都是使用的Postman,相当的方便,之前也一直使用get方法,编写Node.js一直没有问题,但是由于要编写一个注册/登陆的功能,所以发送的post数据,后台的逻辑已经编写 ...
学习使用简单的php
配置文件在:/etc/php5/$中,不同的模式含有自己的php.ini配置文件.php可以运行于多种模式:cgi.fastcgi.cli.web模块模式等4种: 我现在使用的模式是cli模式,这里进 ...
TODOList项目
[ 爱上Swift]十二期:TODOList项目好久没有写Swift甚是想念,Swift,Xcode都比较稳定了写个程序熟悉一下,当然时间原因都是小Demo,废话不多说先上图. 下面是跑起来之后 ...
Guava之简介
1.介绍 Guava最初是在2007年作为“Google Collection Library” 出现的,这个项目在处理Java集合时提供了一些有用的工具,Google的这个guava项目已经成为了 ...
SQLServer数据库误删数据找回
记一次SQLServer数据库误删数据找回昨天同事在本机清理数据库表时,连接到了生产机,误删了二十几张表,幸好是晚上加班的时候删除的,生产机上当时是一天一备份,还原备份是最后的策略,最关键的还是要 ...
Linux内核编译和运行
内核获取网站:https://www.kernel.org/pub/linux/kernel/ 步骤如下: 1.打开终端,更改用户权限为root.具体做法是在终端输入sudo su,然后按提示输入 ...
JS实现等比例缩放图片
JS实现等比例缩放图片 2014-01-19 21:57 by 龙恩0707, 40 阅读, 0 评论, 收藏, 编辑 JS实现等比例缩放图片有时候我们前端页面只有500×500像素的宽和高的布局, ...

语音语音合成科大讯飞和Tizen-TTS语音合成引擎

语音语音合成科大讯飞和Tizen-TTS语音合成引擎的更多相关文章

随机推荐

热门专题