<交流贴>android语音识别之科大讯飞语音API的使用

因为最近在研究语音识别，所以借鉴了一下CreAmazing网友的帖子

Android系统本身其实提供有语音识别模块，在它的APIDemo里也有关于语音识别的sample，不过经过大多开发者的真机测试，发现很多真机并不能使用哪个sample，在网上查找了一下原因，大部分是因为开发者在刷机的时候，大部分的ROM都阉割掉了语音识别和语音合成TTS(Text To Speech)部分，所以运行sample的时候会有异常抛出。

如果不用google提供的语音识别，要怎么实现语音识别喃？科大讯飞的语音API就可以到，这里是关于它的官网介绍：http://dev.voicecloud.cn/developer.php?vt=1 下面我就用一个简单的实例来介绍一下它基本的使用

首先做一个简单的界面

上面的TextView显示识别的内容，三个Button分别为语音识别，语音合成并朗读和语音后台朗读三个功能

布局文件：

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
android:layout_width="fill_parent"
android:layout_height="fill_parent"
android:orientation="vertical" >
<EditText
android:id="@+id/et"
android:layout_width="fill_parent"
android:layout_height="wrap_content" />
<Button
android:id="@+id/bt_recognize"
android:layout_width="fill_parent"
android:layout_height="wrap_content"
android:gravity="center"
android:text="Recognize" />
<Button
android:id="@+id/bt_speek"
android:layout_width="fill_parent"
android:layout_height="wrap_content"
android:gravity="center"
android:text="Speek" />
<Button
android:id="@+id/bt_speek_bg"
android:layout_width="fill_parent"
android:layout_height="wrap_content"
android:gravity="center"
android:text="Speek-Background" />
</LinearLayout>

复制代码

Activity代码如下：

package sina.CreAmazing.voice;
import java.util.ArrayList;
import com.iflytek.speech.RecognizerResult;
import com.iflytek.speech.SpeechError;
import com.iflytek.speech.SynthesizerPlayer;
import com.iflytek.ui.RecognizerDialog;
import com.iflytek.ui.RecognizerDialogListener;
import com.iflytek.ui.SynthesizerDialog;
import com.iflytek.ui.SynthesizerDialogListener;
import android.app.Activity;
import android.os.Bundle;
import android.view.View;
import android.view.View.OnClickListener;
import android.widget.Button;
import android.widget.EditText;
public class Voice1Activity extends Activity {
/** Called when the activity is first created. */
// 声明控件
private EditText et;
private Button bt1;
private Button bt2;
private Button bt3;
//全局只设一个String，因为String为final类型，这样做节省内存
String text = "";
private static final String APPID = "appid=4f2d3a06";
@Override
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.main);
bt1 = (Button) findViewById(R.id.bt_recognize);
bt2 = (Button) findViewById(R.id.bt_speek);
bt3 = (Button) findViewById(R.id.bt_speek_bg);
et = (EditText) findViewById(R.id.et);
// 初始化监听器
initListener();
}
private void initListener() {
bt1.setOnClickListener(myListener);
bt2.setOnClickListener(myListener);
bt3.setOnClickListener(myListener);
}
OnClickListener myListener = new OnClickListener() {
@Override
public void onClick(View v) {
// 根据不同View的id调用不同方法
switch (v.getId()) {
case R.id.bt_recognize:
// 这是语言识别部分，最重要的实例化一个
// RecognizerDialog并把你在官方网站申请的appid填入进去，非法id不能进行识别
RecognizerDialog isrDialog = new RecognizerDialog(
Voice1Activity.this, APPID);
/*
* 设置引擎目前支持五种 ”sms”：普通文本转写 “poi”：地名搜索 ”vsearch”：热词搜索
* ”video”：视频音乐搜索 ”asr”：命令词识别
*/
isrDialog.setEngine("sms", null, null);
isrDialog.setListener(recoListener);
isrDialog.show();
break;
case R.id.bt_speek:
// 这是语言合成部分同样需要实例化一个SynthesizerDialog ，并输入appid
SynthesizerDialog syn = new SynthesizerDialog(
Voice1Activity.this, APPID);
syn.setListener(new SynthesizerDialogListener() {
@Override
public void onEnd(SpeechError arg0) {
}
});
// 根据EditText里的内容实现语音合成
syn.setText(et.getText().toString(), null);
syn.show();
break;
case R.id.bt_speek_bg:
// 这是后台朗读，实例化一个SynthesizerPlayer
SynthesizerPlayer player = SynthesizerPlayer
.createSynthesizerPlayer(Voice1Activity.this, APPID);
// 设置语音朗读者，可以根据需要设置男女朗读，具体请看api文档和官方论坛
player.setVoiceName("vivixiaomei");
player.playText(et.getText().toString(), "ent=vivi21,bft=5",
null);
break;
default:
break;
}
}
};
// 语言识别监听器，有两个方法
RecognizerDialogListener recoListener = new RecognizerDialogListener() {
@Override
public void onResults(ArrayList<RecognizerResult> results,
boolean isLast) {
// 服务器识别完成后会返回集合，我们这里就只得到最匹配的那一项
text += results.get(0).text;
System.out.println(text);
}
@Override
public void onEnd(SpeechError error) {
if (error == null) {
// 完成后就把结果显示在EditText上
et.setText(text);
}
}
};
}

复制代码

最后别忘了把科大讯飞的jar包引入工程的buildPath里面。

运行画面：

语音识别：

语音合成：

其实功能还不止这些，还有数据上传，关键字识别，获取上行下行流量，设置采样频率设置发音人，语速，音量等等等，如果感兴趣可以自己深入研究。

接上文，如何实现语音控制呢？比如当我们说天气的时候，界面会自动呈现的天气预报的界面，当我们说UC的时候，会自动跳转到UC浏览器上等等。其实方法很简单，仅仅需要对识别到的字符串进行判断，当它符合特定的字符串是就对Activity进行跳转，跳转到自己写好的Activity上，或者跳转到已安装的应用上，下面来看具体怎么实现：

首先我们在layout布局里增加一个ToggleButton用于开关语音控制：

然后我们就在获取结果的RecognizerDialogListener下面改变几行代码：

RecognizerDialogListener recoListener = new RecognizerDialogListener() {
@Override
public void onResults(ArrayList<RecognizerResult> results,
boolean isLast) {
//新增加了一个ToggleButton tb，首先检查tb是否被按下，如果被按下才进行语言控制，没被按下就进行文字识别
if (tb.isChecked()) {
//doVoice方法就是进行识别
doVoice(results);
} else {
// 服务器识别完成后会返回集合，我们这里就只得到最匹配的那一项
text += results.get(0).text;
System.out.println(text);
}
}

复制代码

如果进行语言识别就把返回的结果传入上面的doVoice方法里，doVoice如下：

//首先迭代结果，然后获取每个结果，并进行对比，如果包含有特定字符串，那么就执行相应Intent跳转。
//注意凡是Intent能办到的（发邮件，跳到已安装应用，拨号，发短信，发彩信，浏览网页，播放多媒体。。。。），它就都能办到。
private void doVoice(ArrayList<RecognizerResult> results) {
Intent i = new Intent();
for(RecognizerResult result : results){
if(result.text.contains("天气")){
//天气界面的跳转
i.setClass(Voice1Activity.this, Weather.class);
startActivity(i);
}else if(result.text.contains("新闻")){
//新闻界面的跳转
i.setClass(Voice1Activity.this, News.class);
startActivity(i);
}else if(result.text.contains("短信")){
//短信界面的跳转
i.setAction(Intent.ACTION_VIEW);
i.setType("vnd.android-dir/mms-sms");
startActivity(i);
}else{
//如果没有相应指令就用Toast提示用户
Toast.makeText(Voice1Activity.this, "无法识别", Toast.LENGTH_SHORT).show();
}
}
}

复制代码

如下是做得相应简单界面：

<ignore_js_op>

其实在主UI里执行那么耗时操作比如语音的识别与控制并不是很好的方法，其实完全可以把这些耗时的操作交给Service来做只要在主Activity的开始，启动一个Service，定义好各种逻辑接口并把那些耗时的操作交给Service就行了，在Service里面实现语音的识别，控制和逻辑的跳转。

源码地址：

游客，如果您要查看本帖隐藏内容请回复

<交流贴>android语音识别之科大讯飞语音API的使用的更多相关文章

转：基于科大讯飞语音API语音识别开发详解
原文来自于: http://www.52wulian.org/android_voice/ 最近项目需要用到android语音识别,立马就想到科大讯飞,结合官方实例及阅读API文档,初步的完成了And ...
Android 通过调用系统，如接口谷歌语音、百度语音、科大讯飞语音等语音识别方法对话框
现在app在发展过程中会集成一些语音识别功能,不具有其自己的显影剂一般正在开发的语音识别引擎,所以在大多数情况下,它是选择一个成熟的语音识别引擎SDK集成到他们的app在. 平时,这种整合被分成两个, ...
利用百度语音API进行语音识别。
由于项目需要,这几天都在试图利用百度语音API进行语音识别.但是识别到的都是“啊,哦”什么的,我就哭了. 这里我只是分享一下这个过程,错误感觉出现在Post语音数据那一块,可能是转换问题吧. API请 ...
Android语音识别
语音识别 - 科大讯飞开放平台 http://open.voicecloud.cn/ 需要拷贝lib.assets.并在清单文件中写一些权限 public class MainActivity ex ...
android蓝牙耳机下的语音（输入/识别）及按键监听
背景:本人负责公司android平台的app开发,最近要开发一个语音助手类的app,类似于灵犀语音助手.虫洞语音助手等.其中有两个蓝牙耳机下的语音识别问题,比较折腾人,问题描述:1.蓝牙耳机连接下捕获 ...
android智能家居在线语音控制
对于android 智能家居项目,如果能实现语音控制,无疑会丰富项目功能,改善用户体验,android语音识别的方法有三种:一是使用intent调用语音识别程序,二是应用程序自己调用语音识别库,三是 ...
Android 8.0 功能和 API
Android 8.0 为用户和开发者引入多种新功能.本文重点介绍面向开发者的新功能. 用户体验通知在 Android 8.0 中,我们已重新设计通知,以便为管理通知行为和设置提供更轻松和更统一的 ...
AngularJS进阶(十八)在AngularJS应用中集成科大讯飞语音输入功能
在AngularJS应用中集成科大讯飞语音输入功能注:请点击此处进行充电! 前言根据项目需求,需要在首页搜索框中添加语音输入功能,考虑到科大讯飞语音业务的强大能力,遂决定使用科大讯飞语音输入第三方 ...
Android 9 新功能及 API 介绍(提供了实用的模块化的功能支持，包括人工智能)
Android 9(API 级别 28)为用户和开发者引入了众多新特性和新功能. 本文重点介绍面向开发者的新功能. 要了解新 API,请阅读 API 差异报告或访问 Android API 参考. ...

随机推荐

validate插件实现表单效验（一）
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...
POJ 3225.Help with Intervals-线段树(成段替换、区间异或、简单hash)
POJ3225.Help with Intervals 这个题就是对区间的各种操作,感觉这道题写的一点意思都没有,写到后面都不想写了,而且更神奇的是,自己的编译器连结果都输不出来,但是交上就过了,也是 ...
Extract - <<凤凰牌老熊-现代支付系统设计>>
本文摘录自: http://blog.lixf.cn/essay/2017/04/01/concept-01-overview/ 一.支付概述-- 1. 支付与交易交易过程: 交易的存在是支付发生的 ...
安装mysql数据库图文教程
一.首先下载该版本的Mysql 5.5.28双击软件,弹出软件的安装界面如下二.点击Next ,点击同意
UVA——11988 Broken Keyboard (a.k.a. Beiju Text)
11988 Broken Keyboard (a.k.a. Beiju Text)You’re typing a long text with a broken keyboard. Well it’s ...
POJ 2739：Sum of Consecutive Prime Numbers（Two pointers）
[题目链接] http://poj.org/problem?id=2739 [题目大意] 求出一个数能被拆分为相邻素数相加的种类 [题解] 将素数筛出到一个数组,题目转化为求区段和等于某数的次数,尺取 ...
【hdu3652】数位dp（浅尝ACM-A)
向大佬学习第一次写博客有点紧张,也算是小萌新的突破吧这次主要是总结一下校内的ACM比赛的各种题,主要是新思路以及学到的新知识先放一张下面开始说正事题面 A wqb-number, or B- ...
Android中调用系统所装的软件打开文件(转)
Android中调用系统所装的软件打开文件(转) 在应用中如何调用系统所装的软件打开一个文件,这是我们经常碰到的问题,下面是我所用到的一种方法,和大家一起分享一下! 这个是打开文件的一个方法: /** ...
PHP安全相关的配置
PHP作为一门强大的脚本语言被越来越多的web应用程序采用,不规范的PHP安全配置可能会带来敏感信息泄漏.SQL注射.远程包含等问题,规范的安全配置可保障最基本的安全环境.下面我们分析几个会引发安全问 ...
tcp 三次握手和四次断连深入分析：连接状态和socket API的关系----BAT 李运华
http://blog.csdn.net/yunhua_lee/article/details/40513677 http://blog.csdn.net/yah99_wolf/article/cat ...

<交流贴>android语音识别之科大讯飞语音API的使用

<交流贴>android语音识别之科大讯飞语音API的使用的更多相关文章

随机推荐

热门专题