WP 8.1目前许多内容仍处于未确定状态,因此,本文所提及的语音识别,是基于WP8的,在8.1中也差不多,也是使用运行时API来实现,如果大家不知道什么是运行时API,也没关系,不影响学习和开发,因为在VS创建项目后,默认会帮我们引用所有的库。

在本篇中,我们先从简单的实现入手,下一篇会给大家介绍如何自己设计语音命令。

先给大家说说库的位置,与语音识别有关的API在Windows.Phone.Speech.Recognition命名空间下,看名字就能猜到99.999998%了。在该命名空间下,有两个类可用于完成语音识别:

a、SpeechRecognizer

b、SpeechRecognizerUI

两个类的功能其实是等效的,带UI结尾的类在识别时会显示一个识别界面,待会看示例时大家就会看到的。对于SpeechRecognizer类,调用RecognizeAsync方法,异步等待后会返回一个SpeechRecognitionResult实例,其中Text属性表示已经识别出来的文本;对于SpeechRecognizerUI类,可以调用RecognizeWithUIAsync方法进行识别,同样,异步等待后,会返回SpeechRecognitionUIResult实例,从该实例的RecognitionResult属性中得到对SpeechRecognitionResult的引用,就能得到被识别的文本。

下面,我们可以看示例了。

1、启动VS,新建一个项目,命名为“我的高大上应用”。

2、在默认的MainPage.xaml页面中加入以下XAML。

        <Grid x:Name="ContentPanel" Grid.Row="1" Margin="12,0,12,0">
<StackPanel>
<Button Content="开始识别" FontSize="40"/>
<TextBox x:Name="txtInput" Height="250" Margin="0,11,0,0"/>
</StackPanel>
</Grid>

3、为Button控件加上Click事件处理方法。

<Button Content="开始识别" FontSize="40" Click="OnClick"/>

4、转到代码视图,先using一下我们要用到的命名空间。

using Windows.Phone.Speech.Recognition;

5、在OnClick方法中加入以下代码。

        private async void OnClick(object sender, RoutedEventArgs e)
{
// 实例化
SpeechRecognizer sr = new SpeechRecognizer();
// 开始识别
Button btn = (Button)sender;
btn.IsEnabled = false;
SpeechRecognitionResult result = await sr.RecognizeAsync();
// 显示被识别的文本
txtInput.Text = result.Text;
btn.IsEnabled = true;
}

6、原则上,我们的高大上示例已经完成了,不过,还有一个小步骤,打开清单文件——WMAppManifest.xml,加上以下功能需求项:
ID_CAP_NETWORKING:允许使用网络,启用语音识别是必须项。

ID_CAP_MICROPHONE:都说语音识别了,话筒怎么能少呢?

ID_CAP_SPEECH_RECOGNITION:使应用支持语音识别。

即:

    <Capabilities>
<Capability Name="ID_CAP_NETWORKING" />
<Capability Name="ID_CAP_MEDIALIB_AUDIO" />
<Capability Name="ID_CAP_MEDIALIB_PLAYBACK" />
<Capability Name="ID_CAP_SENSORS" />
<Capability Name="ID_CAP_WEBBROWSERCOMPONENT" />
<Capability Name="ID_CAP_MICROPHONE" />
<Capability Name="ID_CAP_SPEECH_RECOGNITION" />
</Capabilities>

现在,请确保你的手机已经连上网络,建议连Wi-Fi,因为老虎网络会计流量的,成本较高。
好,不要犹豫,果断运行吧。当你看到程序运行后,请点击“开始识别”按钮,然后对着手机拼命表白,稍等一会,识别结果会显示在页面的文本框中,如下图所示。

唉,这时候,估计大伙要说我是骗子,是的,意外地报错了,我虽不敢说都报错,至少经过我测试,大多数时候,都会发生异常,这可能是系统的听写模式仍未对中文友好支持的原因。没事,既然听写模式不行,那咱们就来搜索模式。
在上面的OnClick上把代码改为如下:

        private async void OnClick(object sender, RoutedEventArgs e)
{
// 实例化
SpeechRecognizer sr = new SpeechRecognizer();
sr.Grammars.AddGrammarFromPredefinedType("cns", SpeechPredefinedGrammar.WebSearch);
// 开始识别

也就是说加了这一行:

sr.Grammars.AddGrammarFromPredefinedType("cns", SpeechPredefinedGrammar.WebSearch);

cns是一个key名,可以随便取,这行代码就是告诉识别系统:“我要用搜索模式”,搜索模式是可以识别中文的。经过这样一改后,再次运行,然后你对着手机表白一下,好家伙,总算等到结果了。

啊,总算可以了。

=================================================

【补】

WP 8.1 中对应的命名空间在Windows.Media.SpeechRecognition。

WP中的语音识别(上):基本识别的更多相关文章

  1. WP中的语音识别(下):语音指令

    除了系统集成的可以用于搜索.启动应用程序等语音命令外,在我们的应用程序内部还能自己定义语音指令,使得我们的APP能与语音操控结合得更加完全. 语音指令是通过一个XML文件来定义的.比如,咱小舅子开了家 ...

  2. 百度DMLC分布式深度机器学习开源项目(简称“深盟”)上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。

    百度为何开源深度机器学习平台?   有一系列领先优势的百度却选择开源其深度机器学习平台,为何交底自己的核心技术?深思之下,却是在面对业界无奈时的远见之举.   5月20日,百度在github上开源了其 ...

  3. 防止在iOS设备中的Safari将数字识别为电话号码

    在测试中发现iPad上的Safari总会把长串数字识别为电话号码,文字变成蓝色,点击还会弹出菜单添加到通讯录. 别的地方倒也罢了,如果在用户名中出现数字(手机注册新浪微博的话用户名就是“手机用户xxx ...

  4. python中使用Opencv进行人脸识别

    上一节讲到人脸检测,现在讲一下人脸识别.具体是通过程序采集图像并进行训练,并且基于这些训练的图像对人脸进行动态识别. 人脸识别前所需要的人脸库可以通过两种方式获得:1.自己从视频获取图像   2.从人 ...

  5. Vue+Typescript中在Vue上挂载axios使用时报错

    Vue+Typescript中在Vue上挂载axios使用时报错 在vue项目开发过程中,为了方便在各个组件中调用axios,我们通常会在入口文件将axios挂载到vue原型身上,如下: main.t ...

  6. OpenCV_contrib里的Text(自然场景图像中的文本检测与识别)

    平台:win10 x64 +VS 2015专业版 +opencv-3.x.+CMake 待解决!!!Issue说明:最近做一些字符识别的事情,想试一下opencv_contrib里的Text(自然场景 ...

  7. JAVA中使用FTPClient上传下载

    Java中使用FTPClient上传下载 在JAVA程序中,经常需要和FTP打交道,比如向FTP服务器上传文件.下载文件,本文简单介绍如何利用jakarta commons中的FTPClient(在c ...

  8. IIS 7 中设置文件上传大小的方法

    在IIS 6.0中设置文件上传大小的方法,就是配置如下节点: <system.web> <httpRuntime maxRequestLength="1918200&quo ...

  9. 4.struts2中的文件上传,下载

    Struts2中文件的上传下载,是借用commons里面的包实现文件的上传,需要导入两个jar commons-fileupload-1.2.2.jar commons-io-2.0.1.jar 实现 ...

随机推荐

  1. [UE4]逻辑状态机组件

    逻辑状态机 为了实现对目标状态的控制,以及广播改变状态后的事件,可在蓝图中继续处理不同状态下的行为. 实现过程: 1.继承ActorComponent实现LogicStateMachine: 2.被击 ...

  2. [Xpand] Error 1 Invalid option '6' for /langversion; must be ISO-1, ISO-2, 3, 4, 5 or Default

    原因是用的vs2015 默认用了c#6 ,但是在没安装.net 4.6 环境下编译失败. 解决办法很简单,修改 6 为 5 做降级就可以了. 1.nuget install DotNetCompile ...

  3. easyui的datagrid多次调用action的原因

    今天碰见一个非常奇怪的问题,一个页面的datagrid正常,另一个页面的datagrid两次调用action代码,比较两个页面datagrid的使用方法,并没有不同.后经仔细debug,发现问题所在: ...

  4. xcode6如何支持空模板

    Single View Application 改成空模板的歩揍(xcode6.0.1): 1.删除info.plist 中的Main Storyboard file base name 选项 2.将 ...

  5. Java中的一个类怎么调用另一个类中的方法

    如果另一个类中的那个方法是私有的话,就不能直接调用到,如果是其他类型的话看情况,如果是静态的(static)话,直接用类名可以调用到,如果是非静态的,就需要利用另一个类的实例(也就是用那个类生成的对象 ...

  6. EnTaroTassadar

    著名的暴雪电影制片厂不久前推出了他的新作:电影虚空之遗附带的同名游戏的前三关战役.游戏的第一关中,一些星灵战士被莫比斯 俘虏了.而你(泽拉图)要去解救他们.解救的方法就是生产一些士兵,然后打败敌人.生 ...

  7. (转载)JAVA线程池管理

    平时的开发中线程是个少不了的东西,比如tomcat里的servlet就是线程,没有线程我们如何提供多用户访问呢?不过很多刚开始接触线程的开发攻城师却在这个上面吃了不少苦头.怎么做一套简便的线程开发模式 ...

  8. 高性能网站架构设计之缓存篇(4)- Redis 主从复制

    Redis 的主从复制配置非常容易,但我们先来了解一下它的一些特性. redis 使用异步复制.从 redis 2.8 开始,slave 也会周期性的告诉 master 现在的数据量.可能只是个机制, ...

  9. python post

    使用python 提交表单包括图片以及参数信息,详见代码 # -*- coding: utf-8 -*- import MultipartPostHandler, urllib2, cookielib ...

  10. objective-c(接口&实现)

    objective-c在xcode6下的例子: 定义接口 #import <Foundation/Foundation.h> //基础库,类似C中的stdlib typedef ,type ...