http://research.microsoft.com/en-us/projects/IntentUnderstanding/ Understanding what users like to do/need to get is critical in human computer interaction. When natural user interface like speech or natural language is used in human-computer interac…
很久很久以前, 网上流传着一个免费的,识别率暴高的,稳定的 Speech To Text API, 那就是Google Speech API. 但是最近再使用的时候,总是返回500 Error. 后来通过查看源码知道需要增加一个参数:key=.... 可能是为了防止滥用吧. 并且, 最近Chrome另外发布了一个长连接实时的识别接口, 这对开发者来说真是巨大的福音啊. 在这里主要对这两个接口的用法进行介绍. 博客: http://www.cnblogs.com/jhzhu 邮箱: jhzhuus…
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using System.Threading; using SpeechLib;//NET2.0 引用 Speech sdk 5.1…
找了一下 speech to text 可以用的 SDK for iOS 以下幾種方案: NDEV Mobile (有免費方案,不過似乎不支援離線,客戶清單中有 wallmart,支援不少語言) iSpeech (看起來有很完整的開發整方案,支援各種平台) OpenEars (stackoverflow 上比較多人推,似乎是最成熟穩定) 用 Google 非公開的 API 偷偷幹,他會吐回 JSON speech2text 的資料,不過 Google 只能讀得懂 FLAC 格式檔案,所以必須在自…
错误Max retries exceeded with url: requests.exceptions.ConnectionError: HTTPSConnectionPool(host='%20eastasia.stt.speech.microsoft.com', port=443): Max retries exceeded with url: /speech/recognition/conversation/cognitiveservices/v1?language=zh-CN (Cau…
There are several libraries for this kind of conversion - I host two of those on GitHub: libsprec (this uses the Google speech recognition APIs, so it supports multiple languages) and VocalKit which uses the high-quality opensource PocketSphinx libra…
最近发现有声读物能极大促进我的睡眠,但每个前面都有一段开场语,想把它剪掉,但是有多个开场语,所以就要用到语音识别判断一下再剪. 前两年在本地搭建过识别的环境,奈何识别准确率不行,只能找找API了,后面有时间再弄本地的吧.下面是几个大厂提供的服务,就我个人使用来看,讯飞 > Google > IBM, 但在中文识别准确度上,讯飞是最强的. Oracle: 被它的Always Free计划吸了一波粉,但是提供的转写服务不支持中文,pass IBM 优点:有一定的持续免费额度 缺点:准确度不够,官网…
Basic concepts of speech Speech is a complex phenomenon. People rarely understand how is it produced and perceived. The naive perception is often that speech is built with words, and each word consists of phones. The reality is unfortunately very dif…
先看效果图: 1.Action:该activity可以执行的动作 该标识用来说明这个activity可以执行哪些动作,所以当隐式intent传递过来action时,如果跟这里<intent-filter>所列出的任意一个匹配的话,就说明这个activity是可以完成这个intent的意图的,可以将它激活! 常用的Action如下所示: ACTION_CALL activity 启动一个电话. ACTION_EDIT activity 显示用户编辑的数据. ACTION_MAIN activit…
Intent是一种运行时绑定(run-time binding)机制,它能在程序运行过程中连接两个不同的组件.通过Intent,你的程序可以向Android表达某种请求或者意愿,Android会根据意愿的内容选择适当的组件来完成请求.比如,有一个Activity希望打开网页浏览器查看某一网页的内容,那么这个Activity只需要发出WEB_SEARCH_ACTION给Android,Android就会根据Intent的请求内容,查询各组件注册时声明的IntentFilter,找到网页浏览器的Ac…