语音识别LD3320

一、概述

1.芯片介绍

LD3320 是一颗基于非特定人语音识（SI-ASR：Speaker-Independent Automatic Speech Recognition）技术的语音识/声控芯片。提供了真正的单芯片语音识解决方案。

LD3320 芯片上集成了高精度的 A/D 和 D/A 接口，不再需要外接辅助的 Flash 和 RAM，即可以实现语音识/声控/人机对话功能。并且，识的关键词语列表是可以动态编辑的。

基于 LD3320，可以在任何的电子产品中，甚至包括最简单的 51 作为主控芯片的系统中，轻松实现语音识/声控/人机对话功能。为所有的电子产品增加 VUI（Voice User Interface）语音用户操作界面。

2.语音识别介绍

语音识 ASR 技术，是基于关键词语列表识的技术。只需要设定好要识别的关键词语列表，并把这些关键词语以字符的形式传送到 LD3320 内部，就可以对用户说出的关键词语进行识别。不需要用户作任何地录音训练。

ASR 技术最重要的现实意义就在于提供了一种脱离按键，键盘，鼠标的基于语音的用户界面 VUI：Voice User Interface

每次识的过程，就是把用户说出的语音内容，通过频谱转换为语音特征，和这个关键词语列表中的条目进行一一匹配，最优匹配的一条作为识结果。比如在手机的应用中，这个关键词语列表的内容就是电话本中的人名/手机的菜单命令/T 卡中的歌曲名字。不论这个列表的条目内容是什么，只需要用户设置相关的寄存器，就可以把相应的待识条目内容以字符形式传递给识引擎。
LD3320 可以识列表中的关键词，用户说的语音可以是这个列表中任意的关键词语，而且不需要用户在识前进行任何训练。识引擎不关心关键词语列表中的关键词语的内容，可以是命令，人名，歌曲名字，操作指令等等任何的汉字字符串。每条关键词语最大可以支持的字数，从算法角度是限制在 30 字以内。但是从实际情况来看，用户一口气说超过 8 个字以上的条目时，几乎肯定会出现说错字/说漏字/说多字/打嗝/停顿等情况，这些情况都会严重影响识并造成识错误。因而一般来说，如果要获得理想的识效果，建议每条关键词语的字数不要过长，避免影响效果。

3.技术参数

1. 内置单声道 mono 16-bit A/D 模数转换

2. 内置双声道 stereo 16-bit D/A 数模转换

3. 内置 20mW 双声道耳机放大器输出

4. 内置 550mW 单声道扬声器放大器输出

5. 支持并行接口或者 SPI 接口

6. 内置锁相电路 PLL，输入主控时钟频率为 2MHz - 34MHz

7. 工作电压：(VDD: for internal core) 3.3V

8. 48pin 的 QFN 7*7 标准封装

9. 省电模式耗电：1uA

4.应用场景

电磁炉/微波炉/智能家电操作

导航仪

MP3/MP4

数码像框

机顶盒/彩电遥控器

智能玩具/对话玩具

PMP/游戏机

自动售货机

地铁自动售票机

导游机

楼宇电视的广告点播

公共照明系统/卫生系统/智能家居的声控

二、LD3320 资料

1.管脚

语音识别LD3320的更多相关文章

智能家居入门DIY——【二、LD3320之语音识别】
前一篇说了一下只有RX,TX,VCC,GND的WIFI模块软串口通讯:在实现了远程观察数据,类似的就可以实现远程控制.接下来说一下近距离控制,很多情况下应用语音识别技术无疑比掏出手机操作要更人性化一些 ...
树莓派进阶之路 (029) - 语音识别模块 LD3320(原创)
近几天听朋友有说到LD3320 语音模块,刚好身边有块树莓派3,就在某宝上买了块自带mcu的LD3320 . 准备: 树莓派一个(配置了wiringPi开发环境的详情见本人博客:树莓派进阶之路 (00 ...
【iOS10 SpeechRecognition】语音识别现说现译的最佳实践
首先想强调一下“语音识别”四个字字面意义上的需求:用户说话然后马上把用户说的话转成文字显示!,这才是开发者真正需要的功能. 做需求之前其实是先谷歌百度一下看有没有造好的轮子直接用,结果真的很呵呵,都是 ...
安卓Android科大讯飞语音识别代码使用详解
科大讯飞的语音识别功能用在安卓代码中,我把语音识别写成了Service,然后在Fragment直接调用service服务.科大讯飞语音识别用的是带对话框的那个,直接调用科大讯飞的语音接口,代码采用链表 ...
微信快速开发框架（八）-- V2.3--增加语音识别及网页获取用户信息，代码已更新至Github
不知不觉,版本以每周更新一次的脚步进行着,接下来应该是重构我的代码及框架的结构,有朋友反应代码有点乱,确实如此,当时写的时候只是按照订阅号来写的,后来才慢慢增加到支持API接口.目前还在开发第三方微信 ...
Atitit 语音识别的技术原理
Atitit 语音识别的技术原理 1.1. 语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),2 1.2. 模型目前,主流的大词汇量语音识别系统多 ...
WP中的语音识别（下）：语音指令
除了系统集成的可以用于搜索.启动应用程序等语音命令外,在我们的应用程序内部还能自己定义语音指令,使得我们的APP能与语音操控结合得更加完全. 语音指令是通过一个XML文件来定义的.比如,咱小舅子开了家 ...
WP中的语音识别（上）：基本识别
WP 8.1目前许多内容仍处于未确定状态,因此,本文所提及的语音识别,是基于WP8的,在8.1中也差不多,也是使用运行时API来实现,如果大家不知道什么是运行时API,也没关系,不影响学习和开发,因为 ...
机器学习&数据挖掘笔记_14（GMM-HMM语音识别简单理解）
为了对GMM-HMM在语音识别上的应用有个宏观认识,花了些时间读了下HTK(用htk完成简单的孤立词识别)的部分源码,对该算法总算有了点大概认识,达到了预期我想要的.不得不说,网络上关于语音识别的通俗 ...

随机推荐

systemctl详解
[root@hadoop01 hadoop]# systemctl --help systemctl [OPTIONS...] {COMMAND} ... Query or send control ...
Trie树（c++实现）——转载自jihite的博客
Trie树(c++实现) 原理先看个例子,存储字符串abc.ab.abm.abcde.pm可以利用以下方式存储上边就是Trie树的基本原理:利用字串的公共前缀来节省存储空间,最大限度的减少无谓 ...
灰度图像--频域滤波傅里叶变换之连续信号傅里叶变换（FT）
学习DIP第20天转载请标明本文出处:http://blog.csdn.net/tonyshengtan,欢迎大家转载,发现博客被某些论坛转载后,图像无法正常显示,无法正常表达本人观点,对此表示很不 ...
Java线程之生命周期
简述以下类图展示了线程生命周期中不同的状态.我们可以创建一个线程并启动它,但是线程状态从Runnable.Running.Blocked等状态的变化取决于系统线程调度器,java本身并不能完全控制. ...
JavaWeb_(Struts2框架)Log4j的配置以及解决中文乱码
此系列博文基于同一个项目已上传至github 传送门 JavaWeb_(Struts2框架)Struts创建Action的三种方式传送门 JavaWeb_(Struts2框架)struts.xml核 ...
【知识库】-数据库_MySQL性能分析之Query Optimizer
简书作者:Sio 文章出处: MySql优化之索引原理与 SQL 优化 Query Optimizer MySQL Optimizer是一个专门负责优化SELECT 语句的优化器模块,它主要的功能就是 ...
MySQL_(Java)使用JDBC创建用户名和密码校验查询方法
MySQL_(Java)使用JDBC向数据库发起查询请求传送门 MySQL数据库中的数据,数据库名garysql,表名garytb,数据库中存在的用户表通过JDBC对MySQL中的数据用户名和密码 ...
去掉input type=file的默认样式
原样式: 解决: 加style="opacity: 0;"变成透明的然后可以外面套个div,在div上自定义样式.
spark streaming 4: DStreamGraph JobScheduler
DStreamGraph有点像简洁版的DAG scheduler,负责根据某个时间间隔生成一序列JobSet,以及按照依赖关系序列化.这个类的inputStream和outputStream是最重要的 ...
3.MapReduce原理和Yarn
1.MapReduce原理 2.MapReduce执行时间 3.MapReduce开发 4.Yarn

语音识别LD3320

语音识别LD3320的更多相关文章

随机推荐

热门专题