35.百度云语音识别接口使用及PyAudio语音识别模块安装
百度云语音识别接口使用:
百度云语音识别接口文档:https://cloud.baidu.com/doc/SPEECH/ASR-API.html#JSON.E6.96.B9.E5.BC.8F.E4.B8.8A.E4.BC.A0
一. 解析用户语音输入,转换为字符串
- 捕获用户的语音输入
- windows安装
- pip3 install PyAudio #如果报错可以尝试2,3步骤 丶 如果用pip3下载安装报错可以在python第三方安装包下载地址搜索下载安装https://pypi.org/
- python -m pip install --upgrade pip
- pip install PyAudio
CentOS 7.4 下安装PyAudio 需要先安装 portaudio (采用的方法,可行)
1、在安装pyaudio时,报错failed error: portaudio.h: 没有那个文件或目录
2、pyaudio的运行需要依赖于portaudio这个库,应该先安装一个portaudio库
3、portaudio安装步骤:
a)下载portaudio库http://portaudio.com/download.html
b)将下载的文件进行解压
c)进入解压后的portaudio文件,依次执行命令:
./configure
make
make install
d)进入~/.bashrc文件:vim ~/.bashrc
在文件最后一行加入 export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
然后执行命令source ~/.bashrc
4、到此portaudio库安装成功
5、安装pyaudio库,pip3 install pyaudio (wget https://files.pythonhosted.org/packages/ab/42/b4f04721c5c5bfc196ce156b3c768998ef8c0ae3654ed29ea5020c749a6b/PyAudio-0.2.11.tar.gz)
成功后显示版本为0.2.11
二,音频数据给到百度云
- 音频数据的格式规则
- format:格式 wav
- rate:采样率 16000
- channel:声道 1单声道
- cuid:用户ID MAC地址,只要保证唯一
- token:身份识别 在百度云接口平台注册后,才能拿到
- dev_pid: 1536英文,1537中文
- len:数据的长度 原始的 len(data) ->
- speech:数据对象
1,base64 编码2,经常用于网络中的音频图像二进制的数据传输3,base64.b64encode(data)
- **JSON**格式POST上传本地音频流数据
- header:Content-Type:application/json
- 标识,
- GET:直接获取服务器上的数据
- POST:客户端先向服务端提交数据,服务端在返回,POST一定会向服务器提交数据
- RESTFUL:资源定义成了连接(url 同一资源,这个要了解一下)
- 连接,www.baidu.com
- POST提交数据,
- WEB服务 HTTP协议
- RESTFUL:ip/?shutdown #关机命令
- http://vop.baidu.com/server_api #百度云api接口地址,我们的语音信息提交到这个接口就行了
三,捕获百度云返回的结果
- JSON的返回 #无论什么方式上传都会以JSON格式返回结果
- json.loads() 解析json数据变为Python中数据对象 字典
- j'son.dumps() dict -> dict
- result #音频返回的结果在result字段中
- PyAudio:对象,实例化一个设备
- pa.open(format=存储位深 int 16位, channels=声道,rate=采样率,input=True,frame_per_buffer=1024)
import time
from pyaudio import PyAudio,paInt16
from urllib.request import urlopen,Request #专门处理http协议的模块
import json
import base64
def play_audio(data): #播放音频
pa = PyAudio() #设备实例化
equip = pa.open(
format=paInt16,
channels=1, #单声道
rate=16000,
output=True,
) #打开设备,并且支持输出
equip.write(data) #设备的write函数,写入音频数据
equip.stop_stream() #关闭写入
equip.close()
pa.terminate() #关闭设备实例
def record_audio(): #输入音频
pa = PyAudio() #设备实例化
equip = pa.open(
format=paInt16,
channels=1,
rate=16000,
input=True,
frames_per_buffer=1024,
) #打开设备,并且支持输入
data = [] #存储未来的语音输入
#一截一截的语音数据 [b'1',b'2',]
times = 0 #用来控制用户输入语音长度的
start = time.time()
while times < 50: #3S
data.append(equip.read(1024)) #读取设备中此时的语音数据
times += 1
end = time.time()
print('[TALK] %.2f' % (end - start)) #%.2f 保留2位小数点有效位数字
data = b''.join(data) #完整的音频流数据
equip.close()
pa.terminate() #关闭设备实例
return data
def baidu_token():
API_Key = 'oAcBP47GDDpj6XIHWmcSkeRi'
Secret_Key = 'ba2EKROswCy6KXzLdTpnGqPnPhHSFHU7'
grant_type = 'client_credentials'
url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=%s&client_id=%s&client_secret=%s'
response = json.loads(urlopen(url % (grant_type,API_Key,Secret_Key)).read().decode())
access_token = response['access_token']
return access_token
def baidu_fenxi(data):
url = 'http://vop.baidu.com/server_api'
data_len = len(data)
audio_data = base64.b64encode(data).decode()
access_token = baidu_token()
post_data = json.dumps({
"format":"wav",
"rate":16000,
"dev_pid":1536,
"channel":1,
"token":access_token,
"cuid":"00-50-56-C0-00-08",
"len":data_len,
"speech":audio_data,
}).encode() #变为json的二进制
headers = {'Content-Type':'application/json'}
req = Request(url=url,headers=headers,data=post_data)
result = json.loads(urlopen(req).read().decode()).get('result')
if result:
return result[0]
else:
return None
def main():
data = record_audio()
res = baidu_fenxi(data)
print(res)
if __name__ == '__main__':
#程序入口
main()运行结果:E:\python学习资料\上课代码编写\代码练习py>python e:/python学习资料/上课代码编写/代码练习py/百度云.py
[TALK] 3.21
你好
35.百度云语音识别接口使用及PyAudio语音识别模块安装的更多相关文章
- C#调用百度云存储接口上传文件
因前几日见园子里有人说可以把网站静态文件放在百度上,于是去百度开放平台看了看,发现之前那篇文章不是调的云存储接口啊... 于是自己写了个C#能调百度云存储的例子(百度云开放平台只提供php.java. ...
- 百度云服务接口错误:Parameter invalid, the key input with filter parameter is not searchfilter column key
百度LBS云服务接口: 地址:http://lbsyun.baidu.com/index.php?title=lbscloud/api/geosearch 访问接口:http://api.map.ba ...
- 借助百度云API进行人脸识别
前言:本篇博客是笔者第一次使用百度云api进行人脸检测,主要内容包括两部分,一是获取接口,二是借助接口进行人脸检测.笔者也是初步了解这方面的内容,也是参考了杂七杂八的博文,内容可能存在错误及其他毛病, ...
- 百度云语音识别,Audio2Txt(c#)
百度云识别没有提供c#版本的sdk,下面给个c#的 1.打开网址http://developer.baidu.com/ 2.登陆 3.管理控制台>开发者服务管理 4.创建工程 5.输入名称,点击 ...
- python录音并调用百度语音识别接口
#!/usr/bin/env python import requests import json import base64 import pyaudio import wave import os ...
- python调用百度语音识别接口实时识别
1.本文直接上干货 奉献代码:https://github.com/wuzaipei/audio_discern/tree/master/%E8%AF%AD%E9%9F%B3%E8%AF%86%E5% ...
- 利用百度云接口实现车牌识别·python
一个小需求---实现车牌识别. 目前有两个想法 1. 调云在线的接口或者使用SDK做开发(配置环境和变异第三方库麻烦,当然使用python可以避免这些问题) 2. 自己实现车牌识别算法(复杂) 一开始 ...
- python利用百度云接口实现车牌识别
一个小需求---实现车牌识别. 目前有两个想法 调云在线的接口或者使用SDK做开发(配置环境和编译第三方库很麻烦,当然使用python可以避免这些问题) 自己实现车牌识别算法(复杂) ! 一开始准备使 ...
- Android推送服务——百度云推送
一.推送服务简介 消息推送,顾名思义,是由一方主动发起,而另一方与发起方以某一种方式建立连接并接收消息.在Android开发中,这里的发起方我们把它叫做推送服务器(Push Server),接收方叫做 ...
随机推荐
- 使用Eclipse进行远程调试(转)
做开发好多年了,Debug大家肯定都不陌生,绝对称得上是家常便饭了.博主虽不敢妄下断言,但是这里也猜一下,肯定有很多人都没有使用过Remote Debug(远程调试).说来惭愧,博主也是工作了3年才用 ...
- sql 查询 between and 和 >= <= 比较
好久没有更新博客了,积累了很多问题没有得到解决,自己也在纠结有些东西需不需要花时间研究一下,认真想了想,不管怎么样,不能停止更新博客,继续保持一周至少一篇的习惯,不能放弃. 今天说的问题比较简单,就是 ...
- 8、Spring Boot 2.x 服务器部署
1.8 服务器部署 完整源码: Spring-Boot-Demos 1.8.1 jar包提取出来maven打包(避免每次重复打相同的jar包),pom.xml配置如下: <build> & ...
- mysql40题
一.表关系 请创建如下表,并创建相关约束 导入现有数据库数据: /* Navicat Premium Data Transfer Source Server : localhost Source Se ...
- Django基础之ORM操作
################################################################## # PUBLIC METHODS THAT ALTER ATTRI ...
- Spring Cloud Config(三):基于JDBC搭建配置中心
1.简介 本文主要内容是基于jdbc搭建配置中心,使应用从配置中心读取配置信息并成功注册到注册中心,关于配置信息表结构仅供参考,大家可以根据具体需要进行扩展. 2.Config Server 搭建 2 ...
- Java安全(加密、摘要、签名、证书、SSL、HTTPS)
对于一般的开发人员来说,很少需要对安全领域内的基础技术进行深入的研究,但是鉴于日常系统开发中遇到的各种安全相关的问题,熟悉和了解这些安全技术的基本原理和使用场景还是非常必要的.本文将对非对称加密.数字 ...
- Java并发指南1:并发基础与Java多线程
本文转载自互联网,侵删 什么是并发 在过去单CPU时代,单任务在一个时间点只能执行单一程序.之后发展到多任务阶段,计算机能在同一时间点并行执行多任务或多进程.虽然并不是真正意义上的“同一时间点”,而是 ...
- Jmeter Web 性能测试入门 (四):一个小实例带你学会 Jmeter 脚本编写
测试场景: 模拟并发100个user,在TesterHome 站内搜索VV00CC 添加线程组 添加HTTP信息头管理器 添加HTTP Sampler 填写HTTP Sampler中的信息 添加监听器 ...
- 重读APUE(2)-read返回值少于要求读取字节数
返回值: 成功返回读到的字节数,如果达到文件尾,则返回0:注意:如果有数据第一次读取会返回全部读到的字节数,下一次读取才会返回0: 出错返回-1: 返回值少于要求读取字节数的情况: 1. 读取普通文件 ...