python录音并调用百度语音识别接口

#！/usr/bin/env python

import requests

import json

import base64

import pyaudio

import wave

import os

import psutil

#首先配置必要的信息

def bat(voice_path):

    baidu_server = 'https://aip.baidubce.com/oauth/2.0/token?'

    grant_type = 'client_credentials'

    client_id = 'uj70rS1LiwZ9sQDvMSUqKsie' #API KEY

    client_secret = 'Q88eav41PzeNLczZ3hlRjhR8e4WShXwD' #Secret KEY   这里可以自己去百度注册，这里是我的API KEY 和 Secret KEY

    #合成请求token的url

    url = baidu_server+'grant_type='+grant_type+'&client_id='+client_id+'&client_secret='+client_secret

    #获取token

    res = requests.get(url).text

    data = json.loads(res)

    token = data['access_token']

    #设置音频的属性，采样率，格式等

    VOICE_RATE = 8000

    FILE_NAME = voice_path

    # USER_ID = '16241950' #这里的id随便填填就好啦，我填的自己昵称

    FILE_TYPE = 'wav'

    CUID="wate_play"

    #读取文件二进制内容

    f_obj = open(FILE_NAME, 'rb')

    content = base64.b64encode(f_obj.read())   # 百度语音识别需要base64编码格式

    speech = content.decode("utf-8")

    size = os.path.getsize(FILE_NAME)

    #json封装

    datas = json.dumps({

        'format': FILE_TYPE,

        'rate': VOICE_RATE,

        'channel': 1,

        'cuid': CUID,

        'token': token,

        'speech': speech,

        'len': size,

        "dev_pid":""

    })

    return datas

#设置headers和请求地址url

def post(datas):

    headers = {'Content-Type':'application/json'}

    url = 'https://vop.baidu.com/server_api'

    # url = "http://vop.baidu.com/server_api"

    #用post方法传数据

    request = requests.post(url, datas, headers)

    result = json.loads(request.text)

    text = result.get("result")

    if result['err_no'] == 0:

        return text

    else:

        return "Error"

def get_audio(filepath):

    input("回车开始录音 >>>")     #输出提示文本，input接收一个值,转为str，赋值给aa

    CHUNK = 256                 #定义数据流块

    FORMAT = pyaudio.paInt16    #量化位数（音量级划分）

    CHANNELS = 1               # 声道数;声道数：可以是单声道或者是双声道

    RATE = 8000                # 采样率;采样率：一秒内对声音信号的采集次数，常用的有8kHz, 16kHz, 32kHz, 48kHz, 11.025kHz, 22.05kHz, 44.1kHz

    RECORD_SECONDS = 5          #录音秒数

    WAVE_OUTPUT_FILENAME = filepath     #wav文件路径

    p = pyaudio.PyAudio()               #实例化

    stream = p.open(format=FORMAT,

                    channels=CHANNELS,

                    rate=RATE,

                    input=True,

                    frames_per_buffer=CHUNK)

    print("*"*10, "开始录音：请在5秒内输入语音")

    frames = []                                                 #定义一个列表

    for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):      #循环，采样率11025 / 256 * 5

        data = stream.read(CHUNK)                               #读取chunk个字节 保存到data中

        frames.append(data)                                     #向列表frames中添加数据data

    # print(frames)

    print("*" * 10, "录音结束\n")

    stream.stop_stream()

    stream.close()          #关闭

    p.terminate()           #终结

    wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')                  #打开wav文件创建一个音频对象wf，开始写WAV文件

    wf.setnchannels(CHANNELS)                                   #配置声道数

    wf.setsampwidth(p.get_sample_size(FORMAT))                  #配置量化位数

    wf.setframerate(RATE)                                       #配置采样率

    wf.writeframes(b''.join(frames))                            #转换为二进制数据写入文件

    wf.close()              #关闭

    return

def check_disk():

    list_drive = psutil.disk_partitions()  # 找出本地磁盘列表，保存的是结构体对象

    list_disk = []

    for drive in list_drive:

        list_disk.append(drive.device)

    return list_disk

if __name__ == '__main__':

    list_disk = check_disk() # 检索本地磁盘

    dirname_path = os.path.join(list_disk[0], "voice") # 设置语音文件存放路径，

                                                                   （mac os下需要自己定存储路径）

    if not os.path.exists(dirname_path):

        os.makedirs(dirname_path)

    filename = "voice.wav"  # 定义语音文件名

    in_path = os.path.join(dirname_path, filename)

    get_audio(in_path) # 录音

    datas = bat(in_path) # 封装百度语音识别需要的配置信息，返回请求头

    res = post(datas) # 连接百度语音识别接口，得到识别结果

    print("识别结果：",res[0])

实现效果：

在上述代码中，需要装到requests、psutil、pyaudio等库，其中pyaudio这个库在python3环境下装比较特殊，

windows环境下具体步骤如下：

第一步：下载whl文件支持

url：https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio

注意：

下载自己python解释器对应版本的

不要下载错了，资源很多

第二步：打开cmd，cd 进入下载的whl所在目录

执行命令：pip install Twisted-18.7.0-cp36-cp36m-win_amd64.whl # 下载的什么版本，后面就跟什么版本

第三步：执行命令：pip install pyaudio 安装

如果本地同时装有python2和python3，想装到python3里可以在cmd命令里把 pip 改成 pip3 即可

mac os 下安装pyaudio步骤如下：

到这里就结束啦！

给个赞呗~

python录音并调用百度语音识别接口的更多相关文章

python调用百度语音识别接口实时识别
1.本文直接上干货奉献代码:https://github.com/wuzaipei/audio_discern/tree/master/%E8%AF%AD%E9%9F%B3%E8%AF%86%E5% ...
js调用百度地图接口
原文:js调用百度地图接口这是前几天公司做的新项目,上面需要用到地图的数据.第一次做这类型的东西没啥思路,咱们经理说,这东西简单,截个图存文件夹里调整好尺寸,数据库里存上图片的地址动态调用就行了.心 ...
Winform调用百度地图接口简单示例
1.首先用一个html文件调用百度地图接口(主要注册一个序列号): <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitiona ...
Python实战---制作专属有声小说（调用百度语音合成接口）
这一次的目标是使用百度云的人工智能接口,实现文字转语音的实时转换,将小说文字转换成语音朗读出来. 百度云接口调用百度的这个接口对于我们普通用户非常友好,他的很多功能都是免费的,而且我们每天可以免费调 ...
Winform调用百度地图接口
using System; using System.IO; using System.Collections.Generic; using System.ComponentModel; using ...
PHP 最完美调用百度翻译接口代码示例 (原)
php调用百度翻译最新接口代码问题:写的过程遇到了一个问题,url拼接好的原翻译内容,appid,sign的地址直接输出到浏览器可以打开看到翻译后的返回值,但是各种curl,file_ ...
.net core 和 WPF 开发升讯威在线客服系统：调用百度翻译接口实现实时自动翻译
业余时间用 .net core 写了一个在线客服系统.并在博客园写了一个系列的文章,写介绍这个开发过程. 我把这款业余时间写的小系统丢在网上,陆续有人找我要私有化版本,我都给了,毕竟软件业的初衷就是免 ...
PHP调用百度天气接口API
//百度天气接口API $location = "北京"; //地区 $ak = "5slgyqGDENN7Sy7pw29IUvrZ"; //秘钥,需要申请,百 ...
WebApiClientCore简约调用百度AI接口
WebApiClientCore WebApiClient.JIT/AOT的netcore版本,集高性能高可扩展性于一体的声明式http客户端库,特别适用于微服务的restful资源请求,也适用于各种 ...

随机推荐

部署lnmp
装包 1.安装依赖包 yum - y install gcc openssl-devel pcre-devel zlib-devel 2.解源码包 .tar.gz 3.切换到解压缩后的目录,配置参数 ...
python中导包简介
以pycharm中为例 1.创建一个python package,就是创建一个包,注意,创建Directory和创建python package之间的不同,前者只是一个文件夹,不是包,后者是包.包里有 ...
VO、DTO、POJO、PO的区别
VO 即value object值对象.主要体现在视图的对象,对于一个WEB页面将整个页面的属性封装成一个对象.然后用一个VO对象在控制层与视图层进行传输交换. DTO 经过处理后的PO,可能增加或者 ...
luogu 4411 [BJWC2010]取数游戏约数+dp
不大难的dp,暴力拆一下约数然后按照约数来统计即可. 注意:vector 很慢,所以一定特判一下,如果没有该数,就不要添加. Code: #include <bits/stdc++.h> ...
《30天自制操作系统》学习笔记--Mac环境搭建
弄了三天了,终于弄好了,先说结果,就是作者在网站上放了os x的工具(hrb.osask.jp,也有linux下的工具,可以自己去下载),也就是说我白忙活了三天... 再说一下这几天都干啥了,主要是想 ...
【集训队作业2018】line
DP方程十分简单,考虑前对后贡献即可. \(f_i = \min_{l_i \leq j < i} \left\{ f_j + \left(\max_{j < k \leq i} \lef ...
vueApp打包
本地打包测试 http-server是一个基于node.js的简单的,零配置的命令行http服务器.安装:npm install http-server -g使用:http-server [path] ...
ida 下载
链接:https://pan.baidu.com/s/1Rs2UOSfroBGf_MIkJv0cGw 提取码:kjqd 官网:https://www.hex-rays.com/updida.shtml
python 绘制五角星
code import turtle n = eval(input("请输入五角星的长度")) turtle.begin_fill() #开始填充颜色 i = : turtle.f ...
【洛谷2053】 [SCOI2007]修车（费用流）
传送门洛谷 Solution 考虑把每一个修车工人拆成$n$个点,那么考虑令$id(i,j)$为第$i$个工人倒数第$j$次修车. 然后就可以直接跑费用流了!!! 代码实现 /* m ...

python录音并调用百度语音识别接口

python录音并调用百度语音识别接口的更多相关文章

随机推荐

热门专题