[Python]语音识别媒体中的音频到文本

准备工作
视频转音频
识别音频到文本
音频直接转换文本

准备工作

安装python3环境
申请一个可用的语音转换API，此篇以Microsoft Azure Speech为例

在Microsoft Azure 市场中搜索speech关键字找到语音服务。并创建好服务实例

在资源中找到创建的服务并查看

在此处点击显示密钥，我们要记住key值和location值，作为语音识别库的请求参数

视频转音频

安装视频库moviepy

pip install moviepy

编写代码，将视频文件test.mp4中的音频提取到test2.wav

import moviepy.editor

videoClip = moviepy.editor.VideoFileClip(r"{}".format("test.mp4"))

videoClip.audio.write_audiofile(r"{}".format("test2.wav"))

识别音频到文本

安装语音识别库SpeechRecognition

pip install SpeechRecognition

编写代码，将视频文件test3.wav中的音频识别，并转换成文本写入test.txt

import speech_recognition 

audio2 = speech_recognition.AudioFile("{}".format("test3.wav"))

recognizer =  speech_recognition.Recognizer()

with audio2 as source:

    audioData = recognizer.record(source)

result = recognizer.recognize_azure(audioData,key="<your api key>",language="zh-CN",location="eastus")

with open('test.txt', 'w') as file:

    if result.__len__()>0:

        file.write(result[0])

完整代码如下

import speech_recognition

import moviepy.editor

videoClip = moviepy.editor.VideoFileClip(r"{}".format("test.mp4"))

videoClip.audio.write_audiofile(r"{}".format("test2.wav"))

audio2 = speech_recognition.AudioFile("{}".format("test2.wav"))

recognizer =  speech_recognition.Recognizer()

with audio2 as source:

    audioData = recognizer.record(source)

result = recognizer.recognize_azure(audioData,key="<your api key>",language="zh-CN",location="eastus")

with open('test.txt', 'w') as file:

    if result.__len__()>0:

        file.write(result[0])

音频直接转换文本

Azure提供了快捷转换语音到文本的工具 https://speech.microsoft.com/portal

点击实时语音转文本

这里需要注意的是，需要上传的音频格式为16kHz 或 8kHz、16 位和单声道 PCM

上传完成后将自动转换成文本

安装音频转换库pydub

pip install pydub

编写代码，将test.aac文件以16kHz 采样率和单声道 PCM 编码方式，保存至test1.wav

注意，如果使用ffmpeg编码的格式，需要下载ffmpeg相关库到脚本所在目录

http://www.ffmpeg.org/download.html#build-windows

from pydub import AudioSegment

audio1 = AudioSegment.from_file("test.aac", "aac")

#  -ac 1 -ar 16000

audio1.export("test1.wav", format="wav",parameters=["-ac", "1", "-ar", "16000"])

[Python]语音识别媒体中的音频到文本的更多相关文章

[译]使用BeautifulSoup和Python从网页中提取文本
如果您要花时间浏览网页,您可能遇到的一项任务就是从HTML中删除可见的文本内容. 如果您使用的是Python,我们可以使用BeautifulSoup来完成此任务. 设置提取首先,我们需要获取一些HT ...
基于百度语音识别API的Python语音识别小程序
一.功能概述实现语音为文字,可以扩展到多种场景进行工作,这里只实现其基本的语言接收及转换功能. 在语言录入时,根据语言内容的多少与停顿时间,自动截取音频进行转换. 工作示例: 二.软件环境操作系统 ...
如何利用Social Listening从社会化媒体中“提炼”有价值的信息？
本文转自知乎作者:苏格兰折耳喵 ----------------------------------------------------- 在本文中,笔者将会介绍大数据分析主要的处对象---社会化媒 ...
MRCPv2在电信智能语音识别业务中的应用
1. MRCPv2协议简介媒体资源控制协议(Media Resource Control Protocol, MRCP)是一种基于TCP/IP的通讯协议,用于客户端向媒体资源服务器请求提供各种媒体资 ...
Python 基础教程中的问题及解决方案（1）
1. 在ubuntu中,调用终端时如: f = open('/home/theone/test_input.txt', 'r') 中的txt格式文本不能加后缀正确的应为: f = open('/h ...
与众不同 windows phone (14) - Media（媒体）之音频播放器, 视频播放器, 与 Windows Phone 的音乐和视频中心集成
原文:与众不同 windows phone (14) - Media(媒体)之音频播放器, 视频播放器, 与 Windows Phone 的音乐和视频中心集成 [索引页][源码下载] 与众不同 win ...
用python在excel中读取与生成随机数写入excel中
今天是我第一次发博客,就关于python在excel中的应用作为我的第一篇吧. 具体要求是:在一份已知的excel表格中读取学生的学号与姓名,再将这些数据放到新的excel表中的第一列与第二列,最后再 ...
[python] 使用Jieba工具中文分词及文本聚类概念
声明:由于担心CSDN博客丢失,在博客园简单对其进行备份,以后两个地方都会写文章的~感谢CSDN和博客园提供的平台. 前面讲述了很多关于Python爬取本体Ontology.消息盒Inf ...
[转]【NLP】干货！Python NLTK结合stanford NLP工具包进行文本处理阅读目录
[NLP]干货!Python NLTK结合stanford NLP工具包进行文本处理原贴: https://www.cnblogs.com/baiboy/p/nltk1.html 阅读目录目 ...
在html中插入音频
在html中插入音频第一种:在页面代码中的<head></head>之间加入<bgsound src="音乐url" loop="-1&q ...

随机推荐

linux 防火墙管理
1.查看防火墙状态指令 Firewall-cmd --state 2.关闭防火墙 service firewall stop 3.打开防火墙 service firewall start 4.重启防火 ...
ios怎么在自己公司网站扫描下载安装IPA安装包
企业证书(或者99的证书,但是有100个设备限制)打包的IPA安装包,怎么发布给用户安装使用呢? 试了直接给用户.ipa包的链接,手机不能像安卓手机那样安装,平时我们测试放在蒲公英的包蒲公英应该是有做 ...
kubectl工具安装指南
kubectl是一个用于连接Service Mesh控制平面的工具,可以安装在办公电脑的Windows系统上,也可以安装在虚拟机的Linux系统上,只要网络能与控制平面的公网地址互通即可.下面分别介绍 ...
Day15-static、抽象类、接口、内部类
static.抽象类.接口.内部类一.static关键字详解 1.静态的变量/方法 package Demo02; //static public class Student { private s ...
Git、GitHub、GitLab三者之间的区别
1.Git Git是一个版本控制系统. 版本控制是一种用于记录一个或多个文件内容变化,方便我们查阅特定版本修订情况的系统. 总结: (1)分布式版本控制系统下的本地仓库包含代码库还有历史库,在本地就可 ...
【PTA】1049 Counting Ones
The task is simple: given any positive integer N, you are supposed to count the total number of 1's ...
运行不出来真的QAQ
学C的时候最大的苦恼是编译不通过和运行不正确学了C++之后就开始有编译过了但运行不出来的情况了TAT
VSCode Snippet
{ // Place your snippets for javascript here. Each snippet is defined under a snippet name and has a ...
Python笔记（5）——if 语句一：条件测试（Python编程：从入门到实践）
每条if语句的核心都是一个值为True或False的表达式.Python根据条件测试的值为True还是False来决定是否执行if语句中的代码.如果条件测试的值为True,Python就执行紧跟在if ...
AD使用积累 - AD原理图界面选中所有器件但不选中电气连接线
1.在随意一个器件上右键,选择查找相似对象. 2.在弹出的界面选择如下两项: 3.点击确定,会高亮所有元器件,这时再进行框选就可以只选中器件.