C#音频截取与原文匹配

1.需求

上传一个音频文件（例如英语听力的音频）与音频对应的原文word文档。大概估算音频中一段对话到另一端对话的时间间隔，将音频截取为不同对话的小音频文件，通过百度语音识别转换成英文，然后与原文对比。

2.先上结果图吧。大概的效果如图所示

timespan是每段对话的开始时间戳，file_url是我上传到服务器的音频文件地址，baiduText是百度语音识别的结果，contractText是匹配之后的结果，percent是字符串相似度匹配百分比。

3.实现思路

3.1.上传文件并保存就不说了。后面会放源码。

3.2.异步循环处理音频，直到结束

3.3.读取音频文件，根据时间间隔获取需要的时间戳

这里需要先将音频文件转换为wav的波形文件。（第一版本的时候我用的NAudio，但是没用好）

根据波形数据，判断是否有声音，并记录下有声音和没声音的时间点

3.4.根据时间点，截取音频。我用的是NAudio。由于百度只能识别60s以下的音频，所以对超过60s的音频做了处理。另外百度识别音频最快的格式是pcm，所以也做了转换，音频转换也是用的NAudio

（****这里修改了一个bug，截取超过60s的音频时，要重新读音频流，然后再截取，不然后面的时间会乱。截图我就懒得换了）

3.5.百度语音识别可以看百度官网。我这边的access_token和过期时间直接写xml文件了

3.6.百度语音识别的结果与原文匹配

3.7.中文匹配，匹配的每个字符，匹配算法如下

3.8.英文匹配的每个单词

4.源码下载

https://github.com/zhaoshangtong/AudioTool

5.结语

目前这是第一个版本，肯定有不完善的地方。欢迎交流~

ps：不用推荐，不用点赞，要脸~~哈哈哈哈哈哈哈哈哈哈

C#音频截取与原文匹配的更多相关文章

C#音频截取与原文匹配2：使用ffmpeg处理音频文件
ffmpeg获取音频时间 ffmpeg转换音频格式(单声道,16000hz,16bit wav) ffmpeg截取音频不知道是不是错觉,感觉ffmpeg比NAudio要快啊~ 那么这就是第二个版本 ...
ios 字符串处理：截取字符串、匹配字符串、分隔字符串
1.截取字符串 NSString*string =@"sdfsfsfsAdfsdf";string = [string substringToIndex:7];//截取掉下标7之后 ...
那些年，我们一起被坑的H5音频
原文地址:http://weibo.com/p/23041874d6cedd0102vkbr 不要被这么文艺的标题吓到,这里不会跟你讲述中学时期泡妞史,也不会有其它什么现实不该有而小说噼里啪啦不能 ...
idea java 正则表达式匹配替换
原文匹配中文 excelMap.get$(\"[\u4E00-\u9F15]+\")$ 目标 excelMap.get$$1.hashCode\($\)
怎么用JS截取字符串中第一个和第二个字母间的部分？
一.JS中用正则判断字符串是否有匹配正则的字符串部分,格式如下: /[a-zA-Z](.*?)[a-zA-Z]/.test('1a123d45678901a2') “.test”前面的部分是正则表达式 ...
linux shell 字符串操作详解（长度，读取，替换，截取，连接，对比，删除，位置）
在做shell批处理程序时候,经常会涉及到字符串相关操作.有很多命令语句,如:awk,sed都可以做字符串各种操作. 其实shell内置一系列操作符号,可以达到类似效果,大家知道,使用内部操作符会省略 ...
Adobe Edge Animate –使用EdgeCommons加载和播放音频
Adobe Edge Animate –使用EdgeCommons加载和播放音频版权声明: 本文版权属于北京联友天下科技发展有限公司. 转载的时候请注明版权和原文地址. 在Edge中,可以new一 ...
Matlab之合并音频
程序功能: 1.读入wav下的所有音频 2.每个音频截取前0.6秒 3.合并每个音频 clear all; cd = 'wav'; waveFiles = dir(fullfile(cd,'*.wav ...
匹配中文字符的正则表达式： [/u4e00-/u9fa5]
原文:匹配中文字符的正则表达式: [/u4e00-/u9fa5] 这里是几个主要非英文语系字符范围(google上找到的): 2E80-33FFh:中日韩符号区.收容康熙字典部首.中日韩辅助部首.注音 ...

随机推荐

【Bug】解决 java.sql.SQLSyntaxErrorException 异常
java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax 错误错误详情: Caused by: java.sql. ...
Java多线程编程（一）Java多线程技能
一.进程和多线程的概念以及线程的优点打开Windo任务管理器可以看到很多正在运行着的exe程序,完全可以将运行在内存中的exe文件理解成进程,进程是受操作系统管理的基本运行单元. 线程可以理解成在进 ...
JVM垃圾收集策略与算法
垃圾收集策略与算法程序计数器.虚拟机栈.本地方法栈随线程而生,也随线程而灭:栈帧随着方法的开始而入栈,随着方法的结束而出栈.这几个区域的内存分配和回收都具有确定性,在这几个区域内不需要过多考虑回收的 ...
python：将网页图片保存到本地
1.requests库介绍在python中,有一个非常好用的网络请求库requests,使用它可以发起网络请求,并获取网页返回的内容.同时,也可以进行网页图片下载 requests是使用Apache ...
聊聊 Vue 中 provide/inject 的应用
众所周知,在组件式开发中,最大的痛点就在于组件之间的通信.在 Vue 中,Vue 提供了各种各样的组件通信方式,从基础的 props/$emit 到用于兄弟组件通信的 EventBus,再到用于全局数 ...
转：linux环境mysql root用户密码重置
经常设置了mysql的root密码,就忘记掉了,这种事还是经常发生的.转自他人(http://www.osyunwei.com/archives/2014.html),权做笔记.linux环境下,解决 ...
for循环使用笔记
1.for i in rang(1,101,2) #2为步长 print("loop",i) 2.flag 标志位3.for 循环CODE1 for与else一起用:当for循环正 ...
python机器学习——感知器
最近在看机器学习相关的书籍,顺便把每天阅读的部分写出来和大家分享,共同学习探讨一起进步!作为机器学习的第一篇博客,我准备从感知器开始,之后会慢慢更新其他内容. 在实现感知器算法前,我们需要先了解一下神 ...
使用Typescript重构axios(二十五)——文件上传下载进度监控
0. 系列文章 1.使用Typescript重构axios(一)--写在最前面 2.使用Typescript重构axios(二)--项目起手,跑通流程 3.使用Typescript重构axios(三) ...
使用ASP.NET Core 3.x 构建 RESTful API - 3.1 资源命名
之前讲了RESTful API的统一资源接口这个约束,里面提到了资源是通过URI来进行识别的,每个资源都有自己的URI.URI里还涉及到资源的名称,而针对资源的名称却没有一个标准来进行规范,但是业界还 ...

C#音频截取与原文匹配

C#音频截取与原文匹配的更多相关文章

随机推荐

热门专题