音频重采样原理及技术实现

2024-11-08

基于sinc的音频重采样（一）：原理

我在前面的文章<音频开源代码中重采样算法的评估与选择>中说过sinc方法是较好的音频重采样方法,缺点是运算量大.https://ccrma.stanford.edu/~jos/resample/ 给出了sinc方法的原理文档和软件实现.以前是使用这个算法,没太关注原理和实现细节.去年(2020年)由于项目的需要和组内同学把这个算法的原理和软件实现细节搞清楚了.本文先讲讲sinc方法的原理,后面文章会讲讲软件实现的细节. 1,sinc函数和信号的采样与重建在数字信号处理中,sinc函数定义为:

基于sinc的音频重采样（二）：实现

上篇(基于sinc的音频重采样(一):原理)讲了基于sinc方法的重采样原理,并给出了数学表达式,如下: (1) 本文讲如何基于这个数学表达式来做软件实现.软件实现的细节很多,这里主要讲核心部分.函数srcUD()和filterUD()就是实现的主要函数(这两个函数是在源码基础上作了一定的改动,核心思想没变).srcUD()是实现一帧中点的重采样,一个点一个点的做.filterUD()被srcUD()调用.数学表达式就体现在函数filterUD()里.粗看肯定会

简洁明了的插值音频重采样算法例子 (附完整C代码)

近一段时间在图像算法以及音频算法之间来回游走. 经常有一些需求,需要将音频进行采样转码处理. 现有的知名开源库,诸如: webrtc , sox等, 代码阅读起来实在闹心. 而音频重采样其实也就是插值算法. 与图像方面的插值算法没有太大的区别. 基于双线性插值的思路. 博主简单实现一个简洁的重采样算法, 用在对采样音质要求不高的情况下,也是够用了. 编解码库采用dr_wav https://github.com/mackron/dr_libs/blob/master/dr_wav.h 近期有点强

FFmpeg进行视频帧提取&音频重采样-Process.waitFor()引发的阻塞超时

由于产品需要对视频做一系列的解析操作,利用FFmpeg命令来完成视频的音频提取.第一帧提取作为封面图片.音频重采样.字幕压缩等功能: 前一篇文章已经记录了FFmpeg在JAVA中的使用-音频提取&字幕压缩 ,就不再重复说明,今天简单介绍下如何实现第一帧提取.重采样,然后再分享下Process.waitFor()引发的阻塞问题. 一.首先,分享两个命令: 视频第一帧提取:ffmpeg -i [videofile] -vframes 1 -q:v 2 -f image2 [imagefile]

FFmpeg(11)-基于FFmpeg进行音频重采样(swr_init(), swr_convert())

一.包含头文件和库文件修改CMakeLists # swresample add_library(swresample SHARED IMPORTED) set_target_properties(swresample PROPERTIES IMPORTED_LOCATION ${FF}/libswresample.so) 更新target_link_libraries target_link_libraries( # Specifies the target library. native-

FFMpeg音频重采样和视频格式转

一．视频像素和尺寸转换函数 1．sws_getContext : 像素格式上下文 --------------->多副图像(多路视频)进行转换同时显示 2．struct SwsContext *sws_getCachedContext(struct SwsContext *context , int srcW , int srcH enum AVPixelFormat srcFormat , int dstW , int dstH , enum AVPixelFormat dstForma

FFMpeg笔记（三）音频处理基本概念及音频重采样

Android放音的采样率固定为44.1KHz,录音的采样率固定为8KHz,因此底层的音频设备驱动需要设置好这两个固定的采样率.如果上层传过来的采样率不符的话,需要进行resample重采样处理. 几个名词: 1. 采样率采样设备每秒抽取样本的次数 2. 音频格式及量化精度(位宽) 每种音频格式有不同的量化精度(位宽),位数越多,表示值就越精确,声音表现自然就越精准.FFMpeg中音频格式有以下几种,每种格式有其占用的字节数信息: enum AVSampleFormat { AV_SAMPLE

基于傅里叶变换的音频重采样算法 (附完整c代码)

前面有提到音频采样算法: WebRTC 音频采样算法附完整C++示例代码简洁明了的插值音频重采样算法例子 (附完整C代码) 近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题. 坦白讲,我精力有限,但一般都会抽空回复一下. 大多数情况,阅读一下代码就能解决的问题, 也是要尝试一下的. 没准,你就解决了呢? WebRtc的采样算法本身就考虑到它的自身应用场景, 所以它会有一些局限性,例如不支持任意采样率等等. 而简洁插值的这个算法, 我个人也一直在使用,因为简洁明了,简单粗暴. 我自

学习NLP:《自然语言处理原理与技术实现(罗刚)》PDF+代码

自然语言处理技术已经深入我们的日常生活.我们经常用到的搜索引擎就用到了自然语言理解等自然语言处理技术.自然语言处理是一门交叉学科,涉及计算机.数学.语言学等领域的知识. <自然语言处理原理与技术实现>详细介绍中文和英文自然语言处理的原理,并以Java 实现,包括中文分词.词性标注.依存句法分析等.其中详细介绍了中文分词和词性标注的过程及相关算法,如隐马尔可夫模型等.在自然语言处理的应用领域主要介绍了信息抽取.自动文摘.文本分类等领域的基本理论和实现过程,此外还有问答系统.语音识别等目前应用非常

FFmpeg4.0笔记：封装ffmpeg的音频重采样功能类CSwr

Github https://github.com/gongluck/FFmpeg4.0-study/tree/master/Cff CSwr.h /******************************************************************* * Copyright(c) 2019 * All rights reserved. * * 文件名称: CSwr.h * 简要描述: 重采样 * * 作者: gongluck * 说明: * **********

《Python爬虫技术：深入理解原理、技术与开发》已经出版，送Python基础视频课程

好消息,<Python爬虫技术:深入理解原理.技术与开发>已经出版!!! JetBrains官方推荐图书!JetBrains官大中华区市场部经理赵磊作序!送Python基础视频课程!JetBrains官大中华区市场部经理赵磊作序!超过300个实战案例,10万行源代码,22个综合实战项目,海量学习资料! 购买地址: 当当京东知识图谱

7.SwrContext音频重采样使用

头文件位于#include <libswresample/swresample.h> SwrContext常用函数如下所示 SwrContext *swr_alloc(void); //创建一个SwrContext,并设置为默认参数 struct SwrContext *swr_alloc_set_opts(struct SwrContext *s, int64_t out_ch_layout, enum AVSampleFormat out_sample_fmt, int out_sam

Android端代码染色原理及技术实践

导读高德地图开放平台产品不断迭代,代码逻辑越来越复杂,现有的测试流程不能保证完全覆盖所有业务代码,测试不到的代码及分支,会存在一定的风险.为了保证测试全面覆盖,需要引入代码覆盖率做为测试指标,需要对SDK代码进行染色,测试结束后可生成代码覆盖率报告,作为发版前的一项重要卡点指标.本文小结了Android端代码染色原理及技术实践. JaCoCo工具 JaCoCo有以下优点: 支持Ant和Gradle打包方式,可以自由切换. 支持离线模式,更贴合SDK的使用场景. JaCoCo文档比较全面,还

BI系统的分布式部署原理和技术实现

1.什么是分布式关于"分布式系统"的定义,我们先看下书中是怎么说的.<分布式系统原理和范型>一书中是这样定义分布式系统的:"分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像是单个相关系统". 关于这个定义,我们直观的感受就是: 首先,这种系统相对来说很厉害,由好几台主机组成.以谷歌.亚马逊等服务商而言,他们的数据中心都由上万台主机支撑起来的. 其次,虽然很它很厉害,但对于外人来说,是感觉不到这些主机的存在.也就是说,我们只看到是一个系统在运

webrtc开源项目音频重采样“不友好接口”的几点总结

WebRTC(Web Real Time Communication)并不是Google原来自己的技术,在2010年,Google以大约6820万美元收购了VoIP软件开发商Global IP Solutions公司,开源了WebRTC实时通信项目. 语音引擎是GIPS的语音通信的杀手锏,其主要是通过一系列的传输控制来达到在低带宽下传输实时的语音,GIPS语音引擎有着广泛的客户群,比如skype.QQ等语音都是采用GIPS的语言引擎.通过其语音引擎,不仅能传输质量更高的语音,还能在丢包非常

Docker 介绍以及其相关术语、底层原理和技术

https://ruby-china.org/topics/22004 Docker是啥 Docker是一个程序运行.测试.交付的开放平台,Docker被设计为能够使你快速地交付应用.在Docker中,你可以将你的程序分为不同的基础部分,对于每一个基础部分都可以当做一个应用程序来管理.Docker能够帮助你快速地测试.快速地编码.快速地交付,并且缩短你从编码到运行应用的周期. Docker使用轻量级的容器虚拟化平台,并且结合工作流和工具,来帮助你管理.部署你的应用程序. 在其核心,Docker实

【改】利用ALSA库进行音频重采样

转自:http://www.voidcn.com/article/p-snamarwr-p.html 一.ALSA介绍: 1.简介: 高级Linux声音体系(英语:Advanced LinuxSound Architecture,缩写为ALSA)是Linux内核中,为声卡提供的驱动组件,以替代原先的OSS(开放声音系统). 一部分的目的是支持声卡的自动配置,以及完美的处理系统中的多个声音设备,这些目的大多都已达到.另一个声音框架JACK使用ALSA提供低延迟的专业级音频编辑和混音能力. Jaro

170725、Kafka原理与技术

本文转载自:http://www.linkedkeeper.com/detail/blog.action?bid=1016 Kafka的基本介绍 Kafka最初由Linkedin公司开发,是一个分布式.分区.多副本.多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常用于web/nginx日志.访问日志,消息服务等等场景.Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目. 主要应用场景是:日志收集系统和消息系统. Kafka主要设计目标如下: 以

AJAX 概念优势发展前景工作原理底层技术状态缺点框架

1. 概念 Ajax asynchronous JavaScript and XML , 异步js和xml. 这种解释已经过时了, 现在ajax就是, 允许浏览器和服务器通信, 而无需刷新当前页面的技术. 它本来是微软的技术, 是Google 在 google earth.google suggest以及gmail等对ajax技术的广泛应用,催生了ajax的流行.事实上google目前在ajax技术方面的领先是微软所无法达到的 2. 发展前景 Gmail在收发邮件的时候已经和Outlook Ex

如何更有效使用 Rational AppScan 扫描大型网站，第 1 部分: 工作原理及技术分析

Rational AppScan 工作原理 Rational AppScan(简称 AppScan)其实是一个产品家族,包括众多的应用安全扫描产品,从开发阶段的源代码扫描的 AppScan source edition,到针对 Web 应用进行快速扫描的 AppScan standard edition,以及进行安全管理和汇总整合的 AppScan enterprise Edition 等.我们经常说的 AppScan 就是指的桌面版本的 AppScan,即 AppScan standard e

音频重采样原理及技术实现

热门专题