基于傅里叶变换的音频重采样算法 (附完整c代码)
前面有提到音频采样算法:
近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题。
坦白讲,我精力有限,但一般都会抽空回复一下。
大多数情况,阅读一下代码就能解决的问题,
也是要尝试一下的。
没准,你就解决了呢?
WebRtc的采样算法本身就考虑到它的自身应用场景,
所以它会有一些局限性,例如不支持任意采样率等等。
而简洁插值的这个算法,
我个人也一直在使用,因为简洁明了,简单粗暴。
我自然也就没有进一步去细究采样算法,
当然网上还有不少开源的采样算法也是极其不错的。
一直也想抽时间再做一个兼顾简洁和质量的算法出来,不了了之。
最近一直在死磕傅里叶变换,网上的资源看了一箩筐。
徘徊到最后,毫无疑问FFTW3必须是你的首选,
从岁数性能以及使用的概率来说,当之无愧的王者。
当然也顺带整理一下,其他的一些FFT实现,各有优劣。
用于学习,作为参考资料也是不二之选。
有兴趣的小伙伴,可以参阅之.
https://github.com/cpuimage/StockhamFFT
https://github.com/cpuimage/uFFT
https://github.com/cpuimage/BluesteinCrz
https://github.com/cpuimage/fftw3
当然最佳的参考资料,还是fftw3,
我的这个git做了以下工作:
1.梳理调整目录结构
2.移除一些影响阅读调试,让人头大的宏定义
3.合并代码至fftw_api.c,移除一些不常用的代码
注意:未经过严格测试验证
也许这个git存在的意义在于方便众人阅读学习fftw的算法思路,
以及调试,扣代码等等诸如此类的行为。
所以有需要的同学可以,参考之。
回到本次的主题,
在以前做图像算法的时候,就一直在想一个问题,
是否可以利用傅里叶变换的特性进行图像的重采样呢?
这个一直是我心中的一个小石头,一直没放下。
从理论上来说,可行的,只是估计最终质量并不能保证。
最佳的尝试莫过于音频重采样,在很多时候,
我们经常需要对一个音频进行傅里叶变换,然后进行上采样或下采样的操作。
那是不是可以直接就在频域进行重采样呢?
这样的做法是不是质量就能有所保障呢?
事实证明,这是可行的。
经过简单试验,基于傅里叶变换的音频重采样算法就这样出炉了。
目前示例采用hsfft 这个开源傅里叶变换进行验证,
没有采用fftw3的原因也很简单,因为fftw3编译器来有点麻烦。
而hsfft的函数风格与fftw3类似,只是速度性能上不及fftw3而已。
这样也符合我的要求,真正应用的时候再使用fftw3替换之即可,
在验证思路的时候,没必要动用fftw3,
这也是我为什么使用简洁重采样的原因之一。
每个步骤都要有策略和方法,不必太过较真。
如果特定情况下需要,我也可以上matlab,python,delphi,c#,c++等等。
语言只是工具,关键还是思路和思想。
贴上主要代码:
#ifndef MIN
#define MIN(a, b) ((a) < (b) ? (a) : (b))
#endif void FFTResample(float *input, float *output, int sizeIn, int sizeOut) {
fft_t *fftin = (fft_t *) calloc(sizeof(fft_t), sizeIn);
fft_t *fftout = (fft_t *) calloc(sizeof(fft_t), sizeOut);
if (fftin == NULL || fftout == NULL) {
if (fftout)
free(fftout);
if (fftin)
free(fftin);
return;
}
fft_real_object fftPlan = fft_real_init(sizeIn, );
fft_r2c_exec(fftPlan, input, fftin);
free_real_fft(fftPlan);
int halfIn = (sizeIn / ) + ;
int halfOut = (sizeOut / ) + ;
for (int i = ; i < MIN(halfIn, halfOut); ++i) {
fftout[i].re = fftin[i].re;
fftout[i].im = fftin[i].im;
}
fft_real_object ifftPlan = fft_real_init(sizeOut, -);
fft_c2r_exec(ifftPlan, fftout, output);
free_real_fft(ifftPlan);
float norm = .f / sizeIn;
for (int i = ; i < sizeOut; ++i) {
output[i] = (output[i] * norm);
}
free(fftout);
free(fftin);
}
算法非常简单,用一句时髦的语言来描述这个算法,就是“多退少补“。
需要补课FFT的可以移步:
项目地址:
https://github.com/cpuimage/fftResample
采用Cmake编译即可,示例代码也很简洁。
不多做解释了~
以上,权当抛砖引玉。
若有其他相关问题或者需求也可以邮件联系俺探讨。
邮箱地址是:
gaozhihan@vip.qq.com
基于傅里叶变换的音频重采样算法 (附完整c代码)的更多相关文章
- 基于RNN的音频降噪算法 (附完整C代码)
前几天无意间看到一个项目rnnoise. 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法. 采用的是 GRU/LSTM 模型. 阅读下训练代码,可 ...
- 音频降噪算法 附完整C代码
降噪是音频图像算法中的必不可少的. 目的肯定是让图片或语音 更加自然平滑,简而言之,美化. 图像算法和音频算法 都有其共通点. 图像是偏向 空间 处理,例如图片中的某个区域. 图像很多时候是以二维数据 ...
- mser 最大稳定极值区域(文字区域定位)算法 附完整C代码
mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化. ...
- WebRTC 音频采样算法 附完整C++示例代码
之前有大概介绍了音频采样相关的思路,详情见<简洁明了的插值音频重采样算法例子 (附完整C代码)>. 音频方面的开源项目很多很多. 最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包 ...
- 音频自动增益 与 静音检测 算法 附完整C代码
前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. ...
- 音频自动增益 与 静音检测 算法 附完整C代码【转】
转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用 ...
- 自动曝光修复算法 附完整C代码
众所周知, 图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了 ...
- 磨皮美颜算法 附完整C代码
前言 2017年底时候写了这篇<集 降噪 美颜 虚化 增强 为一体的极速图像润色算法 附Demo程序> 这也算是学习过程中比较有成就感的一个算法. 自2015年做算法开始到今天,还有个把月 ...
- 音频压缩编码 opus 附完整C++代码示例
绝大数人都知道mp3格式编码,以及aac,amr等压缩格式编码. 而在语音通信界有一个强悍的音频格式编码opus. 经过实测,压缩比最高可以达到1:10. 100KB 压缩后 10KB 虽然是有损压缩 ...
随机推荐
- linux下查看数据库版本的5中方法
1.在Linux终端窗口中,输入mysql -V查看MySQL版本信息[sky@qin ~]# mysql -Vmysql Ver 14.14 Distrib 5.1.29-rc, for pc-l ...
- unity3d中设计模式的学习<一>:泛型单例
单例是游戏开发中比较常见的设计模式,虽然针对的功能不同,但是有一些功能还是共有的,代码也不少,如果能放在一个基类里面是最好不过了,但是单例里需要有个instance功能来返回当前对象,所以这个功能必须 ...
- React v15.5.0更新说明 & v16.0.0更新预告
React今日发布了15.5.0版本,同时这也将是以15开头的最后一个版本,下一次发布,我们将迎来React 16.0.0 在15.5.0这一版本中,主要有以下两处改动: 独立React.PropTy ...
- LaTeX-WinEdt 编辑器和 PDF 文件的 Acrobat 11 程序关联
WinEdt 编辑器和 PDF 文件的 Acrobat 11 程序关联 CTeX 套装 2.8 版本以后,也就是09年9月以后的版本加入了SumatraPDF程序,将PDF文件与Acrobat程序取消 ...
- PHP 字符串补0
转自:https://www.cnblogs.com/bluebirds/archive/2016/11/22/6091099.html#undefined 概述:项目中经常会使用到在一串编码左边.右 ...
- 上下文(context):相关的内容
简单的理解,就是相关的内容 模式是在某种特定的场景(context)下某个不断重复出现的问题的解决方案. 环境:上下文:来龙去脉 上下文:语境:环境 网络背景:情境:脉络 context其实说白了,和 ...
- SMB linux&windows共享文件
搭建就不多说了:https://www.xuebuyuan.com/3235974.html 在其中可以用cd(进入目录),ls(罗列文件和文件夹),get(下载文件),put(上载文件) 等命令进行 ...
- docker-3-常用命令(上)
帮助命令: docker version docker info docker --help 镜像命令: docker images: 列出本地主机上的镜像 各个选项说明: ...
- IDEA定位开发文件在左边工程中的文件路径
IDEA新公司入职使用第七天,基本快捷键和BUG调试已经搞透了!从最开始的配置到现在的适应确实是一个不小的进步,前几天每天加班太忙没有时间更新博客,明天就是五一假期,现在将刚掌握的一点IDEA技术写出 ...
- mapper.xml中动态sql抽取重复项
mabatis重点是通过标签对sql灵活的组织,通过配置的方式完成输入 输出映射. 1.对mapper.xml中重复的sql抽取统一维护,以及foreach使用 UserMapperCustom.xm ...