基于傅里叶变换的音频重采样算法 (附完整c代码)
前面有提到音频采样算法:
近段时间有不少朋友给我写过邮件,说了一些他们使用的情况和问题。
坦白讲,我精力有限,但一般都会抽空回复一下。
大多数情况,阅读一下代码就能解决的问题,
也是要尝试一下的。
没准,你就解决了呢?
WebRtc的采样算法本身就考虑到它的自身应用场景,
所以它会有一些局限性,例如不支持任意采样率等等。
而简洁插值的这个算法,
我个人也一直在使用,因为简洁明了,简单粗暴。
我自然也就没有进一步去细究采样算法,
当然网上还有不少开源的采样算法也是极其不错的。
一直也想抽时间再做一个兼顾简洁和质量的算法出来,不了了之。
最近一直在死磕傅里叶变换,网上的资源看了一箩筐。
徘徊到最后,毫无疑问FFTW3必须是你的首选,
从岁数性能以及使用的概率来说,当之无愧的王者。
当然也顺带整理一下,其他的一些FFT实现,各有优劣。
用于学习,作为参考资料也是不二之选。
有兴趣的小伙伴,可以参阅之.
https://github.com/cpuimage/StockhamFFT
https://github.com/cpuimage/uFFT
https://github.com/cpuimage/BluesteinCrz
https://github.com/cpuimage/fftw3
当然最佳的参考资料,还是fftw3,
我的这个git做了以下工作:
1.梳理调整目录结构
2.移除一些影响阅读调试,让人头大的宏定义
3.合并代码至fftw_api.c,移除一些不常用的代码
注意:未经过严格测试验证
也许这个git存在的意义在于方便众人阅读学习fftw的算法思路,
以及调试,扣代码等等诸如此类的行为。
所以有需要的同学可以,参考之。
回到本次的主题,
在以前做图像算法的时候,就一直在想一个问题,
是否可以利用傅里叶变换的特性进行图像的重采样呢?
这个一直是我心中的一个小石头,一直没放下。
从理论上来说,可行的,只是估计最终质量并不能保证。
最佳的尝试莫过于音频重采样,在很多时候,
我们经常需要对一个音频进行傅里叶变换,然后进行上采样或下采样的操作。
那是不是可以直接就在频域进行重采样呢?
这样的做法是不是质量就能有所保障呢?
事实证明,这是可行的。
经过简单试验,基于傅里叶变换的音频重采样算法就这样出炉了。
目前示例采用hsfft 这个开源傅里叶变换进行验证,
没有采用fftw3的原因也很简单,因为fftw3编译器来有点麻烦。
而hsfft的函数风格与fftw3类似,只是速度性能上不及fftw3而已。
这样也符合我的要求,真正应用的时候再使用fftw3替换之即可,
在验证思路的时候,没必要动用fftw3,
这也是我为什么使用简洁重采样的原因之一。
每个步骤都要有策略和方法,不必太过较真。
如果特定情况下需要,我也可以上matlab,python,delphi,c#,c++等等。
语言只是工具,关键还是思路和思想。
贴上主要代码:
#ifndef MIN
#define MIN(a, b) ((a) < (b) ? (a) : (b))
#endif void FFTResample(float *input, float *output, int sizeIn, int sizeOut) {
fft_t *fftin = (fft_t *) calloc(sizeof(fft_t), sizeIn);
fft_t *fftout = (fft_t *) calloc(sizeof(fft_t), sizeOut);
if (fftin == NULL || fftout == NULL) {
if (fftout)
free(fftout);
if (fftin)
free(fftin);
return;
}
fft_real_object fftPlan = fft_real_init(sizeIn, );
fft_r2c_exec(fftPlan, input, fftin);
free_real_fft(fftPlan);
int halfIn = (sizeIn / ) + ;
int halfOut = (sizeOut / ) + ;
for (int i = ; i < MIN(halfIn, halfOut); ++i) {
fftout[i].re = fftin[i].re;
fftout[i].im = fftin[i].im;
}
fft_real_object ifftPlan = fft_real_init(sizeOut, -);
fft_c2r_exec(ifftPlan, fftout, output);
free_real_fft(ifftPlan);
float norm = .f / sizeIn;
for (int i = ; i < sizeOut; ++i) {
output[i] = (output[i] * norm);
}
free(fftout);
free(fftin);
}
算法非常简单,用一句时髦的语言来描述这个算法,就是“多退少补“。
需要补课FFT的可以移步:
项目地址:
https://github.com/cpuimage/fftResample
采用Cmake编译即可,示例代码也很简洁。
不多做解释了~
以上,权当抛砖引玉。
若有其他相关问题或者需求也可以邮件联系俺探讨。
邮箱地址是:
gaozhihan@vip.qq.com
基于傅里叶变换的音频重采样算法 (附完整c代码)的更多相关文章
- 基于RNN的音频降噪算法 (附完整C代码)
前几天无意间看到一个项目rnnoise. 项目地址: https://github.com/xiph/rnnoise 基于RNN的音频降噪算法. 采用的是 GRU/LSTM 模型. 阅读下训练代码,可 ...
- 音频降噪算法 附完整C代码
降噪是音频图像算法中的必不可少的. 目的肯定是让图片或语音 更加自然平滑,简而言之,美化. 图像算法和音频算法 都有其共通点. 图像是偏向 空间 处理,例如图片中的某个区域. 图像很多时候是以二维数据 ...
- mser 最大稳定极值区域(文字区域定位)算法 附完整C代码
mser 的全称:Maximally Stable Extremal Regions 第一次听说这个算法时,是来自当时部门的一个同事, 提及到他的项目用它来做文字区域的定位,对这个算法做了一些优化. ...
- WebRTC 音频采样算法 附完整C++示例代码
之前有大概介绍了音频采样相关的思路,详情见<简洁明了的插值音频重采样算法例子 (附完整C代码)>. 音频方面的开源项目很多很多. 最知名的莫过于谷歌开源的WebRTC, 其中的音频模块就包 ...
- 音频自动增益 与 静音检测 算法 附完整C代码
前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. ...
- 音频自动增益 与 静音检测 算法 附完整C代码【转】
转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用 ...
- 自动曝光修复算法 附完整C代码
众所周知, 图像方面的3A算法有: AF自动对焦(Automatic Focus)自动对焦即调节摄像头焦距自动得到清晰的图像的过程 AE自动曝光(Automatic Exposure)自动曝光的是为了 ...
- 磨皮美颜算法 附完整C代码
前言 2017年底时候写了这篇<集 降噪 美颜 虚化 增强 为一体的极速图像润色算法 附Demo程序> 这也算是学习过程中比较有成就感的一个算法. 自2015年做算法开始到今天,还有个把月 ...
- 音频压缩编码 opus 附完整C++代码示例
绝大数人都知道mp3格式编码,以及aac,amr等压缩格式编码. 而在语音通信界有一个强悍的音频格式编码opus. 经过实测,压缩比最高可以达到1:10. 100KB 压缩后 10KB 虽然是有损压缩 ...
随机推荐
- js笔记 标签: javascript 2016-08-01 13:30 75人阅读 评论(0) 收藏
typeof可以用来检测给定变量的数据类型,typeof是一个操作符而不是函数,所以圆括号可以省略. Undefined类型只有一个值,即特殊的undefined.在使用var声明变量但未对其加以初始 ...
- Doing Research Needs Efforts
What is research? From YouTube Video or baiduyun Links What does not? spend many hours before you ...
- June 19th 2017 Week 25th Monday
Everyone is dissatisfied with his own fortune. 人对自己的命运总是感到不满足. We always want more, even when we hav ...
- pg 关于不插入重复字段的方法
首先在表的某列加入唯一约束 alter table language_pms add CONSTRAINT language_pms_unique unique(xml); insert into l ...
- 移动端开发 rem 案例
<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...
- selenium+java项目实战---百度输入框
最近对java+selenium+testng+maven 做一个小项目的总结,并对工作中的框架在做一些小总结,大概目录为: 1.项目实战--百度登录输入框 2.项目的二次封装 3.框架分层,及po模 ...
- BZOJ2005:[NOI2010]能量采集(莫比乌斯反演,欧拉函数)
Description 栋栋有一块长方形的地,他在地上种了一种能量植物,这种植物可以采集太阳光的能量.在这些植物采集能量后,栋栋再使用一个能量汇集机器把这些植物采集到的能量汇集到一起. 栋栋的植物种得 ...
- jQuery序列化Ajax提交表单
var formData=$("form").serialize(); $.ajax({ type: "POST", url: "/front/EPt ...
- Google 和 Baidu 常用的搜索技巧
Google 常用的搜索技巧 1. 精确搜索:双引号 精确搜索,就是在你要搜索的词上,加上双引号,这个Google搜索引擎,就会完全的匹配你所要的词 2. 站内搜索:site 这是一个比较常用的搜索方 ...
- M4修改外部晶振8M和25M晶振的方法
共计修改三个参数: 1.HSE_VALUE 具体位置在stm32f4xx.h中 2.PLL_M 具体位置在system_stm32f4xx.c中 3.Keil编译器 工程的Opt ...