最近在研究一些信号分析的事情,感兴趣如何将频谱信号反变换成时域信号。fft 与ifft可以顺畅的转变,但是这个是一帧信号,当时间较长的信号再一起是,通过反变换变成一帧一帧的时域信号,如何把他们拼接起来非常感兴趣,以后会做一些尝试,这里先留个档案。

1.将声音转化为声谱图(Spectrogram)

通过短时傅里叶变换。

2.将声谱图转换为声音

1. 通过ifft将一帧一帧的FFT信号(即1维的FFT信号数组X(F)(i)[ i=0 to length( X(f) ) ])变换成一小段一小段的时域信号,再将他们拼接起来。(加窗和overlap是否带来影响及相位是否丢失?)

下面打算通过labview或matlab去实现。(本来想查阅了相关资料借鉴一下,没有找到相关的资料,所以打算自己去尝试下下面的处理,如果有知道的还请告诉我相关的资料或方法,借鉴一下,谢谢)

第一步是找一个语音信号,将其转换为STFT的Spectrogram,

第二步是将他还原回去一帧一帧的声学信号,并拼接成语音信号,看语音信号是否能1. 语音是否能还原,2平滑过渡,3相位是否会丢失。(2019-12-15,完成后再来更新)

2019-12-05 当天使用Labview 尝试了一下。今天公司圣诞放假,有空更新一下 (2019-12-25)

1.找了windows里一段语音 alarm.wav 时域信号如下

图1. 音频时域图

通过labview 中的STFT 函数进行频谱分析。

图2. STFT 函数图

其中关于STFT函数

 

Labview 中STFT分几个步骤

1. K points 由 frquency bins 决定。即每次截取K个点,此例中8192个点。决定了FFT后的截止频率为1/2* frequency bins;

2. 加窗函数,类型 Type 这里使用汉宁窗,length 决定了数据点在长度范围外为0值

3. time step 决定了数据块往前进的速度,他与加窗length,共同决定了数据块中overlap的值

得到图3 STFT 声谱图,实际是一个2维数组。

图3. STFT 声谱图

尝试将这个2D数组还原成时域音频信号,看是否能够高保真还原。

将这个2D数组(i*j大小)的FFT数据依次取出,进行i-fft(FFT 逆变换),得到FFT前的时域信号(此时是时域信号加过窗的数据。)。将这些数据再依次拼接出来,回放声音,发现不对。原来是这些数据1. 加过窗了,2,有重复冗余(OVERLAP的原因),

应该每次从逆变换的时域信号中只取time step个数的数据点,怎么取?假设i-fft后的数据长度为N,则从第( 1/2*N取整 - 1/2* ( time step length)) 开始,取time step个数。

将j个时域信号的segment依次拼接起来,得到从光谱图转化到的时域信号。从实验的结果来看,这个转化来的时域信号与原始信号相比,还是能听出来的,只是有一些失真,我的分析是由于加窗带来的,因为i-fft后得到的是原始信号*窗函数的信号,这里我并没有将原始信号还原出来,主要是我尝试了下,除以窗函数,并没有效,所以还有待研究。

图4. 声谱图通过i-fft还原的声信号(能听出来原始信号的内容,但略失真,失真程度受频谱图分析的 window length, time step ,frequency bins影响 )。

图4. 将i-fft还原的声信号再次做STFT得到的声谱图。

下面会继续研究,去除加窗函数的影响。

2020-01-01 更新

弄明白了一件事,就是短时傅里叶时, 生成的spectrogram 是X^2的信号,也就是说是复数的平方,丢失了相位信息,所以在上面做STFT逆变换时会有些失真(相位信息不对)。

如果使用STFT时,生成的colormap 是coef 矩阵(复实数)时,可以反变换成时域信号而不失真。

感觉利用这个性质,可以做一些阈值滤波与信号增强。后续进行研究。

如何将声学的spectrogram(声谱图)重新反变换成时域语音信号的更多相关文章

  1. 论文笔记:语音情感识别(二)声谱图+CRNN

    一:An Attention Pooling based Representation Learning Method for Speech Emotion Recognition(2018 Inte ...

  2. 论文笔记:语音情感识别(四)语音特征之声谱图,log梅尔谱,MFCC,deltas

    一:原始信号 从音频文件中读取出来的原始语音信号通常称为raw waveform,是一个一维数组,长度是由音频长度和采样率决定,比如采样率Fs为16KHz,表示一秒钟内采样16000个点,这个时候如果 ...

  3. MATLAB中绘制质点轨迹动图并保存成GIF

    工作需要在MATLAB中绘制质点轨迹并保存成GIF以便展示. 绘制质点轨迹动图可用comet和comet3命令,使用例子如下: t = 0:.01:2*pi;x = cos(2*t).*(cos(t) ...

  4. PaintCode 教程:矢量图轻松转换成CoreGraphics代码

    本文译自Ranwenderlich的这篇:http://www.raywenderlich.com/100281/paintcode-for-designers-getting-started Pai ...

  5. 语音频谱语音信号处理之(四)梅尔频率倒谱系数(MFCC)

    今天一直在查找语音频谱之类的问题,今天正好有机会和大家共享一下. 语音信号处置之(四)梅尔频率倒谱系数(MFCC) zouxy09@qq.com http://blog.csdn.net/zouxy0 ...

  6. 音频自动增益 与 静音检测 算法 附完整C代码

    前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用于评估一定长度音频的音量强度, 而分析之后,很多类似的需求,肯定是做音频增益,提高音量诸如此类做法. ...

  7. 音频自动增益 与 静音检测 算法 附完整C代码【转】

    转自:https://www.cnblogs.com/cpuimage/p/8908551.html 前面分享过一个算法<音频增益响度分析 ReplayGain 附完整C代码示例> 主要用 ...

  8. 梅尔频率倒谱系数(MFCC) 学习笔记

    最近学习音乐自动标注的过程中,看到了有关使用MFCC提取音频特征的内容,特地在网上找到资料,学习了一下相关内容.此笔记大部分内容摘自博文 http://blog.csdn.net/zouxy09/ar ...

  9. 【VS开发】【智能语音处理】语音信号处理之(四)梅尔频率倒谱系数(MFCC)

    语音信号处理之(四)梅尔频率倒谱系数(MFCC) zouxy09@qq.com http://blog.csdn.net/zouxy09 这学期有<语音信号处理>这门课,快考试了,所以也要 ...

随机推荐

  1. 定要过python二级 第二套

    1.name=random.choice(brandlist)    与第一套中的  random.randint() 2. eval(input())   看到一段代码,判读输入的数字,用的是eva ...

  2. PolarDB PostgreSQL DDL同步原理

    概述 在共享存储一写多读的架构下,数据文件实际上只有一份.得益于多版本机制,不同节点的读写实际上并不会冲突.但是有一些数据操作不具有多版本机制,其中比较有代表性的就是文件操作.多版本机制仅限于文件内的 ...

  3. docker run 参数

    一.格式 docker run [OPTIONS] IMAGE [COMMAND] [ARG...] 二.OPTIONS 参数 简写, 名称参数 默认参数 描述 --add-host 添加自定义主机到 ...

  4. span标签的巧用

    前言: 用struts的标签结合<td>标签将后台数据在表格里渲染了出来,目前需求是需要将两个状态组合在一起显示 解决:通过span标签在td里的套用可以实现 <logic:notE ...

  5. 一个Electron的设计缺陷及应对方案

    当你想实现阻止Electron窗口关闭,并弹出询问对话框,提示用户:"文章尚未保存,是否要关闭窗口"这类业务时,那么你99%会碰到这个BUG: https://github.com ...

  6. ☠全套Java教程_Java基础入门教程,零基础小白自学Java必备教程👾#010 #第十单元 Scanner类、Random类 #

    一.本单元知识点概述 (Ⅰ)知识点概述 二.本单元教学目标 (Ⅰ)重点知识目标 1.API的使用2.Scanner类的使用步骤3.Random类的使用 (Ⅱ)能力目标 1.掌握API的使用步骤2.使用 ...

  7. C++面向行输入:get()与getline()

    面向行的输入:get()与getline() 引入: char a = 's';//这样的语句合法 char b = "s";//不合法 /* "S"不是字符常 ...

  8. caffe运行错误 target_blobs.blobs_size()与 source_layer.blobs_size() 不一致

    解决方法参考:http://blog.csdn.net/zhangla1220/article/details/50697352 感谢博主!!! 最新下载的caffe代码,运行mnist,训练时可以正 ...

  9. js 判断两个对象是否相等

    最近碰到的一个面试题,不算高频,记录一下 判断两个对象是否相等,大致分为三步 首先判断两个比较对象是不是 Object 如果都是对象 再比较 对象的长度是否相等 如果两个对象的长度相等 再比较对象属性 ...

  10. Vue3学习(二)之集成Ant Design Vue

    一.集成Ant Design Vue npm install ant-design-vue@2.0.0-rc.3 --save 兼容性 Ant Design Vue 2.x 支持所有的现代浏览器. 如 ...