EAC3 mantissa quantization(VQ & GAQ)

EAC3基于hebap来决定mantissa的quantizer. hebap如下：

mantissa 使用VQ(vector quantization) 和GAQ(gain adaptive quantization)进行编码。

1）VQ

对于AHT process, 每个block中的第k个spectral bin的mantissa组合在一起(共6个mantissa)形成一个6维的vector.

如果使用AHT，并且bit allocation pointer在1~7之间，就使用VQ来编码mantissa.

如果一组mantissa（共6个mantissa）使用VQ的话，在bitstream中存在一个N bit的index,用来查找一个6维的vector table,在vector table中的每个value是16 bit有符号的数。

如hebap为1时，N等于2。

在encoder端选择最优的vector，使得vector与实际的mantissa vector的Euclidean distance最小。那么在encoder端只需要transmit 最优vector的index.

在decoder端读出bitstream中的index,使用vector table中index对用的vector来作为mantissa.

2)GAQ

GAQ使用variable-length codewords来quantize mantissa.

在encoder端，在一个DCT block内的一个或多个经常出现的smaller transform coefficient mantissa条件性的进行gain amplify，并使用较短的codewords来描述这样的smaller mantissa.

larger transform coefficient mantissa则不进行gain amplify.由于larger mantissa在audio signal中不是经常出现，所以使用较长的codewords来描述。

在encoder选择gain，每6个GAQ coded DCT block，gain和mantissa codeword作为side info来transmit.

在decoder端首先unpack gain，并用gain来reconstruct 每个单独的transform coefficient mantissa.在decoder，对smaller mantissa乘以一个attenuation factor, gain factor并不作用于larger mantissa.

GAQ dequantization 如下图：

Deformatter 使用hebap来决定当前（第k个）DCT block中的6个mantissa是否使用GAQ编码。

Deformatter对gaqgain处理产生一个gain attenuation element, 每个gain attenuation element对应每个DCT mantissa block。

Bitstream中使用一个unique identifier tag来表示是否是larger mantissa.

如果某个channel使用AHT，那么在bitstream中的每个frame包含一个2 bit的参数gaqmod。

如果gaqmod = 0, GAQ没有使用，并且在bitstream中没有gain。

如果gaqmod =1、2,使用1bit来标识gain value.gain value作用于每个DCT block.

如果gaqmod =3, 使用5bit来group 3个gain value.grpgain表示5 bit group value, M1,M2,M3表示gain的map value.

M1 = truncate (grpgain / 9)
M2 = truncate ((grpgain % 9) / 3)
M3 = (grpgain % 9) % 3

如果gain为1，或者没有gain value，那么没有标识large mantissa的tag，只是一个quantizer.

如果gain为2 or 4,那么decoder根据Table E3.5解码large 和small mantissa.large & small mantissa是2进制补码表示的有符号浮点型数据。

m表示mantissa 的bit数，从hebap中得到。

由于large mantissa使用dead-zone quantizer, 需要将large mantissa codeword remap成mantissa.

remap的公式为：y = x + ax + b（x表示mantissa codeword）

EAC3 mantissa quantization(VQ & GAQ)的更多相关文章

AC3 mantissa quantization and decoding
1.overview 所有的mantissa被quantize到固定精确度的level(有相应的bap标识)上,level小于等于15时,使用symmetric quantization.level大 ...
machine learning学习笔记
看到Max Welling教授主页上有不少学习notes,收藏一下吧,其最近出版了一本书呢还,还没看过. http://www.ics.uci.edu/~welling/classnotes/clas ...
Approximate Nearest Neighbors.接近最近邻搜索
(一):次优最近邻:http://en.wikipedia.org/wiki/Nearest_neighbor_search 有少量修改:如有疑问,请看链接原文.....1.Survey:Neares ...
RGB-D action recognition using linear coding
First, a depth spatial-temporal descriptor is developed to extract the interested local regions in d ...
Text Prompted Remote Speaker Authentication : Joint Speech and Speaker Recognition/Verification System :: Major Project ::: Introduction
转载自:http://ganeshtiwaridotcomdotnp.blogspot.com/2010/12/text-prompted-remote-speaker.html Biometrics ...
Speech Recognition Java Code - HMM VQ MFCC ( Hidden markov model, Vector Quantization and Mel Filter Cepstral Coefficient)
Hi everyone,I have shared speech recognition code inhttps://github.com/gtiwari333/speech-recognition ...
语音信号处理之（三）矢量量化（Vector Quantization）
语音信号处理之(三)矢量量化(Vector Quantization) zouxy09@qq.com http://blog.csdn.net/zouxy09 这学期有<语音信号处理>这门 ...
矢量量化（VQ）
作者:桂. 时间:2017-05-31 21:14:56 链接:http://www.cnblogs.com/xingshansi/p/6925955.html 前言 VQ(Vector Quant ...
漫谈 Clustering (番外篇): Vector Quantization
在接下去说其他的聚类算法之前,让我们先插进来说一说一个有点跑题的东西:Vector Quantization.这项技术广泛地用在信号处理以及数据压缩等领域.事实上,在 JPEG 和 MPEG-4 等多 ...

随机推荐

H5-当你想在出现遮罩的时候，锁住用户的滚动行为，你可以这么做。
<div class="mask"> <div class="content">我是弹框</div> </div> ...
ArcScene 创建三维模型数据
1. 拉伸添加面元素图层在图层上右键----属性 , 设置拉伸值,可以输入固定值或者选择字段值. 2. 导入 3DMAX 的 3ds 文件,和 Google SketchUp 的skp文件, ...
C# 一次循环获取树的两种方法
第一种方法好些第二种方法如果中间断开就会成为一级 private static List<Menu> MenuTree() { , ParentId = , Name = "a ...
ECMAScript基本语法——⑤运算符 void
void阻止返回值的运算符,没有返回值
git 命令总结
1.添加所有文件 git add . 2.添加某个文件 git add filename 3.commit 注释 git commit -m'commit 注释' 4.修改commit 注释 git ...
MySQL启动失败故障思路
1.1 查看日志默认路径在数据路径下,以当前主机名加上.err命名如主机名为tz,数据路径为/mnt/mysql_data目录下日志文件为tz.err [root@tz mysql_data] ...
静态区间第k小 - 整体二分
蒟蒻终于学会整体二分啦! 思路实现丑陋无比的代码 #include <bits/stdc++.h> using namespace std; const int N = 200005; ...
vscode设置成中文
打开 VS Code Ctrl + Shift +p打开搜索框搜索框内输入Configure Display Language 回车修改代码中“locale”后面引号内内容为zh-CH 重新启动V ...
(转)预估大数据量下UV的方法
在实际应用中,我们经常碰到这种情况,即要统计某个对象或者事件独立出现的次数.对于较小的数据量,这很容易解决,我们可以首先在内存中对序列进行排序,然后扫描有序序列统计独立元素数目.其中排序时间复杂度为O ...
后端——框架——缓存框架——memcached——《Memcached教程》阅读笔记
Memcached的知识点大致可以分为三个部分. 服务器部分:环境搭建. 概念:存储的数据类型,指令,内存的替换策略. 集成:与Java语言的集成. 1.搭建环境 1.1 Linux环境在Linux ...

EAC3 mantissa quantization(VQ & GAQ)

EAC3 mantissa quantization(VQ & GAQ)的更多相关文章

随机推荐

热门专题