第II节简要介绍与本文有关的先前工作
第III节介绍文中使用的定义以及术语

第IV节介绍如何从原始ASR lattices中生成倒排索引结构

第V节详细介绍了ASR结构以及实验使用的数据

第VI节提供了在一个大数据集之上,提出的倒排索引结构

的STD实验评估。

第VII节总结倒排索引结构的优点以及未来展望

 
 

IV 带权自动机的时间因子转换器

本节提出了一种为大数据集语料库构建时间索引的有效算法。在解决了[15]中的非确定性因子转换器相关的问题之后,我们提出了一种因子转换器结构——时间因子转换器

(TFT),弧(arc)的权重存储时间信息。为了便于比较,本文基于[2]进行开发。

 
 

  •  
     

Timed Factor Transducer of Weighted Automata

 
 

factor(因子,substring),子字符串,子串

为大语音数据集构造一种有效的时间系数的算法,提出了一种新的因子转换器结构——基于时间的因子转换器(TFT)。

 
 

问题在于如何创建一个基于时间的索引,可用于被这些自动机接收的任意字符串的任意因子的直接搜索。

 
 

核心想法是,通过带权有限状态转换器T将每个因子进行映射,因子的时间索引可以表示为:

  1. 该因子所属的多个自动机的集合;
  2. 因子在每个自动机中间隔的开始-结束时间;
  3. 在对应时间间隔中实际出现在对应自动机中的后验概率;

 
 

  1. 预处理:对每个输入自动机进行预处理,以获得一个后验Lattice,其中不重叠的弧集被分别标记;
  2. 构建时间因子转换器:对每个处理过的输入自动机中,构造一个能确切识别输入因子集的中间因子转换器;
  3. 因子选择:将这些中间因子转换器转换为确定性转换器,方法是用消歧符号对每个因子进行扩展,然后应用加权自动机优化;
  4. 在时间因子转换器中搜索:对这些确定性转换器进行合并、进一步优化,以获得整个数据集的确定性倒排索引。

以下详述算法的各个阶段

  1. 预处理

    由[2]给出的算法为语句中出现的所有因子生成索引项(一个因子生成一个索引)。这是SUR(话语检索)问题的理想做法。对于STD(话语检测),我们希望为非重叠事件(occurrences)保留单独的索引项,以确保包含查询条件的确切时间间隔。这种分离可以通过对具有相同输入标签和重叠时间跨度的弧进行聚类来实现。

    聚类算法如下。对于每个输入标签:

    1)根据结束时间对收集的二元组(开始时间,结束时间)进行排序;

    2)确定最大的一组不重叠的二元组(开始时间,结束时间)并将它们分配为簇头;

    3)根据最大重叠分类剩余的弧。

    示出了预处理算法对图1的自动机的应用。

     
     

    预处理后:

  2. 构建时间因子转换器

     
     

    1. 因子生成。通常以以下方式对所有因子进行索引:
      1. 将每个弧的权重进行映射:

     
     

     
     

  3. 因子选择

    除了通过对每一个因子进行分析,我们可以利用WFST形式的因子选择滤波来限制、转化或减少索引数。[2]介绍了应用于算法各个阶段的各种滤波器。每个滤波器都由算法过程中获得的一些自动机组成,以实现特定的滤波操作。一种这样的过滤器是将单词映射到音素序列的发音词典。 这个过滤器应用于词级lattice来获得音素级lattice。在我们的例子中,应用这样的过滤器可以保证相应的状态更新。另一个例子是限制因子数的简单语法。在因子生成步骤之后应用该过滤器,并删除语法不接受的因子。我们利用这种语法来拒绝静音符号,即,包括静音符号的因子未被索引。

  4. 在TFT(时间因子转换器)中进行搜索

    用户查询通常是一个未加权的字符串,但它也可以是一个随机的自动加权自动机X,或者是可编译为自动机的布尔查询或者正则表达式的字符串。通过以下步骤得到对查询X的响应R的另一个自动机:

  • 在输入端[22]对X与Y进行合成,并将得到的转换器投影到其输出标签上;
  1. 将因子转换器与修改的因子转换器进行对比

    为了便于比较,图5(b)和(c)给出了从图1中的自动机中获得的FT [2]和MFT [15]。结构性来说,FT与TFFT十分类似。区别在于,FT没有储存任何时间信息。另一方面,MFT与FT或TFT相比,差异较大。TFT信息编码与输出标签 即非最终弧上的每个输出标签都表示一个时间间隔。 在第二节中,我们指出了与这两种结构有关的问题。 所提出的方法通过索引定时信息并为非重叠因子保留单独的条目 - 而不是用于FTFT的外部转换,从而缓解了FT的问题。另一方面,通过将定时信息嵌入到权重中来解决MFT的问题。除去群集中的消息之后,最终的TFT可以是 除了最后的过渡之外,它是完全确定的。 另外请注意,我们不再有量化问题,这是量化标签时间的产品。

论文翻译——Lattice indexing for spoken term detection的更多相关文章

  1. 深度学习论文翻译解析(四):Faster R-CNN: Down the rabbit hole of modern object detection

    论文标题:Faster R-CNN: Down the rabbit hole of modern object detection 论文作者:Zhi Tian , Weilin Huang, Ton ...

  2. 深度学习论文翻译解析(七):Support Vector Method for Novelty Detection

    论文标题:Support Vector Method for Novelty Detection 论文作者:Bernhard Scholkopf, Robert Williamson, Alex Sm ...

  3. 深度学习论文翻译解析(八):Rich feature hierarchies for accurate object detection and semantic segmentation

    论文标题:Rich feature hierarchies for accurate object detection and semantic segmentation 标题翻译:丰富的特征层次结构 ...

  4. 深度学习论文翻译解析(十一):OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks

    论文标题:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 标题翻译: ...

  5. 深度学习论文翻译解析(十三):Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

    论文标题:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 标题翻译:基于区域提议(Regi ...

  6. [原创]Faster R-CNN论文翻译

    Faster R-CNN论文翻译   Faster R-CNN是互怼完了的好基友一起合作出来的巅峰之作,本文翻译的比例比较小,主要因为本paper是前述paper的一个简单改进,方法清晰,想法自然.什 ...

  7. R-CNN论文翻译

    R-CNN论文翻译 Rich feature hierarchies for accurate object detection and semantic segmentation 用于精确物体定位和 ...

  8. SSD: Single Shot MultiBoxDetector英文论文翻译

    SSD英文论文翻译 SSD: Single Shot MultiBoxDetector 2017.12.08    摘要:我们提出了一种使用单个深层神经网络检测图像中对象的方法.我们的方法,名为SSD ...

  9. R-FCN论文翻译

    R-FCN论文翻译 R-FCN: Object Detection viaRegion-based Fully Convolutional Networks 2018.2.6   论文地址:R-FCN ...

随机推荐

  1. CentOS 安装 ceph 单机版(luminous版本)

    一.环境准备 CentOS Linux release 7.4.1708 (Core)一台,4块磁盘(sda.sdb,.sdc.sdd) 192.168.27.130 nceph 二.配置环境 1.修 ...

  2. SQL AVG 函数

    定义和用法 AVG 函数返回数值列的平均值.NULL 值不包括在计算中. SQL AVG() 语法 SELECT AVG(column_name) FROM table_name SQL AVG() ...

  3. Synchronized的基本知识、实现原理以及其与ReentrantLock的区别

    一.synchronized知识 在谈论synchronized之前,我们需要了解线程安全问题的主要诱因.线程安全问题的主要诱因如下: 存在共享数据(也称为临界资源) 存在多条线程共同操作这些共享数据 ...

  4. Var的用法解析

    C#关键字是伴随着.NET 3.5以后,伴随着匿名函数.LINQ而来, 由编译器帮我们推断具体的类型.总体来说,当一个变量是局部变量(不包括类级别的变量),并且在声明的时候初始化,是使用var关键字的 ...

  5. Day9 轨道角动量

    转自中山大学电子与信息工程 http://seit.sysu.edu.cn/node/1004 能量.动量(角动量和线动量)光子的基本属性,其中光子角动量包括自旋角动量和轨道角动量(Orbital a ...

  6. Spring Boot与分布式

    ---恢复内容开始--- 分布式.Dubbo/Zookeeper.Spring Boot/Cloud 一.分布式应用 在分布式系统中,国内常用zookeeper+dubbo组合, 而Spring Bo ...

  7. 编译安装MySQL5.6失败的相关问题解决方案

    Q0:需要安装git 解决方案: #CentOS yum install git #ubuntu apt-get install git Q1:CMAKE_CXX_COMPILER could be ...

  8. pytorch识别CIFAR10:训练ResNet-34(准确率80%)

    版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com CNN的层数越多,能够提取到的特征越丰富,但是简单地增加卷积层数,训练时会导致梯度弥散或梯度爆炸. 何 ...

  9. 一入OI深似海 2 —— 初中三年,颓废PJ

    初中,OI似乎没有真正进入我的生活. 三年PJ在我的生活中占比很少. 每天都是平淡无奇的文化课,晚上在写完作业之后还能休息一会儿. 每周六下午的OI课很短暂, 大部分时间我还是把我的重心放在学习上. ...

  10. 【zabbix教程系列】五、邮件报警设置(脚本方式)

    本方式是使用外部邮箱账号发送报警邮件到指定邮箱. 好处是:此邮箱账号既能发送邮件,也能接收邮件,而且避免被当做垃圾邮件. 一.zabbix-server端安装mailx服务 [root@ltt01 ~ ...