1.提出了一种基于特征函数和反向转录文法(ITG)的无监督词对齐模型,使用对数线性模型对文法规则的概率建模,先验知识可以通过特征函数的形式加入到模型里面,而模型仍然可以进行无监督训练.2. 在模型的参数训练方面,本文在模型的优化目标上增加了一个L1正则化因子,使得模型能学到一个稀疏的解,把文法规则概率集中到了对词对齐有用的文法规则上面,提高了词对齐的质量.3. 开发了一个基于ITG的无监督词对齐软件工具,实现了传统的ITG无监督词对齐模型和基于特征函数的ITG无监督词对齐模型. 本文在词对齐和机…
论文名和编号 摘要/引言 相关背景和工作 论文方法/模型 实验(数据集)及 分析(一些具体数据) 未来工作/不足 是否有源码 问题 原因 解决思路 优势 基于表示学习的中文分词 编号:1001-9081(2016)10-2794-05 1.为提高中文分词的准确率和未登录词识别率. 1.分词后计算机才能得知中文词语的确切边界,进而理解文本中所包含的语义信息.中文分词是中文自然语言处理的一项基础性工作,是中文信息处理技术发展的技术瓶颈. 1.使用skip-gram模型将文本中的词映射为高维向量空间中…
翻译 Improved Word Representation Learning with Sememes 题目 Improved Word Representation Learning with Sememes 融合义原知识的词汇表示学习 摘要 Abstract Sememes are minimum semantic units of word meanings, and the meaning of each word sense is typically composed by sev…
网上有一些基础的东西,但是比如插入图片,就没有找到方案,最终自己摸索出来的. 1.首先通过Nuget获取引用,关键字:“DocX” 2.示例代码 class Program { static void Main(string[] args) { string path = @"C:\Users\Administrator\Desktop\test.docx"; using (var document = DocX.Create(path)) { //文字居中对齐 document.In…
Dynamic Pooling and Unfolding Recursive Autoencoders for Paraphrase Detection 动态池和展开递归自动编码器的意译检测 论文地址 Richard Socher,Eric H. Huang, Jeffrey Pennington∗ , Andrew Y. Ng, Christopher D. Manning Computer Science Department, Stanford University, Stanford,…
A Summary of Multi-task Learning author by Yubo Feng. Intro In this paper[0], the introduction of multi-task learning through the data hungry, the most common problem of Deep Learning[1]. Basic assumption: tasks are related. MTL mimic human learning…
Page 1Published as a conference paper at ICLR 2017AS IMPLE BUT T OUGH - TO -B EAT B ASELINE FOR S EN -TENCE E MBEDDINGSSanjeev Arora, Yingyu Liang, Tengyu MaPrinceton University{arora,yingyul,tengyu}@cs.princeton.eduA BSTRACTThe success of neural net…
软件需求: 首先你必须要有Moses(废话哈哈).然后要有GIZA++用作词对齐(traning-model.perl的时候会用到).IRSTLM产生语言模型 大致步骤: 大体的步骤如下: 准备Parallerl data(需要句子对齐):对语料进行tokenisation.truecasing和cleaning步骤之后才能使用于我们的机器翻译系统(哈哈,都快忍不住直接写详细步骤了) 训练你的语言模型(使用IRSTLM):当然也有几步,详细叙述再说 然后就是训练你的翻译系统啦(可能要花一两个小时…
Recommender Systems with Deep Learning Improving Scalability of Personalized Recommendation Systems for Enterprise Knowledge Workers – Authors: C Verma, M Hart, S Bhatkar, A Parker (2016) Multi-modal learning for video recommendation based on mobile…
Spark工作机制以及API详解 本篇文章将会承接上篇关于如何部署Spark分布式集群的博客,会先对RDD编程中常见的API进行一个整理,接着再结合源代码以及注释详细地解读spark的作业提交流程,调度机制以及shuffle的过程,废话不多说,我们直接开始吧! 1. Spark基本API解读 首先我们写一段简单的进行单词统计的代码,考察其中出现的API,然后做出整理: import org.apache.spark.SparkConf; import org.apache.spark.api.j…