来源网页:http://nlp.nju.edu.cn/tanggc/tools/DependencyViewer.html 视频演示网页:http://nlp.nju.edu.cn/tanggc/tools/DependencyViewer_demo.html 可视化效果效果如下: . 1.数据格式如下: 1 赵宁 赵宁 NR NR _ 4 d-genetive _ _ 2 的 的 DEG DEG _ 1 aux-depend _ _ 3 哀乐 哀乐 NN NN _ 4 d-attribute…
依存分析 Dependency Parsing 句子成分依存分析主要分为两种:句法级别的和语义级别的 依存句法分析 syntactic dependency parsing 语义依存分词 semantic dependency parsing 依存分析有两种类别的方法,基于转移的(transition-based)和基于图的(graph-based). Stanford NLP依存分析器训练 斯坦福nlp工具(Stanford CoreNLP)提供了依存(句法)分析功能,同时允许训练自己的依存分…
 国内外自然语言处理(NLP)研究组 *博客地址 http://blog.csdn.net/wangxinginnlp/article/details/44890553 *排名不分先后.收集不全,欢迎留言完善. 中国大陆地区: 微软亚洲研究院自然语言计算组 Natural Language Computing (NLC) Group https://www.microsoft.com/en-us/research/group/natural-language-computing/ 清华大学自然语…
工业界 腾讯人工智能实验室(Tencent AI Lab) 百度自然语言处理(Baidu NLP):对外提供了百度AI开放平台,王海峰(现任百度副总裁,AI技术平台体系AIG总负责人) 微软亚洲研究院自然语言计算组(Natural Language Computing - Microsoft Research).在NLP方向与哈工大.清华有联合实验室 科大讯飞(与哈工大的语言认知计算联合实验室) 搜狗实验室(Sogou Labs) 头条人工智能实验室(Toutiao AI Lab) 华为诺亚方舟…
https://web.stanford.edu/~jurafsky/slp3/13.pdf constituent-based 基于成分的phrasal constituents and phrase-structure rules短语成分与短语结构规则directed 有向的morphologically 形态学location adverbial 位置状语predicates 谓语coreference resolution 共指消解Nominal subject名词性主语Appositi…
可视化(visualization)是利用计算机图形学和图像处理技术,将数据转换图像在屏幕上显示出来,并进行交互处理的的理论,方法和技术, pcl_visualization库建立了能够快速建立原型的目的和可视化算法对三维点云数据操作的结果.类似于opencv的highgui例程显示二维图像,在屏幕上绘制基本的二维图形,库提供了以下几点: (1)渲染和设置视觉特性的方法(如颜色.大小.透明度等)在PCL任意n维的点云数据集pcl::PointCloud<T> format (2)在屏幕上绘制基…
​自然语言处理(NLP)是人工智能领域一个十分重要的研究方向.NLP研究的是实现人与计算机之间用自然语言进行有效沟通的各种理论与方法. 本文整理了NLP领域常用的16个术语,希望可以帮助大家更好地理解这门学科. 1.自然语言处理(NLP) 自然语言处理,简单来说就是构建人与机器之间沟通的桥梁,以实现人机交流的目的. 自然语言处理有两大核心任务:自然语言理解(NLU)与自然语言生成(NLG). 2.Attention 机制 Attention的本质是从关注全部到关注重点.将有限的注意力集中在重点信…
统计学和语言学专家都列在一起了,没有区分.1,黄昌宁,1937年生于广东,1955年考入清华大学电机系,1961年毕业并留校任教至博士生导师, 1983-1984年赴美国耶鲁大学进修,1986-1987年曾在香港理工大学任教,1999年4月加入微软中国研究院任主任研究员.中国计算机自然语言处理领域的”趟路人”和集大成者.2,孙茂松,清华大学计算机科学与技术系系主任,教授,博士生导师.研究方向为自然语言理解.中文信息处理和Web智能.中国中文信息学会副理事长.3,詹卫东,男 ,汉族.籍贯浙江衢州,…
中科院nlpir和海量分词(http://www.hylanda.com/)是收费的. hanlp:推荐基于CRF的模型的实现~~要看语料,很多常用词会被分错,所以需要词库支撑.目前最友好的开源工具包应该是HanLP,基于词典,对各种实体词汇做了HMM,也提供了CRF模型.工程实现也不错,性能不是瓶颈.代码有相对完备的注释,文档也比较全,各种算法原理实现也有对应blog,自己研究和做二次开发都比较方便. 最近写了一款分词器,调研了不少文章的开源实现.最终定的方案是 Language Model…
持续集成环境(Hudson)搭建 这是在公司写的,公司要求用英文,我也没时间翻译了.还请见谅! Hudson是个非常强大持续集成工具,配合svn,maven,sonar,redmine工具就更加完美了.大家要了解Hudson的介绍可以看这篇文章,我在这里就不详细介绍了.此外额外说下,由于Hudson被oracle收购后以前开发Hudson团队转移到了jekins.大家有兴趣可以google下.   Build Hudson Continuous Integration Environment G…