Wordnet 与 Hownet 比较】的更多相关文章

近年来,随着计算机本身以及信息高速公路的飞速发展,人们开始更加重视语义的研究.各国都致力于可用于自然语言处理的大规模语义词典或大规模知识库的建设.例如:普林斯顿大学的英语Wordnet,微软的Mindnet,欧洲有基于Wordnet的Eurowordnet,日本的日语和英语的概念词典,韩国的Koreanwordnet,中国有以Wordnet为框架而研制的现代汉语概念词典――中文概念辞书(CCD)和董振东.董强的Hownet(知网). Wordnet是一个在线的英语词汇数据库(词汇参照系统),而H…
http://blog.csdn.net/ictextr9/article/details/4008703 Wordnet是一个词典.每个词语(word)可能有多个不同的语义,对应不同的sense.而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,一个sense中的多个消除了多义性的词语叫做lemma.例如,"publish"是一个word,它可能有多个sense: 次数可以用来判断高频词的权重 1. (39) print, publis…
关于wordnet的介绍很多,中英文都有,我这里主要是参考了别人的.自己组织了一下. 1.简介 1.1关于词典 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它比单纯的辞典或词典都更加易于使用. 2.支持自动的文本分析以及人工智能应用. 在WordNet中,名词,动词,形容词和副词各自被组织成一个同义词的网络,这是传统词典所不具有的,WordNet最具特色之处是根据…
转载请说明出处:http://www.cnblogs.com/KingKou/p/4121373.html 1.简介 Wordnet是一个由普林斯顿大学认识科学实验室在心理学教授乔治·A·米勒的指导下建立和维护的大型的英语词典,WordNet的开发有两个目的: 1.它既是一个字典,又是一个辞典,它比单纯的辞典或词典都更加易于使用. 2.支持自动的文本分析以及人工智能应用. 在WordNet中,名词,动词,形容词和副词各自被组织成一个同义词的网络,每个同义词集合都代表一个基本的语义概念,并且这些集…
环境:python2.7.10 首先安装pip 在https://pip.pypa.io/en/stable/installing/ 下载get-pip.py 然后执行 python get-pip.py 将自动安装pip nltk是python的一个扩展包,提供自然语言处理工具集 安装nltk sudo pip install -U nltk import nltk 然后下载语料库 nltk.download() 弹出窗口如下,按需下载,我选择的是book . 下载完成查看目录: 其中corp…
1.基于知识的表征 如WordNet(图1-1),包含同义词集(synonym sets)和上位词(hypernyms,is a关系). 存在的问题: 作为资源来说是好的,但是它失去了词间的细微差别,比如说"good"和"full"同义是需要在一定的上下文中才能成立的: 易错过词的新义,基本不可能时时保持up-to-date: 是人为分的,所以是主观的结果: 需要花费很多的人力去创建和调整: 很难计算出准确的词间相似度. 2.基于数据库的表征 2.1 词本身 2.1…
转自:http://www.cnblogs.com/kaituorensheng/p/3149095.html   WordNet是面向语义的英语词典,类似于传统字典.它是NLTK语料库的一部分,可以被这样调用: 更简洁的写法: 1.单词 查看一个单词的同义词集用synsets(); 它有一个参数pos,可以指定查找的词性.这里得到的同义词集是同义词集的集合,即里面不是单纯的词,是同义词的集合. 注: 一个synset(同义词集:指意义相同的词条的集合)被一个三元组描述:(单词.词性.序号).这…
源码地址:https://github.com/XBWer/WordSimilarity 1.确定要解决的问题及意义 在基于代码片段的分类过程中,由于程序员对数据变量名的选取可能具有一定的规范性,在某一特定业务处理逻辑代码中,可能多个变量名之间具有关联性或相似性(如“trade”(商品交易)类中,可能存在“business”,“transaction”,“deal”等同义词),在某些情况下,它们以不同的词语表达了相同的含义.因此,为了能够对代码片段做出更加科学的类别判断,更好地识别这些同义词,我…
WordNet,是由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典.它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”.我们这次的任务就是求得词与词之间的最短路径,是对“图”这个数据结构再次灵活运用. 以下为SentiWordNet_3.0.0_20130122.txt文件截图: 应考虑如何存储“单词的网络”,此程序是以词作为基本单元,词与词之间的联系是通过语义. 我们简单地构造类(ListofSeg存储词的语义id): cl…
WordNet是面向语义的英语词典,类似于传统字典.它是NLTK语料库的一部分,可以被这样调用: 更简洁的写法: 1.单词 查看一个单词的同义词集用synsets(); 它有一个参数pos,可以指定查找的词性.这里得到的同义词集是同义词集的集合,即里面不是单纯的词,是同义词的集合. 注: 一个synset(同义词集:指意义相同的词条的集合)被一个三元组描述:(单词.词性.序号).这里的’dog.n.01’指:dog的第一个名词意思;’chase.v.01’指:chase的第一个动词意思 pos可…