WordNet::Similarity的安装和使用
简介
WordNet::Similarity是一个Perl实现的软件包,可以用来计算两个概念(或者word sense)之间的语义相似度,它提供了六种计算相似度和三种计算概念之间关联度的方法,所有的这些方法都是基于WordNet这个词汇数据库。
依附
- WordNet
- Digest-SHA1
- WordNet::QueryData
- Text-Similarity
下载位置
安装
WordNet
1. sudo apt-get install tcl8.4-dev
sudo apt-get install tk8.4-dev
2. ./configure
3. sudo make
如果出现问题:checking for gawk... no
解决:sudo apt-get install gawk
4. sudo make install
5. 设置变量
sudo vim /etc/profile
添加:export PATH=$PATH:/usr/local/Wordnet-3.0/bin
退出编译:source /etc/profile
Digest-SHA1
进入相应目录cd path
依次运行如下命令
perl Makefile.PL
make
make test
sudo make install
其他
WordNet::QueryData,Text-Similarity,WordNet::Similarity的安装与Digest-SHA1完全一样
使用
$ similarity.pl --type WordNet::Similarity::lin car#n#2 bus#n#1
car#n#2 bus#n#1 0.530371390319309 # railway car versus motor coach
$similarity.pl --type WordNet::Similarity::lin car#n bus#n
car#n#1 bus#n#1 0.603649218135011 #返回相似值最高的匹配对
$similarity.pl --type WordNet::Similarity::lin --allsensescar#n bus#n
car#n bus#n (all senses)
car#n#1 bus#n#1 0.603649218135011
car#n#2 bus#n#1 0.533827219913664
car#n#1 bus#n#4 0
car#n#3 bus#n#3 0
car#n#4 bus#n#1 0
car#n#2 bus#n#4 0
car#n#5 bus#n#1 0
car#n#5 bus#n#4 0
car#n#3 bus#n#4 0
car#n#4 bus#n#2 0
car#n#5 bus#n#3 0
car#n#3 bus#n#2 0
car#n#4 bus#n#4 0
car#n#2 bus#n#2 0
car#n#5 bus#n#2 0
car#n#1 bus#n#3 0
car#n#3 bus#n#1 0
car#n#2 bus#n#3 0
car#n#1 bus#n#2 0
car#n#4 bus#n#3 0 #加上参数—allsenses 返回所有的匹配
脚本
#/usr/bin/perl -w
use WordNet::QueryData;
use WordNet::Similarity::lin; $wnObj = new WordNet::QueryData;
$linObj = new WordNet::Similarity::lin($wnObj);
$value = $linObj -> getRelatedness('car#n#1', 'bus#n#1');
print $value
依靠路径长度的:lch, wup, path
依靠路径长度和最小公共包含(LCS):res, lin, jcn
相似度和关联度的介绍可以参考翻译论文:http://hi.baidu.com/dailyye/item/a2c7fb61ae6ae22769105b18
CPAN地址:http://search.cpan.org/dist/WordNet-Similarity/utils/similarity.pl
WordNet::Similarity的安装和使用的更多相关文章
- 基于WordNet的英文同义词、近义词相似度评估及代码实现
源码地址:https://github.com/XBWer/WordSimilarity 1.确定要解决的问题及意义 在基于代码片段的分类过程中,由于程序员对数据变量名的选取可能具有一定的规范性,在某 ...
- nltk安装及wordnet使用详解
环境:python2.7.10 首先安装pip 在https://pip.pypa.io/en/stable/installing/ 下载get-pip.py 然后执行 python get-pip. ...
- 自然语言处理--nltk安装及wordnet使用详解
环境:python2.7.10 首先安装pip 在https://pip.pypa.io/en/stable/installing/ 下载get-pip.py 然后执行 python get-pip. ...
- 自然语言20.1 WordNet介绍和使用 _
http://blog.csdn.net/ictextr9/article/details/4008703 Wordnet是一个词典.每个词语(word)可能有多个不同的语义,对应不同的sense.而 ...
- Elasticsearch中的相似度模型(原文:Similarity in Elasticsearch)
原文链接:https://www.elastic.co/blog/found-similarity-in-elasticsearch 原文 By Konrad Beiske 翻译 By 高家宝 译者按 ...
- Centos 7.3 编译 & 安装 & 测试 facebook faiss
许多 AI 系统训练完毕,正式上线时的基本操作往往可以抽象为:在高维向量空间中,给定一个向量,寻找与之最相近的 k 个向量.当向量数目异常巨大时,如何快速地执行这一基本操作,便成为 AI 系统在工程应 ...
- BinDiff安装使用教程
一.说明 大概一两年前在<漏洞战争:软件漏洞分析精要>听到bindiff(和补丁比较法),但一直都没去使用.前两天再回头看书感觉需要使用一翻,整个过程下来还是遇到了一些问题,值得记录一番. ...
- NLTK之WordNet 接口【转】
转自:http://www.cnblogs.com/kaituorensheng/p/3149095.html WordNet是面向语义的英语词典,类似于传统字典.它是NLTK语料库的一部分,可以 ...
- NLTK之WordNet 接口
WordNet是面向语义的英语词典,类似于传统字典.它是NLTK语料库的一部分,可以被这样调用: 更简洁的写法: 1.单词 查看一个单词的同义词集用synsets(); 它有一个参数pos,可以指定查 ...
随机推荐
- ajaxfileupload插件上传图片功能,用MVC和aspx做后台各写了一个案例
HTML代码 和js 代码 @{ Layout = null; } <!DOCTYPE html> <html> <head> <meta name=&quo ...
- WPF成长之路------翻转动画
先介绍一下RenderTransform类,该类成员如下: TranslateTransform:能够让某对象的位置发生平移变化. RotateTransform:能够让某对象产生旋转变化,根据中心点 ...
- Impala源码之资源管理与资源隔离
本文由 网易云发布. 前言 Impala是一个MPP架构的查询系统,为了做到平台化服务,首先需要考虑就是如何做到资源隔离,多个产品之间尽可能小的甚至毫无影响.对于这种需求,最好的隔离方案无疑是物理机 ...
- 索引+sql优化
索引的概念: 索引是提高查询速度的一种手段.索引有很多种,以下是索引树的结构 要求查询出薪资大于5000的雇员信息,只要在树中找到5000的节点,直接查询该节点右边的数据即可,左边就不用管了,这样提高 ...
- yum 下载RPM包而不进行安装
yum命令本身就可以用来下载一个RPM包,标准的yum命令提供了--downloadonly(只下载)的选项来达到这个目的. $ sudo yum install --downloadonly < ...
- python中的内置函数(一), lambda, filter, map
https://www.processon.com/view/link/5c10da0ce4b099ae3e137bf6 1.内置函数 内置函数就是python中提供的,可以直接拿来用的函数,比如pr ...
- centos7安装nginx(自定义安装文件夹)
一.安装所需要的依赖软件 1.gcc:nginx编译依赖gcc环境 #yum install gcc-c++ 2.pcre:(Perl Compatible Regular Expressions)是 ...
- Comet OJ - Contest #0题解
传送门 菜爆了--总共只有一道题会做的--而且也没有短裙好难过 为啥必须得有手机才能注册账号啊喂--歧视么-- \(A\) 解方程 推一下柿子大概就是 \[x-\sqrt{n}=y+z+2\sqrt{ ...
- Kali Linux安全渗透-从入门到精通
Kali-Linux是基于Debian Linux发行版 针对高级渗透测试和安全审计系统.带你一起从入门到精通. 什么是Kali-Linux? kali 包含几百个软件用来执行各种信息安全的任务,如渗 ...
- linuxea:ELK5.5-elasticsearch-x-pack破解
本站采用知识共享署名-非商业性使用-相同方式共享国际许可协议4.0 进行许可 本文作者:www.linuxea.com for Mark 文章链接:https://www.linuxea.com/17 ...