中文自然语言处理工具HanLP源码包的下载使用记录 这篇文章主要分享的是hanlp自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通.Hanlp安装包的下载以及安装其实之前就已经有过分享了.本篇文章主要还是备忘之用,同时算是给新手朋友的一些参考吧! 不过在此之前先推荐两本书给想要学习中文自然语言处理的朋友,分别是<NLP汉语自然语言处理原理与实战>,里面介绍了汉语自然语言处理的相关技术,还有一些源码的解读:另一本是<python自然语言处理>. 下面就进入到本…
词图 词图指的是句子中所有词可能构成的图.如果一个词A的下一个词可能是B的话,那么A和B之间具有一条路径E(A,B).一个词可能有多个后续,同时也可能有多个前驱,它们构成的图我称作词图. 需要稀疏2维矩阵模型,以一个词的起始位置作为行,终止位置作为列,可以得到一个二维矩阵.例如:“他说的确实在理”这句话 图词的存储方法:一种是的DynamicArray法,一种是快速offset法.Hanlp代码中采用的是第二种方法. 1.DynamicArray(二维数组)法 在词图中,行和列的关系:col为n…
目录 yum工具及源码包 yum yum源 yum实战案例 yum全局配置文件 制作本地yum仓库 构建企业级yum仓库 源码包 yum工具及源码包 yum yum是RedHat以及CentOS中的软件包管理器,能够通过互联网下载以rpm结尾的包,并且安装,并可以自动处理依赖性关系,无需繁琐的一次次下载安装. yum源 要成功的使用yum工具安装更新软件或系统,就需要有一个包含各种rpm软件包的repository(软件仓库),这个软件仓库我们习惯称之为yum源或者yum 仓库这个源可以是本地的…
目录 linux 软件管理--yum工具及源码包 一.yum基本概述 二.yum源的配置 三.yum实践案例 四.yum全局配置文件 五.yum签名检查机制 五.制作本地yum仓库 六.构建企业级yum仓库 七.源码包概述 linux 软件管理--yum工具及源码包 一.yum基本概述 1.什么是yum? yum是RedHat以及CentOS中的软件包管理器,能够通过互联网下载以rpm结尾的包,并且安装,并可以自动处理依赖性关系,无需繁琐的一次次下载安装. 1.联网获取软件 2.基于RPM管理…
本文旨在介绍如何利用HanLP训练分词模型,包括语料格式.语料预处理.训练接口.输出格式等. 目前HanLP内置的训练接口是针对一阶HMM-NGram设计的,另外附带了通用的语料加载工具,可以通过少量代码导出供其他训练工具使用的特定格式(如CRF++). 语料格式 输入语料格式为人民日报分词语料库格式.该格式并没有明确的规范,但总体满足以下几点: 1.单词与词性之间使用“/”分割,如华尔街/nsf,且任何单词都必须有词性,包括标点等. 2.单词与单词之间使用空格分割,如美国/nsf 华尔街/ns…
由于工作中经常需要查看文件的MD5值,先前网上找了几个MD5值查看工具,但基本都是选择文件,还没有复制功能,于是今天我就自己编写了个MD5查看工具,支持文件拖拽查看,并可以复制功能. 由于本工具比较小,具体如何开发和实现看源代码就明白了,在此就不解说了. 对于有需要的童鞋可以根据自己的需求下载,下面是对应的工具软及其源码的下载地址: 文件MD5查看器工具下载地址:http://download.csdn.net/detail/jczmdeveloper/6945723 文件MD5查看器工具(源代…
安装 RPM 包或者安装源码包 在windows下安装一个软件很轻松,只要双击.exe的文件,安装提示连续“下一步”即可,然而linux系统下安装一个软件似乎并不那么轻松了,因为我们不是在图形界面下.所以你要学会如何在linux下安装一个软件. 在前面的内容中多次提到的yum,这个yum是Redhat所特有的安装RPM程序包的工具,使用起来相当方便.因为使用RPM安装某一个程序包有可能会因为该程序包依赖另一个程序包而无法安装.而使用yum工具就可以连同依赖的程序包一起安装.当然CentOS同样可…
linux的学习很早就开始了,大学的时候的时候有有学过unix,后来每年都有去看看linux,因为在小城市的缘故,很少会实际工作中用到,基本都是智慧云之类的,同事也说,你学起来也用不上,IT生态不好,没用!可是自己心里一直有想去学linux,于是这次下决心自己搭建一个lamp环境,记录下来,当做学习笔记. 在网上搜索的lamp环境的资料,很多都是yum的,或者是老资料,为了让自己多敲几段命令,所以选择了源码包的方式.说真的,对于我这种初学者来说,较新版的源码包哪怕是有一点点的安装配置的不一样,可…
RPM包或者安装源码包 在windows下安装一个软件很轻松,只要双击.exe的文件,安装提示连续“下一步”即可,然而linux系统下安装一个软件似乎并不那么轻松了,因为我们不是在图形界面下.所以你要学会如何在linux下安装一个软件. 在前面的内容中多次提到的yum,这个yum是Redhat所特有的安装RPM程序包的工具,使用起来相当方便.因为使用RPM安装某一个程序包有可能会因为该程序包依赖另一个程序包而无法安装.而使用yum工具就可以连同依赖的程序包一起安装.当然CentOS同样可以使用y…
RPM包或者安装源码包 在windows下安装一个软件很轻松,只要双击.exe的文件,安装提示连续“下一步”即可,然而linux系统下安装一个软件似乎并不那么轻松,因为我们不是在图形界面下.所以我们要学会如何在linux下安装一个软件. 1.[RPM工具] 1.1 RPM包介绍 RPM是”Redhat Package Manager”的缩写.是以一种数据库记录的方式来将你所需要的套件安装到你的Linux 主机的一套管理程序.也就是说,你的linux系统中存在着一个关于RPM的数据库,它记录了安装…
一.准备下载的安装包: 1.python(我电脑配置的是2.7)下载地址http://pan.baidu.com/s/1qWrGZk4 2.wxpython(我这里是wxpy3.0,配套python2.7)下载地址http://pan.baidu.com/s/1jGplycA 3.comtypes(这里是最新的1.1.2)下载地址http://pan.baidu.com/s/1hqnn7ZA 4.ulipad源码包,下载地址http://pan.baidu.com/s/1eQHJQt8  二.安…
最近查看JDK源码时,无意间发现几个类在陌生包里:com.sun.*.sun.*.org.*,google了一把总结了下以备他人搜索,如内容有误欢迎指正!   Jre库包含的jar文件(jdk1.6):resources.jar.rt.jar.jsse.jar.jce.jar.charsets.jar.dnsns.jar.localedata.jar等共10个jar文件,其中resource.jar为资源包(图片.properties文件):rt.jar为运行时包,子包结构如下图:      …
mysql用的二进制包安装. Apache php 用的源码包 mysql版本5.5.46    Apache版本2.4.7  PHP版本:5.5 mysql安装部分参考了阿铭linux的内容. 这是第二次搭建lamp环境.Apache2.4的版本比2.2的关系依赖包要多几个,PHP那部分有几个包也是源包安装的.视频刚看到lamp环境搭建的前几节.写不好,请勿喷.   安装mysqlmysql下载地址:http://mirrors.sohu.com/mysql/MySQL-5.5/初始化[roo…
Linux学习之源码包安装与脚本安装 目录 源码包与RPM包的区别 源码包安装 脚本安装 源码包与RPM包的区别 1.区别 安装之前的区别:概念上的区别 安装之后的区别:安装位置不同 源码包: 开源的 安装更慢,更容易报错 安装更自由 安装完后效率更高 RPM包: 经过编译,能看到源代码 安装更快,报错容易解决 2.RPM包安装位置与源码包安装位置 RPM包安装位置: 源码包安装位置: 安装在指定位置当中,一般是/usr/local/软件名/  3.安装位置不同带来的影响 RPM包安装的服务可以…
第5周第4次课(4月19日) 课程内容: 7.6 yum更换国内源7.7 yum下载rpm包7.8/7.9 源码包安装 7.6 yum更换国内源 当yum仓库的软件不好用时,例如很多yum源都是国外的,如果在国内访问就比较慢很不方便,所以我们可以更换为国内的yum仓库源. 操作实例步骤如下: 首先删除dvd本地仓库,然后把之前备份的yum源copy回来,再删除CentOS-base.repo,通过wget从网上下载一个163的repo,但是提示找不到wget命令,而且刚才又删除了CentOS-b…
1. 安装准备 安装 C 语言编译器 下载源码包 如:apache 相应源码包下载地址 2. 安装注意事项 源代码保存位置:/usr/local/src 软件安装位置:/usr/local 如何确定安装过程报错: 安装过程停止 出现 error.warning 或 no 的提示 3. 源码包安装过程 下载源码包 解压缩下载的源码包 进入解压缩目录 ./configure 软件配置与检查 定义需要的功能选项 检测系统环境是否符合安装要求 把定义好的功能选项和检测系统环境的信息都写入 Makefil…
安装前准备 安装C语言编译器"gcc" yum -y install gcc --c 源码包语言编译器 下载源码包 安装注意事项 源代码保存位置:/usr/local/src/ 软件安装位置:/usr/local/ 如何确定安装过程报错: #安装过程停止 #并出现error.warning或no的提示 源码包安装过程 前置 下载源码包 解压缩下载的源码包 进入解压缩目录,必须进入,后面的安装命令都是在源码包目录下执行 知识点 安装时必须进入到解压缩后的目录中 [./configure]…
HanLP中文自然语言处理工具实例演练 作者:白宁超 2016年11月25日13:45:13 摘要:HanLP是hankcs个人完成一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用.HanLP具备功能完善.性能高效.架构清晰.语料时新.可自定义的特点. 在提供丰富功能的同时,HanLP内部模块坚持低耦合.模型坚持惰性加载.服务坚持静态提供.词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的语料.笔者坚定支持开源的项目,本文初衷是使用自然语言…
rpm命令管理软件 对于挂载的像U盘那种都会在midea目录下,但是会显示在桌面上 安装软件(i:install,v:verbose冗长的,h:human):rpm  -ivh  xxxx.rpm 安装有依赖性的软件: 以mysql为例子,如果package文件夹中软件太多,找到mysql不容易可以使用命令 ls | grep mysql     ls会列出当前目录下的文件,|(管道符)会取到前面的结果  然后交给grep这个过滤命令,过滤的关键字是mysql…
手记实用系列文章: 1 结巴分词和自然语言处理HanLP处理手记 2 Python中文语料批量预处理手记 3 自然语言处理手记 4 Python中调用自然语言处理工具HanLP手记 5 Python中结巴分词使用手记 HanLP方法封装类: # -*- coding:utf-8 -*- # Filename: main.py from jpype import * startJVM(getDefaultJVMPath(), "-Djava.class.path=C:\hanlp\hanlp-1.…
CentOS 7.0编译安装Nginx1.6.0+MySQL5.6.19+PHP5.5.14 一.配置防火墙,开启80端口.3306端口 CentOS 7.0默认使用的是firewall作为防火墙,这里改为iptables防火墙. 1.关闭firewall: systemctl stop firewalld.service #停止firewall systemctl disable firewalld.service #禁止firewall开机启动 2.安装iptables防火墙 yum ins…
TPCx-BB是大数据基准测试工具,它通过模拟零售商的30个应用场景,执行30个查询来衡量基于Hadoop的大数据系统的包括硬件和软件的性能.其中一些场景还用到了机器学习算法(聚类.线性回归等).为了更好地了解被测试的系统的性能,需要对TPCx-BB整个测试流程深入了解.本文详细分析了整个TPCx-BB测试工具的源码,希望能够对大家理解TPCx-BB有所帮助. 代码结构 主目录($BENCH_MARK_HOME)下有: bin conf data-generator engines tools…
流程: 1.  下载并解压源码包2.  运行:configure3.  编译:make4.  安装:make install 编译时需要注意一个原则:不要在解压的包中直接执行./configure.make.make install等命令,需要在源码目录下另外新建一个目录,在新建的目录中执行以上命令. 例子:这里以源码编译安装Xz这个工具为例 1.  下载源码包:wget http://tukaani.org/xz/xz-5.2.2.tar.gz     //版本请自行选择2.  解压源码包:t…
一.什么是源码包软件: 顾名思义,源码包就是源代码的可见的软件包,基于Linux和BSD系统的软件最常见:在国内源可见的软件几乎绝迹:大多开源软件都是国外出品:在国内较为出名的开源软件有fcitx;lumaqq;Lumaqq及scim等: 但软件的源代码可见并不等于软件是开源的,我们还要以软件的许可为准:比如有些软件是源码可见的,但他约定用户只能按他约定的内容来修改:比如vbb论坛程序:所以一个软件是否是开源软件,得具备两个条件:一是源代码可见:二是要有宽松的许可证书,比如GPL证书等: 在GN…
在上篇<可视化工具gephi源码探秘(一)>中主要介绍了如何将gephi的源码导入myeclipse中遇到的一些问题,此篇接着上篇而来,主要讲解当下通过myeclipse导入gephi源码的可行性不高以及熟悉netbeans,并把原本基于netbeans平台开发的gephi源码导入进netbeans后启动正常运行的过程,其中有遇到的不少问题和相应的解决方法.   前日工作梗概(还是沿着想把源码导入myeclipse的思路): 经过从各大子模块的pom.xml中筛选出符合条件的jar包写入项目下…
本文由秀依林枫提供友情赞助,首发于烂泥行天下 公司服务器比较多,需要把apache源码包制作成rpm包,然后放到公司内网yum源上进行下载安装.apache的rpm包安装方式比源码安装方式比较快,这能节约不少的时间. 有关内网yum源的搭建,可以参考<烂泥:yum的使用及配置>这篇文章. 一.安装rpm-build 查阅相关资料得知,要把源码包制作成rpm包需要使用rpm打包工具rpm-build. rpm-build通过rpmbuild命令根据本地源码包,通过spec文件中的规则就可以把源码…
安装apache: 官网:http://httpd.apache.org/download.cgi#apache24 1.wget http://mirror.bit.edu.cn/apache//httpd/httpd-2.4.10.tar.gz 2.tar zxvf httpd-2.4.10.tar.gz 3.cd httpd-2.4.10  &&  ./configure ...  && make && make install **报错APR not…
mysql从5.5版本开始,不再使用./configure编译,而是使用cmake编译器,具体的cmake编译参数可以参考mysql官网文档(※ 非常重要) http://dev.mysql.com/doc/refman/5.5/en/source-configuration-options.html mysql-5.5.28.tar.gz源码包下载地址: http://down.51cto.com/data/700556 我的mysql目录配置如下: 安装路径:/usr/local/mysql…
注:由于mysql5.5的源码包安装与mysql之前的版本安装方法不同,故写一篇随笔记录.5.5的版本不再是./configure make make install 这里用到了cmake了,cmake是一个跨平台的编译工具. 注意: mysql-5.5以后的版本不能使用make编译,只能使用cmake工具编译安装. cmake指定编译选项的方式不同于make . "./configure" 与 "cmake . "相似 "./configure --he…
第一步:安装依赖包   因为Linuxmint 和 Ubuntu 同属 Debian系的Linux,而且Linuxmint是建立在Ubuntu的基础上的,所以Ubuntu下的命令和包,Linuxmint同样适用.1. 安装python 2.6版或者更高(linuxmint默认都已安装,可以在terminal中使用 pyhton -v 命令查看python版本). 2. 安装其他依赖包: (具体需要什么依赖可以去git上去找,https://github.com/lookphp/node) Pre…