IKAnalyzer 独立使用 配置扩展词典】的更多相关文章

有三点要注意(要不然扩展词典始终不生效): 后缀名.dic的词典文件,必须如使用文档里所说的 无BOM的UTF-8编码保存的文件.如果不确定什么是  无BOM的UTF-8编码,最简单的方式就是 用Notepad++编辑器打开,Encoding->选择 Encoding in UTF-8 without BOM,然后保存. 项目preferences 里 编码选择 utf8. 词典和IKAnalyzer.cfg.xml配置文件的路径问题.IKAnalyzer.cfg.xml必须在src根目录下.词…
参考文献:http://blog.csdn.net/fatpanda/article/details/37911079 jar包: IK-Analyzer-extra-5.3.1.jar IKAnalyzer5.3.1.jar lucene-core-5.3.1.jar lucene-analyzers-common-5.3.1.jar 一.创建类自己的分词器配置类并实现IK-Analyzer分词器的配置接口: 值得注意的一点是:我们在指定配置文件时候,要指定我们自己的配置文件.如果不指定路径默…
@Test // 測试分词的效果,以及停用词典是否起作用 public void test() throws IOException { String text = "老爹我们都爱您."; Configuration configuration = DefaultConfig.getInstance(); configuration.setUseSmart(true); IKSegmenter ik = new IKSegmenter(new StringReader(text), c…
一.错误提示 您没有已经配置扩展集成设置的远端; ... 二.解决 配置 Legacy Account Settings 即可:…
centos  系统软件包管理  yum 本地yum配置  扩展源epel  rpm  清除yum缓存  yum provides "*/vim"   第十节课 你不能保证可逆化操作就要备份配置文件 上半节课 rpm -ivh xx.rpm--force--force-Urpm -erpm -qarpm -qi 包名rpm -qf filenamerpm -ql 包名rpm -Varpm -qR 下半节课 yum install -y filename(包名) yum groupins…
为了传输故障代码.电流.温度等信息.通常需要使用扩展报文的方式来发送这些信息.在驱动数量较少的情况下,可以进行手动配置. 如果驱动数量很多,可以使用脚本script的方式来配置扩展报文. 驱动编号 注意下图中的Drive Number,表示驱动在 CU(control unit)中的编号, 脚本中需要使用这个编号 以下脚本,给报文增加如下内容 receive word 10, r80 电机扭矩 receive word 11, r2131 驱动故障代码 receive word 12, r213…
1.导入数据 批量导入数据并查看    1.1 导入数据   1) 使用POST方式批量导入数据,数据格式为json,url 编码使用data-binary导入含有index配置的json文件 ]# scp /var/ftp/elk/*.gz 192.168.1.66:/root/ kibana ~]# gzip -d logs.jsonl.gz  kibana ~]# gzip -d accounts.json.gz  kibana ~]# gzip -d shakespeare.json.g…
一.配置标准ACL 目标: 络调通后,保证网络是通畅的.同时也很可能出现未经授权的非法访问.企业网络既要解决连连通的问题,还要解决网络安全的问题. 配置标准ACL实现拒绝PC1(IP地址为192.168.1.1)对外问网络192.168.2.1的访问 方案: 访问控制是网络安全防范和保护的主要策略,它的主要任务是保证网络资源不被非法使用和访问.它是保证网络安全最重要的核心策略之一. 访问控制列表(Access Control Lists,ACL)是应用在路由器接口的指令列表.这些指令列表用来告诉…
在web项目的src目录下创建IKAnalyzer.cfg.xml文件,内容如下 <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment&…
将扩展编译到php内部的方式会提高php运行扩展的效率,但是每次需要新添加扩展时都需要把php以及之前添加的所有扩展重新编译一边,非常麻烦. 独立编译扩展,php外部调用扩展的方式虽然会牺牲一点点的性能,但是却提供了灵活性 用pecl安装 # cd /usr/local/php/bin 1.先查看pear配置中是否已经设置了php.ini的路径 # ./pear config-show 2.如果没有设置: # ./pear config-set php_ini /usr/local/php/li…
转载:http://www.cnblogs.com/madyina/p/4131751.html 一.下载Solr4.10.2 我们以Windows版本为例,solr-4.10.2.zip是目前最新版本,下载地址: http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2 二.   Solr安装: 1.解压solr-4.10.2.zip 2.将 solr-4.10.2/example/webapps/solr.war 拷贝到Tomcat的we…
一.下载Solr4.10.2 我们以Windows版本为例,solr-4.10.2.zip是目前最新版本,下载地址: http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2 二.   Solr安装: 1.解压solr-4.10.2.zip 2.将 solr-4.10.2/example/webapps/solr.war 拷贝到Tomcat的webapps目录下(如D:\apache-tomcat-7.0.57\webapps),重新启动To…
1.关联模型的使用 定义方式:新建一个类文件UserRelationModel.class.php Class UserRelationModel extends RelationModel{ protected $tableName = 'user';//主表名称 protected $_link = array( 'article'=>array(//从表名称 'mapping_type'=>HAS_MANY,//主表对于从表的关系 主表可以有很多从表内容 'foreign_key'=&g…
重要资源 官方资源:官网 . 官网源码 .官网文档 . 在线 IDE .GitHub 中文资源:中文官网 .中文文档  离线文档:PDF 文件 . PDF 文件 GitBook 版 .ePUB 文件 . Mobi 文件 中文教程:Kotlin for android developers .Summary .整理 .教程 Kotlin的背景 Kotlin 是JetBrains在2010年推出的一种基于JVM的静态类型编程语言. JetBrains(位于东欧捷克)是著名的JAVA开发IDE Int…
第一步:config配置,独立文件的 <?xml version="1.0" encoding="utf-8"?> <configuration> <configSections> <section name="log4net" type="log4net.Config.Log4NetConfigurationSectionHandler,log4net" /> </con…
log4net配置很多,具体配置步骤不细说,具体说出个人遇到的问题. 在winfrom和web应用程序中配置,在默认配置文件配置都没问题,因为EF也写在默认配置文件中,就会冲突解决办法就是将log4.config单独写个配置文件.个人在独立出来的时候,一直读取配置文件失败,整了老半天发现是配置文件-属性-复制到输出目录设置为不复制了. 具体配置步骤: 第一步:写配置文件(网上很多,本人贴下我的)记住设置:配置文件-属性-复制到输出目录设置为始终复制 <?xml version="1.0&q…
引言 我原来写过一篇博客:(离线)英语词典软件推荐,个人比较喜欢的就是GoldenDict词典.不仅仅是因为它是免费开源的多平台程序,更重要的是支持丰富的原版词典(下文给出了下载链接).本文主要针对其扩展功能的配置基于命令行的无道词典,同时实现在线查询的功能. 添加无道词典(针对Linux和MacOS) 无道词典,是一个简洁优雅的有道词典命令行版本.支持英汉互查的功能,包含释义.词组.例句等有助于学习的内容. 具体的安装和使用Github项目(见引文3)介绍的很详细,配置之前请确认安装成功. 演…
要使用hanlp加载自定义词典可以通过修改配置文件hanlp.properties来实现.要注意的点是: 1. root根路径的配置: hanlp.properties中配置如下: #本配置文件中的路径的根目录,根目录+其他路径=完整路径(支持相对路径,请参考:https://github.com/hankcs/HanLP/pull/254) #Windows用户请注意,路径分隔符统一使用/ root=D:/Project/public_sentiment_monitor/plugin/hanl…
本文是整理了部分网友在配置hanlp自定义词典时遇到的一小部分问题,同时针对这些问题,也提供另一些解决的方案以及思路.这里分享给大家学习参考. 要使用hanlp加载自定义词典可以通过修改配置文件hanlp.properties来实现. 要注意的点是: 1.root根路径的配置: hanlp.properties中配置如下: #本配置文件中的路径的根目录,根目录+其他路径=完整路径(支持相对路径) #Windows用户请注意,路径分隔符统一使用/ root=D:/Project/public_se…
php 下载地址: http://windows.php.net/download/ Apache 下载地址: http://www.apachelounge.com/download/ mysql 下载地址: http://dev.mysql.com/downloads/mysql/ 一.安装配置Apache2.4.7(httpd-2.4.7-win64-VC11.zip ) 1.解压下载的安装包:httpd-2.4.7-win64-VC11.zip将其放到自己的安装目录(我的目录D:\php…
一.在PHP的安装目录中去创建一个  php.ini  的配置文件 复制php.ini-development文件,修改成php.ini文件(注意:不要多加一个空格或标点什么的).其中 php.ini-development (开发环境用)php.ini-production(生产环境用) 二.用文本工具(如:Nodepad++)打开php.ini文件 在文件中 ctrl+f 找到  extension_dir = "ext" .把他修改为:extension_dir = D:/Dev…
详见tp官网. 此处为笔记: <?php return array( // 0,为普通分组,1为独立分组 ', // 独立分组目录 'APP_GROUP_PATH' => 'Modules' ) ?> 注意:独立分组里的Common文件夹下的函数文件命名不能是Common.php可以是functions.php等…
注:自定义错误的域名最好配置ssl,不配碰到有使用ssl的域名,错误码显示就会有问题 (1)登陆管理后台点区域列表-->配置-->错误url 解析一个域名到你的cdn主控,然后输入这个url地址:http://域名/error/error.php  (注:url中的域名要替换为你的域名) 在区域里加的地址,用浏览器要能访问,正常显示如下: (1)到错误设置自定义url错误 添加有两种模式,一种是直接输入要显示的错误内容,支持html代码编写,第二种是支持写url地址 设置后生效大约需一小时左右…
startup.bat 停止词典的效果…
'APP_GROUP_LIST'=>'Index,Admin', //逗号后面别跟空格啊,真是逗…
StandardAnalyzer 是单词分词器: String msg = "我喜欢你,我的祖国!china 中国,I love you!中华人民共和国"; 分词后的结果:[我],[喜],[欢],[你],[我],[的],[祖],[国],[china],[中],[国],[i],[love],[you],[中],[华],[人],[民],[共],[和],[国] IKAnalyzer 是中文分词器: 分词后的结果:[我],[喜欢],[你],[我],[的],[祖国],[china],[中国],[…
最近,很多朋友问我solr 中文分词配置的问题,都不知道怎么配置,怎么使用,原以为很简单,没想到这么多朋友都有问题,所以今天就总结总结中文分词的配置吧. 有的时候,用户搜索的关键字,可能是一句话,不是很规范.所以在 Solr 中查询出的时候,就需要将用户输入的关键字进行分词. 目前有很多优秀的中文分词组件.本篇只以  IKAnalyzer 分词为例,讲解如何在 solr  中及集成中文分词,使用 IKAnalyzer的原因 IK 比其他中文分词维护的勤快,和 Solr 集成也相对容易.具体就不多…
1.基本介绍 随着分词在信息检索领域应用的越来越广泛,分词这门技术对大家并不陌生.对于英文分词处理相对简单,经过拆分单词.排斥停止词.提取词干的过程基本就能实现英文分词,单对于中文分词而言,由于语义的复杂导致分词并没英文分词那么简单,一般都是通过相关的分词工具来实现,目前比较常用的有庖丁分词以及IKAnalyzer等.这里我们主要通过一个简单的Demo聊聊IKAnalyzer的基本使用.IKAnalyzer是一个开源的,基于java开发的分词工具包,它独立于Lucene项目,同时提供了Lucen…
目录 前言 linux部署 使用 配置 使用 前言 solr是apach基于Lucene开发的成熟的框架,这里我们学习如何部署.使用.关于集群会在后面继续添加 linux部署 mkdir /usr/local/solr && cd /usr/local/solr # 把tomcat.solr和IK分词器复制到当前目录 wget http://archive.apache.org/dist/lucene/solr/4.10.3/solr-4.10.3.tgz wget http://124.…
分词器概念介绍: Analyzer类(分词器)就是把一段文本中的词按某些规则取出,提供和以后查询时使用的工具类,注意在创建索引时会用到分词器,在使用字符串搜索时也会用到分词器,这两个地方要使用同一个分词器,否则可能会搜索不出结果 分词器工作流程: 1, 切分关键词 2, 去除停用词 3, 对于英文单词,把所有字母转为小写(搜索时不区分大小写) 停用词: 有些词在文本中出现的频率非常高,但是对文本所携带的信息基本不产生影响,例如英文的“a.an.the.of”,或中文的“的.了.着.是”,以及各种…