solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件

昨天已经在Tomcat容器中成功的部署了solr全文检索引擎系统的服务；今天来分享一下solr服务在海量数据的网站中是如何实现数据的检索。

在solr服务中集成IKAnalyzer中文分词器的步骤：

1、下载IKAnalyzer分词器的压缩包并解压；

2、将IKAnalyzer压缩包中的jar包复制到Tomcat容器中已经部署的solr项目中的WEB-INF/lib目录下；

3、在Tomcat容器的solr项目中的WEB-INF/目录创建一个classes目录(默认该目录是不存在的，需手动创建)，并将分词器压缩包中的配置文件、自定义词典、通用词典三个文件拷贝到classes目录中；

4、找到solr的家目录，即solrHome目录，修改solrHome/collection1/conf/schema.xml文件中定义IK域的类型、定义自定义域配置内容；

　　<!-- IKAnalyzer-->

    <fieldType name="text_ik" class="solr.TextField">

    <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

    </fieldType>

    <!--IKAnalyzer Field-->

    <field name="content_ik" type="text_ik" indexed="true" stored="true" />

5、重新启动Tomcat容器，检验是否配置成功，如果出现以下界面中的内容，则集成成功，可以看到我们刚才在solrHome的配置文件中配置的自定义域和IK域的类型。

使用dataimportHandler插件批量导入数据，在solr服务中集成dataimportHandler插件的步骤：

1、找到solrHome/collection1目录，创建一个lib目录，将插件所依赖的jar包和数据库驱动包拷贝到lib目录下(dataimportHandler插件依赖的jar包可以在下载好的solr压缩包中找到)；

插件依赖的jar包在dist目录下：

2、找到solrHome/collection1/conf/solrconfig.xml文件，添加如下配置内容：

  <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">

  <lst name="defaults">

  <str name="config">data-config.xml</str>

  </lst>

  </requestHandler>

3、根据创建的数据表在solrHome/collection1/conf/schema.xml配置文件中配置业务域(温馨提示：业务域根据数据表的字段名称来配置);

　　 <!--product-->

    <field name="product_name" type="text_ik" indexed="true" stored="true"/>

    <field name="product_price"  type="float" indexed="true" stored="true"/>

    <field name="product_description" type="text_ik" indexed="true" stored="false" />

    <field name="product_picture" type="string" indexed="false" stored="true" />

    <field name="product_catalog_name" type="string" indexed="true" stored="true" />

    <field name="product_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>

    <copyField source="product_name" dest="product_keywords"/>

    <copyField source="product_description" dest="product_keywords"/>

4、需要创建一个文件名称为data-config.xml的配置文件，并且拷贝到solrHome/collection1/conf目录下；data-config.xml文件中的配置内容如下(温馨提示：根据自己的需求的来添加配置内容，如数据库连接的参数信息，数据库中表字段的名称等)：

<?xml version="1.0" encoding="UTF-8" ?>

<dataConfig>

<dataSource type="JdbcDataSource"

          driver="com.mysql.jdbc.Driver"

          url="jdbc:mysql://localhost:3306/solr"

          user="root"

          password="123"/>

<document>
　　<!-- column代表数据表中的字段名称，name代表配置文件中的业务域的name属性值名称 -->

    <entity name="product" query="SELECT pid,name,catalog_name,price,description,picture FROM products ">

        <field column="pid" name="id"/>

        <field column="name" name="product_name"/>

        <field column="catalog_name" name="product_catalog_name"/>

        <field column="price" name="product_price"/>

        <field column="description" name="product_description"/>

        <field column="picture" name="product_picture"/>

    </entity>

</document>

</dataConfig>

5、重启Tomcat容器，检验插件是否集成成功，如果集成成功，则会看到如下界面，看到成功界面后，就可以导入指定数据表中的数据，导入操作在下图中已表明：

[后续会更新京东站内搜索-solr架构案例，有需要的朋友可以继续关注！！！]

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件的更多相关文章

Solr学习笔记之2、集成IK中文分词器
Solr学习笔记之2.集成IK中文分词器一.下载IK中文分词器 IK中文分词器此文IK版本:IK Analyer 2012-FF hotfix 1 完整分发包二.在Solr中集成IK中文分词器 ...
Lucene系列四：Lucene提供的分词器、IKAnalyze中文分词器集成、扩展 IKAnalyzer的停用词和新词
一.Lucene提供的分词器StandardAnalyzer和SmartChineseAnalyzer 1.新建一个测试Lucene提供的分词器的maven项目LuceneAnalyzer 2. 在p ...
Solr的学习使用之（三）IKAnalyzer中文分词器的配置
1.为什么要配置? 1.我们知道要使用Solr进行搜索,肯定要对词语进行分词,但是由于Solr的analysis包并没有带支持中文的包或者对中文的分词效果不好,需要自己添加中文分词器:目前呼声较高的是 ...
2.IKAnalyzer 中文分词器配置和使用
一.配置 IKAnalyzer 中文分词器配置,简单,超简单. IKAnalyzer 中文分词器下载,注意版本问题,貌似出现向下不兼容的问题,solr的客户端界面Logging会提示错误. 给出我配置 ...
我与solr(六)--solr6.0配置中文分词器IK Analyzer
转自:http://blog.csdn.net/linzhiqiang0316/article/details/51554217,表示感谢. 由于前面没有设置分词器,以至于查询的结果出入比较大,并且无 ...
【solr】solr5.0整合中文分词器
1.solr自带的分词器远远满足不了中文分词的需求,经查使用最多的分词器是solr是mmseg4j分词器,具体整合大家可以参考 https://github.com/zhuomingliang/mms ...
Solr集成IK中文分词器
1.将IKAnalyzer-2012-4x.jar拷贝到example\solr-webapp\webapp\WEB-INF\lib下: 2.在schema.xml文件中添加fieldType: &l ...
Solr 安装与集成IK中文分词器
创建wangchuanfu core 1. 在example目录下创建wangchuanfu-solr文件夹: 2. 将./solr下的solr.xml拷贝到wangchuanfu-solr目录下 ...
solr 7.7.0配置中文分词器的数据类型
<dynamicField name="*_is" type="pints" indexed="true" stored=" ...

随机推荐

Angular2入门系列教程1-使用Angular-cli搭建Angular2开发环境
一直在学Angular2,百忙之中抽点时间来写个简单的教程. 2016年是前端飞速发展的一年,前端越来越形成了(web component)组件化的编程模式:以前Jquery通吃一切的田园时代一去不复 ...
SDWebImage源码解读之SDWebImageDownloaderOperation
第七篇前言本篇文章主要讲解下载操作的相关知识,SDWebImageDownloaderOperation的主要任务是把一张图片从服务器下载到内存中.下载数据并不难,如何对下载这一系列的任务进行设计 ...
html中如何添加提示信息
提示:在标签中添加title属性 1.文本中如何添加提示信息? 1.1直接在标签中加title="值": 例如:<p title="爱笑,爱哭,爱生活"& ...
2015 西雅图微软总部MVP峰会记录
2015 西雅图微软总部MVP峰会记录今年决定参加微软MVP全球峰会,在出发之前本人就已经写这篇博客,希望将本次会议原汁原味奉献给大家因为这次是本人第一次写会议记录,写得不好的地方希望各位园友见谅 ...
Python-Jenkins API使用 —— 在后端代码中操控Jenkins
最近在工作中需要用到在后台代码中触发Jenkins任务的构建,于是想到Jenkins是否有一些已经封装好的API类库提供,用于处理跟Jenkins相关的操作.下面就简单介绍下我的发现. Linux C ...
.Net Core MVC 网站开发（Ninesky） 2.3、项目架构调整-控制反转和依赖注入的使用
再次调整项目架构是因为和群友dezhou的一次聊天,我原来的想法是项目尽量做简单点别搞太复杂了,仅使用了DbContext的注入,其他的也没有写接口耦合度很高.和dezhou聊过之后我仔细考虑了一下, ...
lua 学习笔记（1）
一.lua函数赋值与函数调用在lua中函数名也是作为一种变量出现的,即函数和所有其他值一样都是匿名的,当要使用某个函数时,需要将该函数赋值给一个变量,这样在函数块的其他地方就可以通过 ...
Hawk 6. 高级话题：子流程系统
子流程的定义当流程设计的越来越复杂,越来越长时,就难以进行管理了.因此,采用模块化的设计才会更加合理.本节我们介绍子流程的原理和使用. 所谓子流程,就是能先构造出一个流程,然后被其他流程调用.被调用 ...
深入研究Visual studio 2017 RC新特性
在[Xamarin+Prism开发详解三:Visual studio 2017 RC初体验]中分享了Visual studio 2017RC的大致情况,同时也发现大家对新的Visual Studio很 ...
源码分析netty服务器创建过程vs java nio服务器创建
1.Java NIO服务端创建首先,我们通过一个时序图来看下如何创建一个NIO服务端并启动监听,接收多个客户端的连接,进行消息的异步读写. 示例代码(参考文献[2]): import java.io ...

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件

solr服务中集成IKAnalyzer中文分词器、集成dataimportHandler插件的更多相关文章

随机推荐

热门专题