Solr 5.2.1 部署并索引Mysql数据库
1.Solr简介
Solr是一个高性能,采用Java5开发,SolrSolr基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
Solr不仅可以对各种文档(doc、txt、pdf、html...)进行索引,还可以索引数据库中的数据。
solr 5.2.1 下载地址:http://archive.apache.org/dist/lucene/solr/5.2.1/
2.启动Solr
下载Solr文件后解压至任意目录,cd至solr主目录:/solr-5.2.1,使用如下命令启动Solr
bin\solr start
打开 http://localhost:8983/solr,进入Solr管理界面;
3.CREATE SolrCore
新建一个SolrCore,名为collection,命令如下:
bin\solr create -c collection
系统将自动生成collection目录位于:\solr-5.2.1\server\solr\collection;
4.修改相关配置文件
4.1 打开collection\conf\solrconfig.xml,添加如下内容:
<requestHandler name="/dataimport" class="solr.DataImportHandler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>
接着找到如下内容:
<schemaFactory class="ManagedIndexSchemaFactory">
<bool name="mutable">true</bool>
<str name="managedSchemaResourceName">managed-schema</str>
</schemaFactory>
修改为:
<schemaFactory class="ManagedIndexSchemaFactory" />
4.2 在当前目录下创建data-config.xml文件,内容如下:
<?xml version="1.0" encoding="utf-8"?>
<dataConfig>
<dataSource name="slave1"
type="JdbcDataSource"
driver="com.mysql.jdbc.Driver"
url="jdbc:mysql://your_ip:3306/your_database_name"
user="username"
password="password"
batchSize="-1" /> <document>
<entity name="weibo" pk="ID" dataSource="slave1" query="SELECT id,text,baseUrl,author FROM your_table_name">
<field column="id" name="id" />
<field column="text" name="text" />
<field column="baseUrl" name="baseUrl" />
<field column="author" name="author" />
</entity>
</document>
</dataConfig>
4.3 在当前目录下创建admin-extra.html、admin-extra.menu-bottom.html、admin-extra.menu-top.html三个文件;
4.4 重命名managed-schema文件为schema.xml
打开后添加如下内容:
<field name="text" type="text_IKAnalyzer" indexed="true" stored="true" />
<field name="baseUrl" type="text_general" indexed="true" stored="true" />
<field name="author" type="text_general" indexed="true" stored="true" />
<defaultSearchField>text</defaultSearchField> <fieldType name="text_IKAnalyzer" class="solr.TextField">
<analyzer type="index" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
4.5 将相关jar包放入\solr-5.2.1\server\solr-webapp\webapp\WEB-INF\lib目录中,包括:
\solr-5.2.1\dist目录中的solr-dataimporthandler-5.2.1.jar和solr-dataimporthandler-extras-5.2.1.jar JDBC驱动:mysql-connector-java-5.0.8-bin.jar IK-Analyzer分词器:IK-Analyzer-ForSolr5.1.jar
4.6 将IK-Analyzer的相关配置文件放入\solr-5.2.1\server\solr-webapp\webapp\WEB-INF\classes目录中(没有就新建一个)
4.7 重启solr
bin\solr restart -p
4.8 导入数据库数据
- 打开 http://localhost:8983/solr;
- 选择collection;
- 点击Dataimport;
- Excute,done!
ps:solr删除索引命令为:
<delete><query>*:*</query></delete>
<commit/>
Solr 5.2.1 部署并索引Mysql数据库的更多相关文章
- 真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)
版权声明:本文为博主原创文章,转载请注明本文地址.http://www.cnblogs.com/o0Iris0o/p/5813856.html 内容介绍: 真分布式SolrCloud+Zookeepe ...
- 云中沙箱学习笔记1-快速部署并使用MySQL数据库
1.1 背景知识 业务背景 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于Oracle旗下产品.MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面MyS ...
- 如何通过 Docker 部署 Logstash 同步 Mysql 数据库数据到 ElasticSearch
在开发过程中,我们经常会遇到对业务数据进行模糊搜索的需求,例如电商网站对于商品的搜索,以及内容网站对于内容的关键字检索等等.对于这些高级的搜索功能,显然数据库的 Like 是不合适的,通常我们采用 E ...
- Win7下部署Lepus企业级MySQL数据库监控
从官网下载(http://www.lepus.cc/soft/17)安装包后,解压到phpStudy的www目录下: 打开phpStudy管理界面,找到站点管理,并新增站点: 在浏览器里面打开后,报此 ...
- 索引--mysql 数据库Load data大量数据时性能因素之一
发现load data infile 插入数据时越来越慢,后来发现是因为创建表时有创建索引的动作. 把索引创建删除掉之后,导入很迅速,导入后再创建索引,效率果有提高.
- MySQL数据库服务器(YUM)安装
1. 概述2. 部署过程2.1 虚拟机console的NFS服务端配置2.2 虚拟机node15的NFS客户端配置2.3 虚拟机安装MySQL环境2.4 配置MySQL3. 错误及解决3.1 启动失败 ...
- 在Linux环境下,将Solr部署到tomcat7中,导入Mysql数据库数据, 定时更新索引
什么是solr solr是基于Lucene的全文搜索服务器,对Lucene进行了扩展优化. 准备工作 首先,去下载以下软件包: JDK8:jdk-8u60-linux-x64.tar.gz TOMCA ...
- 使用Solr索引MySQL数据
环境搭建 1.到apache下载solr,地址:http://mirrors.hust.edu.cn/apache/lucene/solr/ 2.解压到某个目录 3.cd into D:\Solr\s ...
- macOS安装Solr并索引MySQL
安装 Java 语言的软件开发工具包 brew cask install java 或者在 Oracle官网 中选择 Mac 版本 jdk-8u111-macosx-x64.dmg 下载并安装. 安装 ...
随机推荐
- centos7上的firewalld 的使用
#centos7上的firewalld 的使用 一.firewalld的基本启动关闭命令 启动服务------systemctl start firewalld 关闭服务------systemctl ...
- Tomcat----服务运行的容器
在介绍Tomcat之前,我们先介绍一个概念Servlet. Servlet是一个运行在WEB服务器上的小的Java程序,用来接收和响应从客户端发送过来的请求,通常使用HTTP协议.从下图可以看出Ser ...
- 第二章·Elasticsearch内部分片及分片处理机制介绍
一.副本分片介绍 什么是副本分片? 副本分片的主要目的就是为了故障转移,如果持有主分片的节点挂掉了,一个副本分片就会晋升为主分片的角色. 在索引写入时,副本分片做着与主分片相同的工作.新文档首先被索引 ...
- kubernetes资源清单之pod
什么是pod? Pod是一组一个或多个容器(例如Docker容器),具有共享的存储/网络,以及有关如何运行这些容器的规范. Pod的内容始终位于同一地点,并在同一时间安排,并在共享上下文中运行. Po ...
- 搜索框+ 定时器+Bug解决
定时器 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8 ...
- AD软件中可视栅格 捕捉栅格 电气栅格的功能和设置详解
AD16的栅格设置 AD16系统共有3种栅格:可视栅格.电气栅格.捕捉栅格. Snap:捕获栅格,如果设定值是10mil,鼠标的光标拖动零件引脚,距离可视栅格在10mil范围之内时,零件引脚自动的准确 ...
- Rectangle Puzzle CodeForces - 281C (几何)
You are given two rectangles on a plane. The centers of both rectangles are located in the origin of ...
- TF_RNNCell
参考:链接. RNNCell BasicRNNCell GRUCell BasicLSTMCell LSTMCell MultiRNNCell 抽象类RNNCell 所有的rnncell均继承于RNN ...
- View相关面试问题-事件分发面试问题讲解
为什么会有事件分发机制: 安卓上面的View是树形结构的,View可能会重叠在一起,当我们点击的地方有多个View都可以响应的时候,这个点击事件应该给谁呢?为了解决这一问题,就有了事件分发机制.用图来 ...
- P4149 距离为K的点对(最少边数) n=200000 点分治
这题数据范围变成了200000 n^2就过不了 同时要求求的是最少的边数 不能容斥 #include<bits/stdc++.h> using namespace std; ; ; ], ...