***版权声明:本文为博主原创文章,转载请注明本文地址。http://www.cnblogs.com/o0Iris0o/p/5813856.html ***

内容介绍:

真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)[本文内容]

  1. 1.搭建单机solr 2.搭建zookeeper 3.配置solrcloud

**真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(2)

**

  1. 4.创建corecollection分片 5.配置IK Analyzer中文分词 5.索引mysql 6.整合web项目(web中单机solr以及solrcloud的使用)

1.运行环境

  1. 基本环境:Mac OS X
  2. 虚拟机软件:Parallels Desktop
  3. 其他环境:ubuntu14+jdk-1.7+solr-4.10.3+zookeeper-3.4.8+tomcat-7.0.70
  4. 三台ubuntu虚拟机:
  5. 192.168.1.1 master
  6. 192.168.1.2 tom
  7. 192.168.1.3 harry

2.solr单机的搭建

(单机solr先在一台虚拟机上配置即可,后期配置solrcloud之后再复制到所有虚拟机)

1.将apache-tomcat-7.0.70.tar.gz解压到/opt/tomcat/下

由于opt下的操作需要root权限,因此需要命令行,我的操作是先解压到桌面,在opt目录下创建tomcat文件夹再将解压后文件移动到/opt/tomcat/

2.将solr-4.10.3安装压缩包解压,复制解压文件夹中example/webapps中的solr.war解压移动到tomcat的webapps中

即solr.war解压后是一个完整的web项目,这样做是为了将solr的这个web项目部署到tomcat服务器上

3.拷贝解压后的solr-4.10.3文件夹中/example/lib/ext//下的jar文件到/opt/tomcat/apache-tomcat-7.0.70/webapps/solr/WEB-INF/lib/

4.拷贝解压后的solr-4.10.3文件夹中/example/resources/log4j.properties文件到tomcat/webapps/solr/WEB-INF/classes下

如果没有classes文件夹就新建一个名为classes的文件夹

5.创建solrhome文件夹,并将solr-4.10.3/example/solr中的数据拷贝到建立的solrhome文件夹中

solrhome是部署在此tomcat的单机solr的配置文件,当后面solrcloud基于zookeeper的集群搭建起来之后,会统一管理配置文件,即solrhome中的配置文件会上传到zookeeper管理的solrcloud中作为solr的配置文件

**

**

6.编辑webapps/solr/WEB-INF/web.xml文件,指定solrhome

  1. <env-entry>
  2. <env-entry-name>solr/home</env-entry-name>
  3. <env-entry-value>/opt/tomcat/apache-tomcat-7.0.70/webapps/solrhome</env-entry-value>
  4. <env-entry-type>java.lang.String</env-entry-type>
  5. </env-entry>

7.重启tomcat,在浏览器输入地址http://localhost:8080/solr/

这个时候还只是单机solr,没有cloud那一栏,这个界面成功显示代表着单机solr搭建成功

有了成功的单机solr,在此基础上以继续搭建solrcloud集群

3.Zookeeper完全分布式的搭建

注意!一定不要去掉或者注释掉etc/hosts文件下的“ 127.0.0.1 localhost ”,不然会出异常,导致zookeeper不好使!

好早以前配hadoop集群的时候按照一篇教程注释掉了localhost结果竟然导致zookeeper不好使!T_T。。。这问题藏的够深

1.更改配置文件etc/hosts

  1. etc/hosts文件内容:(注:更改此文件需要root权限,所以使用vim或者gedit更改不要忘记sudo哦)
  2. 127.0.0.1 localhost
  3. 192.168.1.230 master
  4. 192.168.1.231 tom
  5. 192.168.1.232 harry

2.创建目录/opt/zookeeper/svr和/opt/zookeeper/data/zookeeper-data,将zookeeper-3.4.8.tar.gz解压到/opt/zookeeper/svr下

3.进入conf文件夹,把zoo_sample.cfg改名为zoo.cfg并修改配置文件conf/zoo.cfg:

  1. conf/zoo.cfg文件内容:
  2. tickTime=2000
  3. initLimit=10
  4. syncLimit=5
  5. dataDir=/opt/zookeeper/data/zookeeper-data
  6. dataLogDir=/opt/zookeeper/data/zookeeper-data/logs
  7. server.1=master:2888:3888
  8. server.2=tom:2888:3888
  9. server.3=harry:2888:3888
  10. clientPort=2181

参数说明:


①tickTime:心跳时间,毫秒为单位。

②initLimit: 这个配置项是用来配置 Zookeeper 接受客户端(这里客户端不是用户连接 Zookeeper服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 10 个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 10*2000=20 秒。

③syncLimit:这个配置项标识 Leader 与 Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime时间长度,总时间长度就是 5*2000=10 秒。

④dataDir:存储内存中数据库快照的位置。

⑤clientPort:监听客户端连接的端口

⑥server.N= HostNameOrIP:Port1:Port2 :其中 N 是一个数字,表示这个是第几号服务器;HostNameOrIP是这个服务器的 ip 地址或者etc/hosts中中已有的主机名;Port1 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;Port2 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于HostNameOrIP都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。

**4.将zookeeper复制到剩余两台虚拟机的相同文件夹里

**

5.dataDir即/opt/zookeeper/data/zookeeper-data目录下创建myid文件,将内容设置为上⑥中N值,用来标识不同的服务器

在节点配置的dataDir指定的目录下面,创建一个myid文件,里面内容为一个数字

master中/opt/zookeeper/data/zookeeper-data文件夹下myid的内容为1,tom中myid的内容为2,harry中myid的内容为3

**

**

到此zookeeper配置完成~

6.启动ZooKeeper集群

分别进入三台虚拟机的/opt/zookeeper/svr/zookeeper-3.4.8/bin目录输入命令 ./zkServer.sh start启动集群**

**

  1. a@master:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh start
  2. a@tom:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh start
  3. a@harry:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh start

./zkServer.sh status命令查看状态,正常情况下

  1. a@master:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh status
  2. JMX enabled by default
  3. Using config: /opt/zookeeper/svr/zookeeper-3.4.8/bin/../conf/zoo.cfg
  4. Mode: follower

注:一开始只启动一台主机还没有启动其它两台的时候日志中会出现异常,没关系,等到三台虚拟机的zookeeper都启动了之后就一切正常了~但如果这时候输入./zkServer.sh status命令仍然如下面的状态说明启动失败

  1. a@master:/opt/zookeeper/svr/zookeeper-3.4.8/bin$ ./zkServer.sh status
  2. ZooKeeper JMX enabled by default
  3. Using config: /opt/zookeeper/svr/zookeeper-3.4.8/bin/../conf/zoo.cfg
  4. Error contacting service. It is probably not running.

连接失败原因分析:

上面提到的注释掉了localhost会导致这种情况,2181端口被占用(更改zoo.cfg中端口号即可)或zoo.cfg配置文件没有正确配置(如:myid没有更改对、IP地址没有配置正确、网络连接掉线等)也会导致这种情况的出现。

如果连接失败想查询具体异常原因,可以查看/opt/zookeeper/svr/zookeeper-3.4.8/bin/zookeeper.out文件具体查看异常信息

另:jps查看进程:QuorumPeerMain是zookeeper进程

  1. zookeeper常用命令:
  2. 启动:
  3. ./zkServer.sh start
  4. 查看状态:
  5. ./zkServer.sh status
  6. 停止:
  7. ./zkServer.sh stop
  8. 重启:
  9. ./zkServer.sh restart
  10. 连接服务器
  11. ./zkCli.sh -server HostNameOrIP:2181

3.SolrCloud配置

(注意将下面配置中的master、tom、harry更改成自己的主机名或IP地址,文件夹地址对应修改成相应的文件夹哦~)

1.solrcloud文件夹准备,solrcloud文件夹储存的是打算上传到zookeeper中统一管理的solr配置文件

  1. 创建solrcloud文件夹,可以在自己喜欢的位置,我的是/opt/tomcat/solrcloud
  2. solrcloud文件夹下创建solr-lib目录和config-files目录,即/opt/tomcat/solrcloud/solr-lib和/opt/tomcat/solrcloud/config-files
  3. solr/WEB-INF/lib下的所有 jar包拷贝到/opt/tomcat/solrcloud/solr-lib目录
  4. solr/example/solr/collection1/conf下的所有文件拷贝到/opt/tomcat/solrcloud/config-files目录

2.把solrhome中的配置文件上传到zookeeper集群

  1. java -classpath .:/opt/tomcat/solrcloud/solr-lib/* org.apache.solr.cloud.ZkCLI -cmd upconfig -zkhost master:2181,tom:2181,harry:2181 -confdir /opt/tomcat/solrcloud/config-files/ -confname myconf

3.指定collection1使用myconf配置

  1. java -classpath .:/opt/tomcat/solrcloud/solr-lib/* org.apache.solr.cloud.ZkCLI -cmd linkconfig -collection collection1 -confname myconf -zkhost master:2181,tom:2181,harry:2181

4.更改tomcat配置文件catalina.sh

  1. /opt/tomcat/apache-tomcat-7.0.70/bin/catalina.sh文件在第一行增加:
  2. JAVA_OPTS="-DzkHost=master:2181,tom:2181,harry:2181"

5.更改solr.xml配置文件

注意:不要在其它系统创建更改之后再上传到虚拟机,因为solr.xml文件在solrcloud分片等操作时会被更改,如果在其它系统创建更改后上传系统权限不足或文件格式不对会导致系统无法对此文件进行操作,造成无法分片无法创建core等。

/opt/tomcat/apache-tomcat-7.0.70/webapps/solrhome/solr.xml文件内容如下:

  1. <?xml version="1.0" encoding="UTF-8" ?>
  2. <solr persistent="true">
  3. <logging enabled="true">
  4. <watcher size="100" threshold="INFO" />
  5. </logging>
  6. <cores defaultCoreName="collection1" adminPath="/admin/cores" host="${host:}" hostPort="8080" hostContext="${hostContext:solr}" zkClientTimeout="${zkClientTimeout:15000}">
  7. </cores>
  8. </solr>

6.此处基本的solrcloud集群就搭建配置完毕,将配置好的包括solr项目的tomcat分别复制到其它两台虚拟机

首先启动zookeeper再启动tomcat,进入浏览器输入solr项目部署地址,出现如下界面则搭建成功(比单机版多了个cloud)

**

**

真分布式SolrCloud+Zookeeper+tomcat搭建、索引Mysql数据库、IK中文分词器配置以及web项目中solr的应用(1)的更多相关文章

  1. Solr7.2.1环境搭建和配置ik中文分词器

    solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...

  2. Kafka:ZK+Kafka+Spark Streaming集群环境搭建(十九)ES6.2.2 安装Ik中文分词器

    注: elasticsearch 版本6.2.2 1)集群模式,则每个节点都需要安装ik分词,安装插件完毕后需要重启服务,创建mapping前如果有机器未安装分词,则可能该索引可能为RED,需要删除后 ...

  3. SpringMVC,MyBatis项目中兼容Oracle和MySql的解决方案及其项目环境搭建配置、web项目中的单元测试写法、HttpClient调用post请求等案例

     要搭建的项目的项目结构如下(使用的框架为:Spring.SpingMVC.MyBatis): 2.pom.xml中的配置如下(注意,本工程分为几个小的子工程,另外两个工程最终是jar包): 其中 ...

  4. ElasticSearch 索引模块——集成IK中文分词

    下载插件地址 https://github.com/medcl/elasticsearch-analysis-ik/tree/v1.10.0 对这个插件在window下进行解压 用maven工具对插件 ...

  5. ES-windos环搭建-ik中文分词器

    ik下载 打开Github官网,搜索elasticsearch-analysis-ik,单击medcl/elasticsearch-analysis-ik.或者直接点击 在readme.md文件中,下 ...

  6. ES-Mac OS环境搭建-ik中文分词器

    下载 从github下载ik中文分词器,点击地址,需要注意的是,ik分词器和elasticsearch版本必须一致. 安装 下载到本地并解压到elasticsearch中的plugins目录内即可. ...

  7. solrcloud配置中文分词器ik

    无论是solr还是luncene,都对中文分词不太好,所以我们一般索引中文的话需要使用ik中文分词器. 三台机器(192.168.1.236,192.168.1.237,192.168.1.238)已 ...

  8. 在eclipse中构建solr项目+添加core+整合mysql+添加中文分词器

    最近在研究solr,这里只记录一下eclipse中构建solr项目,添加core,整合mysql,添加中文分词器的过程. 版本信息:solr版本6.2.0+tomcat8+jdk1.8 推荐阅读:so ...

  9. solr 7+tomcat 8 + mysql实现solr 7基本使用(安装、集成中文分词器、定时同步数据库数据以及项目集成)

    基本说明 Solr是一个开源项目,基于Lucene的搜索服务器,一般用于高级的搜索功能: solr还支持各种插件(如中文分词器等),便于做多样化功能的集成: 提供页面操作,查看日志和配置信息,功能全面 ...

随机推荐

  1. 什么是j2ee ??EJB与j2ee的关系?? 请看百度百科

    首先,EJB是j2ee的一部分. http://baike.baidu.com/link?url=SGmNOVWoaZ62WCjb7a_yzz-GBGsDT3jyFM1hsvv8ycAwusdmo_D ...

  2. myeclipse设置以及快捷键

    http://blog.csdn.net/anxin323/article/details/40214467 如何查看jar包里的源码和doc文档? 1. jar文件右键properties--jav ...

  3. Extjs4 up 和down的用法

    Extjs4.x中,每个组件都新增加了两个方法up()和down()方法.这两个方法都是用来获取组件的,下面我们来看下up()方法和down()方法的官方解释. Extjs4.x中,新增加了两个方法u ...

  4. Mycat 安装配置

    下载https://github.com/MyCATApache/Mycat-download Mycat 需要jdk 环境,首先安装 jdk 安装完 jdk 环境以后 下载 mycat server ...

  5. POJ 1995 Raising Modulo Numbers

    快速幂取模 #include<cstdio> int mod_exp(int a, int b, int c) { int res, t; res = % c; t = a % c; wh ...

  6. html 设置页脚div一直在页面底部

    先上代码 <!DOCTYPE HTML> <html lang="en" style="height: 100%; width: 100%;" ...

  7. 常见div+css网页布局(float,absolute)

    网页布局-常见 1,           float布局 (1)常规方法 <div id="warp">     <div id="column&quo ...

  8. tornado 增加日志模块

    log类 #!/usr/bin/env python # -*- coding:utf-8 -*- import logging.handlers class Logger(logging.Logge ...

  9. S3C2440的SPI解析

    位串行数据的频率.如果只希望发送,则接收数据可以保持伪位(dummy).此外如果只希望接收,则需要发送伪位'1'数据 使用SPI主要需要以下寄存器 选择SPI模式,中断模式,查询模式等SCK选择,主从 ...

  10. Struts2命令空间小结

    sturts2命名空间小结,以tomcat为服务器 1. 命名空间配置为“/” <package name="default" namespace="/" ...