Cloudera Search配置
一、集群机器配置信息
Cloudera集群机器:
10.2.45.104 GBD000.localdomain GBD000
10.2.45.105 GBD101.localdomain GBD101
10.2.45.106 GBD102.localdomain GBD102
10.2.45.107 GBD311.localdomain GBD311
10.2.45.108 GBD312.localdomain GBD312
10.2.45.109 GBD313.localdomain GBD313
10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315
其中10.2.45.105 GBD101.localdomain GBD101是namenode
Zookeeper集群机器:
10.2.45.105 GBD101.localdomain GBD101
10.2.45.106 GBD102.localdomain GBD102
10.2.45.107 GBD311.localdomain GBD311
Solr Server安装机器:
10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315
二、Solr安装配置
1、使用Cloudera Mamager,在以下机器上安装Solr Server。
10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315
在 HDFS 中创建 /solr 目录:(一般CM安装好Solr之后,在HDFS中已经创建了此目录)
$ sudo -u hdfs hadoop fs -mkdir /solr
$ sudo -u hdfs hadoop fs -chown solr /solr
2、编辑Solr配置文件
使用Parcels安装,Solr的配置文件位置为:
/opt/cloudera/parcels/CDH-5.7.0-1.cdh5.7.0.p0.45/etc/default/solr
修改Zookeeper的连接地址:
SOLR_ZK_ENSEMBLE=<GBD101>:,<GBD102>:,<GBD311>:/solr
修改HDFS的连接地址:
SOLR_HDFS_HOME=hdfs://GBD101.localdomain:8020/solr
设置 HDFS 配置文件目录:
SOLR_HDFS_CONFIG=/etc/hadoop/conf
3、创建Solr运行时配置
在任意一个节点上生成配置文件:
#solrctl instancedir --generate #HOME/solr_configs
solrctl instancedir --generate /usr/local/solr/collection1
/usr/local/solr是已经创建好的自定义目录,collection1为是配置文件生成目录,不需要提前创建,名称可以自定义。
创建collection1实例并将配置文件上传到Zookeeper:
#solrctl instancedir --create collection1 #HOME/solr_configs
solrctl instancedir --create collection1 /usr/local/solr/collection1
通过以下命令查看上传的Instance:
solrctl instancedir --list
配置文件上传到Zookeeper之后,其他节点就可以从上面下载配置文件。接下来创建collection:
solrctl collection --create collection1 -s -r
其中-s表示设置Shard数为2,-r表示设置的replica数为1
以上步骤之后,Solr的实例就算创建完毕,可以通过可以通过http://10.2.45.126:8983/solr/#/~cloud查看创建的Collection。
参考文档:
中文版本Cloudera Solr Cloud 配置: http://ae.yyuap.com/pages/viewpage.action?pageId=919744
Cloudera官网配置文档
http://www.cloudera.com/documentation/enterprise/latest/topics/search_deploy_search_solrcloud.html#csig_topic_4_5
Cloudera Search配置的更多相关文章
- 基于Cloudera Manager5配置HIVE压缩
[Author]: kwu 基于Cloudera Manager5配置HIVE压缩,配置HIVE的压缩.实际就是配置MapReduce的压缩,包含执行结果及中间结果的压缩. 1.基于HIVE命令行的配 ...
- 基于Cloudera Search设计数据灾备方案
当实际项目上线到生产环境中,难以避免一些意外情况,如数据丢失.服务器停机等.对于系统的搜索服务来说,当遇到停机的情况意味着在停机这段时间内,用户都不能通过搜索的相关功能进行访问数据,停机意味着将这一段 ...
- How-to: Do Real-Time Log Analytics with Apache Kafka, Cloudera Search, and Hue
Cloudera recently announced formal support for Apache Kafka. This simple use case illustrates how to ...
- 2.1、CDH 搭建Hadoop在安装(为Cloudera Manager配置存储库)
步骤1:为Cloudera Manager配置存储库 使用包管理工具安装Cloudera Manager yum 对于RHEL兼容系统, zypper对于SLES,和 apt-get对于Ubuntu. ...
- 1.3.5、CDH 搭建Hadoop在安装之前(端口---Cloudera Search使用的端口)
Cloudera Search使用的端口 在下表中,每个端口的“ 访问要求”列通常是“内部”或“外部”.在此上下文中,“内部”表示端口仅用于组件之间的通信; “外部”表示该端口可用于内部或外部通信. ...
- SharePoint 2013 Search 配置总结
前言:SharePoint 2013集成了Fast搜索以后,搜索的配置有了些许改变,自己在配置过程中,也记录下了一些入门的东西,希望能够对大家有所帮助. 1.配置搜索服务,首先需要启用搜索功能,基本思 ...
- xcodeheader search 配置
一般我们在xcode里面配置包含工程目录下头文件的时候,都要关联着相对路径和绝对路径,如果只是自己用这个项目,用绝对路径的问题不大,但是如果你把工程发给别人,别人就要在改这个绝对路径,这时候绝对路径的 ...
- cloudera search环境搭建搭建-solrcloud
转载:http://blog.csdn.net/xiao_jun_0820/article/details/40539291 本文基于Cloudera Manager5.0.0,所有服务基于CDH5. ...
- cloudera manager配置
cloudera manager的数据库配置文件位置: /etc/cloudera-scm-server/db.properties
随机推荐
- SQL 时间戳转DateTime类型
最近在工作中通过接口获取时间字段为时间戳的值,直接入库后再页面查询时间格式时候需要通过SQL语句将时间戳格式装换为时间格式进行比较,首先我们需要知道时间戳格式是怎么产生的,: Unix时间戳(Unix ...
- Java中join()方法的理解
thread.Join把指定的线程加入到当前线程,可以将两个交替执行的线程合并为顺序执行的线程. 比如在线程B中调用了线程A的Join()方法,直到线程A执行完毕后,才会继续执行线程B. t.join ...
- unittest笔记
学习资料: 官网: https://docs.python.org/2.7/library/unittest.html IBM Python自动单元测试框架: http://www.ibm.com/d ...
- Facade外观模式 笔记
Facede模式: 把内部系统复杂隐藏,提供一个方便统一的接口. 微波炉在界面简单操作下就可以烹饪出美味佳肴, 微波炉内部运作原理,各个组件互相交互运作,使用者并不需要关心. 而且关心的话可能没有多 ...
- Ubuntu Server安全Webserver搭建流程
之前整过CentOS.整了Ubuntu才发现,Ubuntu简单多了--不知道性能相比又怎样. 以Ubtuntu 14.04为例.记录一下搭建流程. 一.SSHserver 第一件事当然是ssh,默认安 ...
- java接口与抽象类的区别
接口可以是标志接口,里面没有任何常量和方法. 抽象类不一定必须有抽象方法,也可也没有方法,但含抽象方法的类必须被声明为抽象类. 在抽象层次结构中,Java接口在最上面,然后紧跟着抽象类,然后是一般类. ...
- [转] Transitions: Going from Shots to the Insulin Pump
Part three of our article series on the common phases of type 2 diabetes management By Lance Porter ...
- DELL RACADM 批量升级戴尔IDRAC固件
需求:通过服务器远程管理IP批量升级戴尔IDRAC固件 工具:racadm.ipmitool.Remote Access Configuration Tool 下载: 第一步,将要更新BMC IP写入 ...
- 图片跟着鼠标动js
<!DOCTYPE html><html><head> <title>duisgf</title> <meta charset=&qu ...
- git some cookies
*首先得配置和本地的操作实际上都很简单,忽略了:*git 添加远程仓库 git remote add 仓库名 url:*先pull下来,语法 git pull 远程仓库名 远程分支名[:当地分支名], ...