Zookeeper管理多个HBase集群
zookeeper是hbase集群的"协调器"。由于zookeeper的轻量级特性,因此我们可以将多个hbase集群共用一个zookeeper集群,以节约大量的服务器。多个hbase集群共用zookeeper集群的方法是使用同一组ip,修改不同hbase集群的"zookeeper.znode.parent"属性,让它们使用不同的根目录。比如cluster1使用/hbase-c1,cluster2使用/hbase-c2,等等。
使用以上方法有一个现实的问题:如何避免各集群的相互干扰?因为client的配置权是在用户手上,并不能保证用户永远是配置正确的,那么会产生某个用户访问了不该他访问的hbase集群。此时数据安全性成了很大的问题,甚至可能出现误删除数据。我们需要在zookeeper层屏弊掉该问题。
zookeeper3.x版本起自带了简单的ACL功能(注意3.3.x版本起不再支持按hostname来分配权限)。见:http://zookeeper.apache.org/doc/r3.3.2/zookeeperProgrammers.html#sc_ZooKeeperAccessControl。进行权限配置主要使用digest和ip两种方法。其中digest是用户密码方式,对用户来说使用上并不透明。ip配置最简单,对用户也是透明的,用户并不知道的情况下就能限制它的访问权限。
zookeeper将访问权限分为了五类:READ/WRITE/DELETE/CREATE/ADMIN,其中admin为最高权限。zookeeper的权限是到znode级别的,限制了某一个node的权限并不能限制它的子节点权限。
不过使用IP做权限配置方案有一个缺陷:必须指定具体的ip,而不能使用通配符或者范围一类的。这样对于大规模的权限设置是非常不方便的一件事,因此作者略调整了一下zookeeper的代码:
IPAuthenticationProvider.java
- /**
- * Licensed to the Apache Software Foundation (ASF) under one
- * or more contributor license agreements. See the NOTICE file
- * distributed with this work for additional information
- * regarding copyright ownership. The ASF licenses this file
- * to you under the Apache License, Version 2.0 (the
- * "License"); you may not use this file except in compliance
- * with the License. You may obtain a copy of the License at
- *
- * http://www.apache.org/licenses/LICENSE-2.0
- *
- * Unless required by applicable law or agreed to in writing, software
- * distributed under the License is distributed on an "AS IS" BASIS,
- * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
- * See the License for the specific language governing permissions and
- * limitations under the License.
- */
- package org.apache.zookeeper.server.auth;
- import org.apache.zookeeper.data.Id;
- import org.apache.zookeeper.server.ServerCnxn;
- import org.apache.zookeeper.KeeperException;
- public class IPAuthenticationProvider implements AuthenticationProvider {
- public String getScheme() {
- return "ip";
- }
- public KeeperException.Code
- handleAuthentication(ServerCnxn cnxn, byte[] authData)
- {
- String id = cnxn.getRemoteAddress().getAddress().getHostAddress();
- cnxn.getAuthInfo().add(new Id(getScheme(), id));
- return KeeperException.Code.OK;
- }
- // This is a bit weird but we need to return the address and the number of
- // bytes (to distinguish between IPv4 and IPv6
- private byte[] addr2Bytes(String addr) {
- byte b[] = v4addr2Bytes1(addr);
- // TODO Write the v6addr2Bytes
- return b;
- }
- private byte v4addr2Bytes(String part) throws NumberFormatException{
- try {
- int v = Integer.parseInt(part);
- if (v >= 0 && v <= 255) {
- byte b = (byte) v;
- return b;
- } else {
- throw new NumberFormatException("v < 0 or v > 255!");
- }
- } catch (NumberFormatException e) {
- throw e;
- }
- }
- private byte[] v4addr2Bytes1(String addr) {
- String parts[] = addr.split("\\.", -1);
- if (parts.length != 4) {
- return null;
- }
- byte b[] = new byte[4];
- for (int i = 0; i < 4; i++) {
- try {
- if(parts[i].split("/").length == 2){
- v4addr2Bytes(parts[i].split("/")[0]);
- v4addr2Bytes(parts[i].split("/")[1]);
- continue;
- }else{
- b[i] = v4addr2Bytes(parts[i]);
- }
- } catch (NumberFormatException e) {
- return null;
- }
- }
- return b;
- }
- public boolean matches(String id, String aclExpr) {
- String parts[] = aclExpr.split("/", 2);
- byte aclAddr[] = addr2Bytes(parts[0]);
- if (aclAddr == null) {
- return false;
- }
- byte endAclAddr[] = new byte[aclAddr.length];
- for(int i = 0; i < aclAddr.length; i ++){
- endAclAddr[i] = aclAddr[i];
- }
- if (parts.length == 2) {
- try {
- int end = Integer.parseInt(parts[1]);
- int e = endAclAddr[endAclAddr.length-1]<=0?endAclAddr[endAclAddr.length-1]+256:endAclAddr[endAclAddr.length-1];
- if(end < e|| end < 0 || end > 255)
- return false;
- endAclAddr[endAclAddr.length-1] = (byte)end;
- } catch (NumberFormatException e) {
- return false;
- }
- }
- byte remoteAddr[] = addr2Bytes(id);
- if (remoteAddr == null) {
- return false;
- }
- for (int i = 0; i < remoteAddr.length; i++) {
- int r = remoteAddr[i]<=0?(int)remoteAddr[i]+256:remoteAddr[i];
- int a = aclAddr[i]<=0?(int)aclAddr[i]+256:aclAddr[i];
- int e = endAclAddr[i]<=0?(int)endAclAddr[i]+256:endAclAddr[i];
- if (r < a || r > e) {
- return false;
- }
- }
- return true;
- }
- public boolean isAuthenticated() {
- return false;
- }
- public boolean isValid(String id) {
- return addr2Bytes(id) != null;
- }
- }
支持了使用/做为范围标识,比如进入hbase zkcli,执行:setAcl /test ip:192.168.0.3/10:cd,则将读写权限赋给了192.168.0.3-192.168.0.10这8台机器,其它机器将没有任何权限。
这样用同一个zookeeper管理多个集群、海量机器将不再有困扰。
最后写了一个帮助运维同学自动化管理zookeeper集群下多个hbase集群的ACL权限的工具,像以下这样:
- java -Djava.ext.dirs=libs/ -cp hbase-tools.jar dwbasis.hbase.tools.client.ZookeeperAcl aclFile.json
- Usage: ZookeeperAcl acljsonfile [-plan]
- /test/t ==> 'ip,'192.168.0.1
- :cdrwa
- /test ==> 'ip,'192.168.0.1/3
- :cdrwa
- /test ==> 'ip,'192.168.0.5
- :cdrwa
- do you really setAcl as above?(y/n)
补充:多集群共用zk后,每个集群的启动和停止不应该影响zk的稳定。因此请配置hbase-env.sh中export HBASE_MANAGES_ZK=false
Zookeeper管理多个HBase集群的更多相关文章
- 在python中使用zookeeper管理你的应用集群
http://www.zlovezl.cn/articles/40/ 简介: Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些 ...
- Kubernetes+Flannel 环境中部署HBase集群
2015-12-14注:加入新节点不更改运行节点参数需求已满足,将在后续文章中陆续总结. 注:目前方案不满足加入新节点(master节点或regionserver节点)而不更改已运行节点的参数的需求, ...
- Zookeeper集群和HBase集群
1.部署Zookeeper集群(hadoop0\hadoop1\hadoop2) 1.1.在hadoop0上解压缩Zookeeper-3.4.5.tar.gz 1.2.执行命令 cp conf/zoo ...
- 基于zookeeper+mesos+marathon的docker集群管理平台
参考文档: mesos:http://mesos.apache.org/ mesosphere社区版:https://github.com/mesosphere/open-docs mesospher ...
- 五、Zookeeper、Hbase集群搭建
一.前提 1.安装JDK 2.安装Hadoop 3.安装zoookeeper 1.加入zookeeper包,并解压tar -zxvf zookeeper-3.4.9.tar.gz 2.去/etc/pr ...
- ZooKeeper之(五)集群管理
在一台机器上运营一个ZooKeeper实例,称之为单机(Standalone)模式.单机模式有个致命的缺陷,一旦唯一的实例挂了,依赖ZooKeeper的应用全得完蛋. 实际应用当中,一般都是采用集群模 ...
- hbase集群的启动,注意几个问题
1.hbase的改的会影响器他的组件的使用, 故而, 在修改 hadoop的任何组件后, 一定要记得其它的组件也能受到影响, 一下是我在将hadoop的集群改了之后 , 再次运行hbase的时候, 就 ...
- hbase单机环境的搭建和完全分布式Hbase集群安装配置
HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库.它是面向列的,并适合于存储超大型松散数据.HBase适合于实时,随机对Big数据进行读写操作的业务环境. @hbase单机环境的搭建 ...
- HBase集群安装部署
0x01 软件环境 OS: CentOS6.5 x64 java: jdk1.8.0_111 hadoop: hadoop-2.5.2 hbase: hbase-0.98.24 0x02 集群概况 I ...
随机推荐
- 【java多线程系列】java中的volatile的内存语义
在java的多线程编程中,synchronized和volatile都扮演着重要的 角色,volatile是轻量级的synchronized,它在多处理器开发中保证了共享变量的可见性,可见性指的是当一 ...
- 在Android中使用AlarmManager
AlarmManager是Android中的一种系统级别的提醒服务,它会为我们在特定的时刻广播一个指定的Intent.而使用Intent的时候,我们还需要它执行一个动作,如startActivity, ...
- Spring中Bean多种实现切换方案
一个公共工程中的Spring配置文件,可能会被多个工程引用.因为每个工程可能只需要公共工程中的一部分Bean,所以这些工程的Spring容器启动时,需要区分开哪些Bean要创建出来.另一种场景是:想通 ...
- UNIX网络编程——shutdown 与 close 函数 的区别
假设server和client 已经建立了连接,server调用了close, 发送FIN 段给client(其实不一定会发送FIN段,后面再说),此时server不能再通过socket发送和接收数据 ...
- Oracle EBS R12文件系统结构(学习汇总网上资料)
Oracle EBS R12在服务器端文件结构如下: 顶层目录下面分为 1)inst --–跟ebs整个实例(instance)相关的配置信息以及其他信息 2) db ---主要存储DB层的信息 ...
- Android进阶(三)android httpClient 支持HTTPS的访问方式
项目中Android https请求地址遇到了这个异常(无终端认证): javax.net.ssl.SSLPeerUnverifiedException: No peer certificate 是S ...
- 【一天一道LeetCode】#112. Path Sum
一天一道LeetCode 本系列文章已全部上传至我的github,地址:ZeeCoder's Github 欢迎大家关注我的新浪微博,我的新浪微博 欢迎转载,转载请注明出处 (一)题目 Given a ...
- Gradle笔记——关于Gradle 1.12
到目前为止,Gradle已经出到2.1版本了,从1.12这个版本开始看,主要是因为我使用Gradle是Android开发所需要.公司里面是采用Android Studio来进行Android项目的开发 ...
- Material Design Library 23.1.0的新变化与代码实战
Design Library出来已经快有一个月了,当时大概看了一下介绍这个新版本变化的译文,内容不多,给我印象最深的就是Percent lib.AppBarLayout 和NavigationView ...
- 寻找第k元
要求:给定一个数组array[n],寻找大小排在第k的元素 思路一:最直接的思路就是先排序,这样可以直接通过数组下标找到第k大的元素,最好的快速排序时间复杂度为O(nlogn). 思路二:我们可以在快 ...