chunjun同步两个带Kerberos认证的CDH集群数据

最近在项目中遇到同步两个 CDH 数据文件的需求，调研了一圈，发现 datax 不支持两个 cdh 同时进行 kerberos 认证，因此切换到 chunjun，chunjun 在 kerberos 认证的配置这块，官网也没有详细的介绍案例，在查看源代码后，确定了配置项及各配置项的值，供大家参考

  1 {

  2   "job": {

  3     "content": [

  4       {

  5         "reader" : {

  6           "parameter" : {

  7             "path" : "hdfs://cdh-test-namenode05:8020/user/hive/warehouse/testuser_db.db/testuser_user/t4.txt",

  8             "hadoopConfig" : {

  9               "properties.hadoop.user.name": "testuser",

 10               "properties.dfs.ha.namenodes.nameservice1": "namenode27,namenode29",

 11               "properties.fs.defaultFS": "hdfs://nameservice1",

 12               "properties.dfs.namenode.rpc-address.nameservice1.namenode27": "cdh-test-namenode04:8020",

 13               "properties.dfs.client.failover.proxy.provider.nameservice1": "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider",

 14               "properties.dfs.namenode.rpc-address.nameservice1.namenode29": "cdh-test-namenode05:8020",

 15               "properties.dfs.nameservices": "nameservice1",

 16               "properties.fs.hdfs.impl.disable.cache": "true",

 17               "properties.dfs.client.use.datanode.hostname":"true",

 18               "dfs.client.use.datanode.hostname":"true",

 19               "properties.fs.hdfs.impl": "org.apache.hadoop.hdfs.DistributedFileSystem",

 20               "hadoop.security.authentication": "Kerberos",

 21               "dfs.namenode.kerberos.principal": "hdfs/_HOST@CDHDEV.COM",

 22               "dfs.datanode.kerberos.principal": "hdfs/_HOST@CDHDEV.COM",

 23               "yarn.resourcemanager.principal": "rm/_HOST@CDHDEV.COM",

 24               "dfs.namenode.kerberos.internal.spnego.principal": "HTTP/_HOST@CDHDEV.COM",

 25               "hadoop.security.authorization": "true",

 26               "dfs.namenode.keytab.file": "/app/data/CDH6.3.2/kerberos/testuser.keytab",

 27               "java.security.krb5.conf": "/app/data/CDH6.3.2/krb5/krb5.conf",

 28               "useLocalFile": "true",

 29               "principalFile": "/app/data/CDH6.3.2/kerberos/testuser.keytab",

 30               "principal": "testuser/cdh-test-namenode05"

 31             },

 32

 33             "column": [

 34               {

 35                 "name": "id",

 36                 "type": "int"

 37               },

 38               {

 39                 "name": "name",

 40                 "type": "string"

 41               }

 42             ],

 43             "fieldDelimiter" : ",",

 44             "encoding" : "utf-8",

 45             "defaultFS": "hdfs://cdh-test-namenode05:8020",

 46             "fileType" : "text"

 47           },

 48           "name" : "hdfsreader"

 49         },

 50         "writer": {

 51           "name": "hdfswriter",

 52           "parameter": {

 53             "path": "/user/hive/warehouse/test_system_user.db/testuser",

 54             "defaultFS": "hdfs://test01:8020",

 55             "column": [

 56               {

 57                 "name": "id",

 58                 "type": "int"

 59               },

 60               {

 61                 "name": "name",

 62                 "type": "string"

 63               }

 64             ],

 65             "fileType": "text",

 66             "fieldDelimiter": ",",

 67             "compress":"gzip",

 68             "encoding": "utf-8",

 69             "fileName": "20220705",

 70             "writeMode": "overwrite",

 71             "hadoopConfig": {

 72               "properties.hadoop.user.name": "test_system_user",

 73               "properties.dfs.ha.namenodes.nameservice1": "namenode37,namenode51",

 74               "properties.fs.defaultFS": "hdfs://nameservice1",

 75               "properties.dfs.namenode.rpc-address.nameservice1.namenode51": "test02:8020",

 76               "properties.dfs.client.failover.proxy.provider.nameservice1": "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider",

 77               "properties.dfs.namenode.rpc-address.nameservice1.namenode37": "test01:8020",

 78               "properties.dfs.nameservices": "nameservice1",

 79               "properties.dfs.client.use.datanode.hostname":"true",

 80               "dfs.client.use.datanode.hostname":"true",

 81               "properties.fs.hdfs.impl.disable.cache": "true",

 82               "properties.fs.hdfs.impl": "org.apache.hadoop.hdfs.DistributedFileSystem",

 83               "hadoop.security.authentication": "Kerberos",

 84               "dfs.namenode.kerberos.principal": "hdfs/_HOST@SINOSIG.COM",

 85               "dfs.datanode.kerberos.principal": "hdfs/_HOST@SINOSIG.COM",

 86               "yarn.resourcemanager.principal": "rm/_HOST@SINOSIG.COM",

 87               "dfs.namenode.kerberos.internal.spnego.principal": "HTTP/_HOST@SINOSIG.COM",

 88               "hadoop.security.authorization": "true",

 89               "dfs.namenode.keytab.file": "/app/data/cloudera/CDH-6.3.2/kerberos/test_system_user.keytab",

 90               "java.security.krb5.conf": "/app/data/cloudera/CDH-6.3.2/krb5/krb5.conf",

 91               "useLocalFile": "true",

 92               "principalFile": "/app/data/cloudera/CDH-6.3.2/kerberos/test_system_user.keytab",

 93               "principal": "test_system_user/test02@SINOSIG.COM"

 94             }

 95           }

 96         }

 97       }

 98     ],

 99     "setting": {

100       "speed": {

101         "channel": 4,

102         "bytes": 0

103       }

104     }

105   }

106 }

chunjun同步两个带Kerberos认证的CDH集群数据的更多相关文章

Flink整合oozie shell Action 提交任务带kerberos认证
最近这段时间一直在忙新集群迁移,上了最新的cdh6.3.0 于是Flink 提交遇到了许多的问题还好有cloudera License 有了原厂的帮助和社区的伙伴,问题解决起来快了不少,手动滑稽集 ...
DBeaver链接kerberos安全认证的Phoenix集群
DBeaver链接kerberos安全认证的Phoenix集群最近公司的CDH集群,启动了kerberos安全认证,所有的用户验证全部需要依赖kerberos来进行.之前的裸奔集群,总算有了一些安全 ...
Eureka应用注册与集群数据同步源码解析
在之前的EurekaClient自动装配及启动流程解析一文中我们提到过,在构造DiscoveryClient类时,会把自身注册到服务端,本文就来分析一下这个注册流程客户端发起注册 boolean r ...
Elasticsearch多集群数据同步
有时多个Elasticsearch集群避免不了要同步数据,网上查找了下数据同步工具还挺多,比较常用的有:elasticserach-dump.elasticsearch-exporter.logsta ...
3、基于多播、安全认证的corosync集群(VIP、Httpd、Filesystem)
Messaging Layer --> CRM --> RA systemd:/usr/lib/systemd/system systemd有一个特性,即便一个服务开机启动,但是在 ...
利用新版本自带的Zookeeper搭建kafka集群
安装简要说明新版本的kafka自带有zookeeper,其实自带的zookeeper完全够用,本篇文章以记录使用自带zookeeper搭建kafka集群.1.关于kafka下载kafka下载页面:ht ...
MySqlNDB使用自带的ndb_setup.py安装集群
在用Mysql做集群时,使用Mysql的NDB版本更易于集群的扩展,稳定和数据的实时性. 我们可以使用Mysql自带的工具进行集群安装与管理:ndb_setup.py.位于Mysql的安装目录bin下 ...
mysql 集群数据同步
mysql集群配置在网站负载均衡中是必不可少的: 首先说下我个人准备的负载均衡方式: 1.通过nginx方向代理来将服务器压力分散到各个服务器上: 2.每个服务器中代码逻辑一样: 3.通过使用redi ...
手把手带你部署K8s二进制集群
集群环境准备: [etcd集群证书生成] #mkdir -p k8s/{k8s-cert,etcd-cert}#cd k8s/etcd-cert/ #cat > ca-config.json & ...
008 Ceph集群数据同步
介绍,目前已经创建一个名为ceph的Ceph集群,和一个backup(单节点)Ceph集群,是的这两个集群的数据可以同步,做备份恢复功能一.配置集群的相互访问 1.1 安装rbd mirror rb ...

随机推荐

SpringCloud(九) - Nginx
1.安装Nginx 1.1 解压上传安装包解压# nginx-1.16.1.tar.gz # nginx需要一些环境(全部执行,不存在的会执行,存在的会跳过) yum install -y wget ...
【题解】CF631B Print Check
题面传送门解决思路: 首先考虑到,一个点最终的情况只有三种可能:不被染色,被行染色,被列染色. 若一个点同时被行.列染色多次,显示出的是最后一次被染色的结果.所以我们可以使用结构体,对每一行.每一列 ...
C#11之原始字符串
最近.NET7.0和C#11相继发布,笔者也是第一时间就用上了C#11,其中C#11的有一个更新能解决困扰我多年的问题,也就是文章的标题原始字符串. 在使用C#11的原始字符串时,发现的一些有意思的东 ...
windows查看端口和杀掉端口
//执行下面命令 netstat --help 获取netstat的所有命令参数 //例如查看8080端口占用 netstat -ano | findstr 8080 //查看该端口是什么 taskl ...
.NET刷算法
BFS模板-宽度优先搜索(Breadth First Search) 1.模板 /// <summary> /// BFS遍历 /// </summary> /// <p ...
Go语言核心36讲46
我们今天要讲的是os代码包中的API.这个代码包可以让我们拥有操控计算机操作系统的能力. 前导内容:os包中的API 这个代码包提供的都是平台不相关的API.那么说,什么叫平台不相关的API呢? 它的 ...
Typora基本使用
Typora主要功能介绍 1.语言环境文件>>>偏好设置>>>系统语言 2.创建另一个编辑页面 ctrl+N 几乎所有软件的新建页面的快捷键都是它 3.保存文件 ...
第2-4-1章规则引擎Drools介绍-业务规则管理系统-组件化-中台
目录规则引擎 Drools 1. 问题引出 2. 规则引擎概述 2.1 什么是规则引擎 2.2 使用规则引擎的优势 2.3 规则引擎应用场景 2.4 Drools介绍规则引擎 Drools 全套代 ...
day24-服务器端渲染技术02
服务器端渲染技术02 11.EL表达式 11.1EL表达式介绍 EL表达式全称:Expression Language,是表达式语言 EL表达式主要是代替jsp页面的表达式脚本 EL表达式输出数据时, ...

chunjun同步两个带Kerberos认证的CDH集群数据

chunjun同步两个带Kerberos认证的CDH集群数据的更多相关文章

随机推荐

热门专题