CDH6.3 Centos7
按照官方文档安装即可
CentOS7 上搭建 CDH(6.3.0)
官方文档:https://docs.cloudera.com/documentation/enterprise/6/6.3/topics/install_cm_cdh.html
LZO安装:https://blog.csdn.net/lingeio/article/details/94438582
Sqoop
一共分三步
- Adding the Sqoop 1 Client
- Installing the JDBC Drivers for Sqoop 1
- 下载JDBC驱动,放到目录/var/lib/sqoop/中
- Setting HADOOP_MAPRED_HOME for Sqoop 1
- 在/etc/profile中添加环境变量HADOOP_MAPRED_HOME
export HADOOP_MAPRED_HOME=/opt/cloudera/parcels/CDH-6.3.-.cdh6.3.2.p0./bin
export PATH=$PATH:$JAVA_HOME/bin:HADOOP_MAPRED_HOME
在/opt/cloudera/parcels/CDH-6.3.2-1.cdh6.3.2.p0.1605554/bin中有mapred文件
深入分析CDH的安装目录 https://blog.csdn.net/wj1314250/article/details/86494703
hadoop管理工具---CDH的目录结构了解 https://blog.csdn.net/zzq900503/article/details/79045955
测试
sqoop list-databases --connect jdbc:mysql://localhost:3306 --username root --password 000000
oozie
报错:
WARN org.apache.oozie.command.wf.ActionStartXCommand: SERVER[node01] USER[yarn] GROUP[-] TOKEN[] APP[gmv] JOB[--oozie-oozi-W] ACTION[--oozie-oozi-W@shell-e6c8] Error starting action [shell-e6c8]. ErrorType [TRANSIENT], ErrorCode [JA009], Message [JA009: Invalid resource request! Cannot allocate containers as requested resource is greater than maximum allowed allocation. Requested resource type=[memory-mb], Requested resource=<memory:, vCores:>, maximum allowed allocation=<memory:, vCores:>, please note that maximum allowed allocation is calculated by scheduler based on maximum resource of registered NodeManagers, which might be less than configured maximum allocation=<memory:, vCores:>
原因是yarn-site.xml中的两处配置值太小了,不满足作业的申请条件
把yarn-site.xml中的两处配置加大一点:
容器内存 yarn.nodemanager.resource.memory-mb
最大容器内存 yarn.scheduler.maximum-allocation-mb
报错:
WARN org.apache.oozie.action.hadoop.ShellActionExecutor: SERVER[node01] USER[yarn] GROUP[-] TOKEN[] APP[gmv] JOB[--oozie-oozi-W] ACTION[--oozie-oozi-W@shell-9dc9] Launcher exception: output.properties data exceeds its limit []
java.io.IOException: output.properties data exceeds its limit []
at org.apache.oozie.action.hadoop.LocalFsOperations.getLocalFileContentAsString(LocalFsOperations.java:)
at org.apache.oozie.action.hadoop.LauncherAM.processActionData(LauncherAM.java:)
at org.apache.oozie.action.hadoop.LauncherAM.handleActionData(LauncherAM.java:)
at org.apache.oozie.action.hadoop.LauncherAM.run(LauncherAM.java:)
at org.apache.oozie.action.hadoop.LauncherAM$.run(LauncherAM.java:)
at java.security.AccessController.doPrivileged(Native Method)
at javax.security.auth.Subject.doAs(Subject.java:)
at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:)
at org.apache.oozie.action.hadoop.LauncherAM.main(LauncherAM.java:)
输出大小默认是2048,在oozie-site.xml修改配置,重启
<property>
<name>oozie.action.max.output.data</name>
<value>204800</value>
</property> CDH中
CDH6.3 Centos7的更多相关文章
- CentOS7 Cloudera Manager6 完全离线安装 CDH6 集群
本文是在CentOS7.4 下进行CDH6集群的完全离线部署.CDH5集群与CDH6集群的部署区别比较大. 说明:本文内容所有操作都是在root用户下进行的. 文件下载 首先一些安装CDH6集群的必须 ...
- CentOS7部署CDH6.0.1大数据平台
Cloudera’s Distribution Including Apache Hadoop,简称“CDH”,基于Web的用户界面,支持大多数Hadoop组件,包括HDFS.MapReduce.Hi ...
- Centos7搭建CDH6.0.1(单机版)
一.前言. 学习大数据组件,最好的方式是直接参照官网.不过官网的教程也让我吃了一坑,在此记录一下.因在个人笔记本资源有限,在此安装为单机版安装 二.搭建. 1.1配置主机名 hostnamectl s ...
- CDH6离线安装
CentOS7下完全离线安装CDH6集群 CDH Linux 大数据 shareSHARE 245 浏览量 分享到微博 分享到 Twitter 分享到 QQ 本文是在CentOS7.5下进行C ...
- CDH6安装文档
1.准备工作 1.1 环境 centos7.jdk8.mysql5.7.python2.7.CDH6 1.2文件下载 1.2.1 cloudmanger地址 https://archive.cloud ...
- cloudera cdh6.3 离线安装 经典大数据平台视频教程(含网盘下载地址)
cdh6.3企业级大数据视频教程 链接:https://pan.baidu.com/s/1bLGrIwzpFQB-pQRb6KOmNg 提取码:i8h8 系统和软件版本1,操作系统:Centos7.6 ...
- CDH6.2离线安装(整理版)
1.概述 CDH,全称Cloudera's Distribution, including Apache Hadoop.是Hadoop众多分支中对应中的一种,由Cloudera维护,基于稳定版本的Ap ...
- CentOS7 上搭建 CDH(6.3.0)
这里以四台节点搭建 IP HostName OS 192.168.8.5 h5(主) CentOS 7.5 192.168.8.6 h6(从) CentOS 7.5 192.168.8.7 h7(从) ...
- ①CM+CDH6.2.0安装(全网最全)
CM+CDH6.2.0环境准备 一 虚拟机及CentOs7配置 CentOS下载地址 master(16g+80g+2cpu+2核)+2台slave(8g+60g+2cpu+2核) 1.1 打开&qu ...
随机推荐
- HDU 6024 Building Shops (简单dp)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6024 题意:有n个room在一条直线上,需要这这些room里面建造商店,如果第i个room建造,则要总 ...
- toutiao url
https://it.snssdk.com/article/v2/tab_comments/?group_id=6485899113563947533&item_id=648589911356 ...
- 【CDN+】 Hive 入门 以及Handoop 系统认知
前言 本文主要介绍Hive 的基础概念,以及Handoop的大体架构,组件依赖,对于大数据有个总体的认识 Hive 基础概念 官网:https://hive.apache.org/ The Apach ...
- Bootstrap FileInput
fileuploaded 事件 fileuploaded 事件是异步方法,如果在模态框中使用没上传完就释放模态框的内容会无法触发. $fileinput.on("fileuploaded&q ...
- spring4.1.8扩展实战之七:控制bean(BeanPostProcessor接口)
本章是<spring4.1.8扩展实战>的第七篇,我们来尝试在容器初始化的时候对bean实例做设置: 原文地址:https://blog.csdn.net/boling_cavalry/a ...
- VS2012生成Web时报未能找到元数据文件xxx.dll
问题:引用里已经添加了,还是报‘未能找到元数据文件xxx.dll’ 解决:添加了相同的不同路径的xxx.dll文件,删掉一个用不到的,就不报错了
- css负边距布局
三行三列的布局 代码结构 <div class="container"> <ul> <li>1</li> <li>2&l ...
- servlet--context域
ServletContext(重要) 一个项目只有一个ServletContext对象! 我们可以在N多个Servlet中来获取这个唯一的对象,使用它可以给多个Servlet传递数据! 与天地同寿!! ...
- C++学习笔记(四)--指针
1.指针(变量的地址): 指针变量:存放指针(地址)的变量 直接存取(访问):按变量地址取值 间接存取(访问):将变量的地址放入指针变量中 定义指针变量:基类型 *指针变量名 2.与指针有关的运算符: ...
- python网络编程之粘包
一.什么是粘包 须知:只有TCP有粘包现象,UDP永远不会粘包 粘包不一定会发生 如果发生了:1.可能是在客户端已经粘了 2.客户端没有粘,可能是在服务端粘了 首先需要掌握一个socket收发消息的原 ...