官方文档: http://www.cloudera.com/content/cloudera/en/documentation/core/latest/

博客教程 http://www.wangyongkui.com/hadoop-cdh5/

http://www.aboutyun.com/thread-9190-1-1.html

http://www.linuxidc.com/Linux/2014-03/98842.htm

CDH(Cloudera Distribution Hadoop)

官方教程 http://www.cloudera.com/content/cloudera/en/downloads/cdh/

在线安装

网站下的one-click-install目录选择对应的Linux系统版本号,自动添加安装源和进行相关配置,然后根据机器的功能进行下面的安装

Resource Manager host :

  sudo apt-get update; sudo apt-get install hadoop-yarn-resourcemanager
NameNode host running:

  sudo apt-get install hadoop-hdfs-namenode
Secondary NameNode host (if used) running:

  sudo apt-get install hadoop-hdfs-secondarynamenode
All cluster hosts except the Resource Manager running:

  sudo apt-get install hadoop-yarn-nodemanager hadoop-hdfs-datanode hadoop-mapreduce
One host in the cluster running:

  sudo apt-get install hadoop-mapreduce-historyserver hadoop-yarn-proxyserver
All client hosts running:

  sudo apt-get install hadoop-client

详细安装说明参见 http://www.cloudera.com/content/cloudera/en/documentation/core/latest/topics/cdh_ig_cdh5_install.html

离线安装

http://archive.cloudera.com/cdh5/cdh/5/ 独立功能包下载,不推荐,需要时间识别文件版本和安装到对应目录

http://archive.cloudera.com/cdh5/parcels/ 完整功能包 在Cloudera Manager中使用来部署

下载好相应系统版本的.parcel文件后,拷贝到本地的parcel源目录下(由Cloudera Manager Server指定,默认是/opt/cloudera/parcel-repo)

然后打开同目录下的mainfest.json(也要拷贝到其中)文件,从里面搜索到与你下载的包同名的部分,然后根据其hash值创建一个后缀名为.sha的文本文件,名字与下载的parcel同名,然后将sha文件也拷贝到本地parcel源的目录下。例如:

# cat > CDH-4.3.-.cdh4.3.0.p0.-el6.parcel.sha
df5cc61b2d257aaf625341f709a4f8e09754038a

总之,要确保/opt/cloudera/parcel-repo下面有三个文件:
CDH-4.3.0-1.cdh4.3.0.p0.22-el6.parcel
mainfest.json
CDH-4.3.0-1.cdh4.3.0.p0.22-el6.parcel.sha

cloudera-manager安装

离线安装文件目录http://archive.cloudera.com/cm5/cm/5/

下载tar.gz 解压

sudo tar -zxvf cloudera-manager-trusty-cm5..1_amd64.tar.gz -C /opt/cloudera

添加用户

sudo useradd --system --home=/opt/cloudera/cm-5.2./run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

配置服务器ip和端口(单机测试无须此步骤)

修改/etc/cloudera-scm-agent/config.ini 下面的 server_port 和 server_host

配置mysql数据库

从http://www.mysql.com/products/connector/下载JDBC,复制到CM目录下./share/cmf/lib

sudo cp /home/manhua/下载/mysql-connector-java-5.1.-bin.jar ./share/cmf/lib/

生成数据库

sudo apt-get install mysql-server
sudo ./share/cmf/schema/scm_prepare_database.sh mysql scm  -h localhost -u root -p root

install ssh

create no password sudo user

https://help.ubuntu.com/community/RootSudo

sudo visudo ,add the following to the END of the file

<username> ALL=NOPASSWD: ALL

由于我用的是linux mint,所以在安装时它会拒绝,需要修改lsb

sudo gedit /etc/lsb-release

DISTRIB_ID=LinuxMint
DISTRIB_RELEASE=17.1
DISTRIB_CODENAME=rebecca
DISTRIB_DESCRIPTION="Linux Mint 17.1 Rebecca"
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=14.04
DISTRIB_CODENAME=trusty
DISTRIB_DESCRIPTION="Linux Mint 17.1 Rebecca"

启动

sudo ./etc/init.d/cloudera-scm-server start

其中对于agents,scp复制CM的整个目录到相同位置后,运行

sudo ./etc/init.d/cloudera-scm-agent start

启动 Cloudera Manager 管理控制台

http://localhost:7180

用户名密码均为admin

然后用上面下载的cdh的parcel文件来安装

Cloudera的更多相关文章

  1. 免安裝、免設定的 Hadoop 開發環境 - cloudera 的 QuickStart VM

    cloudera 的 QuickStart VM,為一種免安裝.免設定 Linux 及 Hadoop,已幫你建好 CDH 5.x.Hadoop.Eclipse 的一個虛擬機環境.下載後解壓縮,可直接以 ...

  2. cloudera learning7:Hadoop资源管理

    Linux Control Groups(cgroups):在操作系统级别进行资源分配,可通过Cloudera Static Service Pools配置. YARN调度器配置:对运行在YARN上的 ...

  3. cloudera learning4:Hadoop集群规划

    涉及到一些关于硬件的东西,我也不是很懂,记录下来有待以后学习. Hadoop集群一般都是由小到大,刚开始可能只有4到6个节点,随着存储数据的增加,计算量的增大,内存需求的增加,集群慢慢变大. 比如按照 ...

  4. cloudera learning3:Hadoop配置和守护进程logs

    Services:Haddoop cluster上可以部署的组件,比如HDFS,YARN,HBase等. Roles:在service配置时,由Cloudera Manager创建.比如NameNod ...

  5. cloudera learning1:cloudera简介及安装

    cloudera分为两个部分:CDH和CM.CDH是Cloudera Distribution Hadoop的简称,顾名思义,就是cloudera公司发布的Hadoop版本,封装了Apache Had ...

  6. 通过Cloudera在hadoop生态圈中安装Sentry服务。

    写在张文章时,差点辣死我了.把sentry数据库密码搞掉了,导致hive,impala,hue都挂了.此事要引以为戒,以后要小心操作了. 安装Sentry服务 a)                在c ...

  7. cloudera cdh native lib

    如果通过命令行的方式安装cloudera 版本的hadoop,下载它的cdh版本. 解压后执行,你会发现报warning,没有native的库,lib/native是空的. 如何获取native的文件 ...

  8. 离线安装 Cloudera ( CDH 5.x )

    要配置生产环境前,最好严格按照官方文档/说明配置环境.比如,官方说这个安装包用于RETHAT6, CENTOS6,那就要装到6的版本下,不然很容易出现各种各样的错. 配置这个CDH5我入了很多坑,最重 ...

  9. Cloudera Manager 5和CDH5离线安装

    CDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Had ...

  10. 离线安装Cloudera Manager 5和CDH5(最新版5.1.3) 完全教程

    关于CDH和Cloudera Manager CDH (Cloudera's Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloud ...

随机推荐

  1. [NOI2011][bzoj2434] 阿狸的打字机 [AC自动机+dfs序+fail树+树状数组]

    题面 传送门 正文 最暴力的 最暴力的方法:把所有询问代表的字符串跑一遍kmp然后输出 稍微优化一下:把所有询问保存起来,把模板串相同的合并,求出next然后匹配 但是这两种方法本质没有区别,都是暴力 ...

  2. AutoDispose代替RxLifecycle优雅的解决RxJava内存泄漏问题

    使用过Rxjava的小伙伴都知道,在使用RxJava时如果处理不当,很可能会产生内存泄漏的问题. 我们使用rxjava最大的原因是响应式编程使我们的异步操作代码变得很优雅,在Android中,也使线程 ...

  3. 【APIO 练习题】Lock Puzzle

    题意 你有一个长度为 $n$ 的字符串,你需要经过若干次操作将其变成目标串 $n'$. 一次操作:选择串 $n$ 的一个后缀,将其翻转,并放到串 $n$ 的最前面. 请你输出任意一种方案.当然,你达到 ...

  4. L#中 int.TryParse 有问题

    今天发现了一个 L# 的异常..因此记录一下 List<string> strList = new List<string>(); ; i<; ++i) { ; j< ...

  5. 有关UITableView--cell复用问题

      近来用Tableview做了一个九宫格.过程中碰到了两个cell复用问题. 问题一: 在cell中为button添加addTarget点击事件时,出现后面的cell会重叠它前面cell的事件.代码 ...

  6. Java Class 与 Object

    平时看代码时,总是碰到这些即熟悉又陌生的名次,每天都与他们相见,但见面后又似曾没有任何的交集,所以今天我就来认识下这两个江湖侠客的背景: CLASS 在Java中,每个class都有一个相应的Clas ...

  7. 【HDOJ5556】Land of Farms(最大团)

    题意:给定n*m的网格图,上面只有字符'.' 和 数字0-9.其中数字表示这是该格是古老的土地,字符'.'表示该格只是普通的土地. 可以认为一块古老的农田由四联通的所有数字相同的格组成的块,一块普通的 ...

  8. Mysql同台机器主从配置

    Mysql主从配置 安装主Mysql 安装前的准备 检查系统是否存在mysql用户 [root@test mysql]# less /etc/passwd | grep mysql mysql:x:5 ...

  9. XPath语法 在C#中使用XPath例子与用法

    XPath可以快速定位到Xml中的节点或者属性.XPath语法很简单,但是强大够用,它也是使用xslt的基础知识.示例Xml: <?xml version="1.0" enc ...

  10. 【转载】SQL Server XML Path

    FOR XML PATH 有的人可能知道有的人可能不知道,其实它就是将查询结果集以XML形式展现,有了它我们可以简化我们的查询语句实现一些以前可能需要借助函数活存储过程来完成的工作.那么以一个实例为主 ...