[大数据入门]实战练习 安装Cloudera-Hadoop集群
实验环境规划
Hostname |
IP | OS | Roles | |
Machine 0 | elephant | 192.168.124.131 | ||
Machine 1 | tiger | 192.168.124.132 | ||
Machine 2 | horse | 192.168.124.133 | ||
Machine 3 | monkey | 192.168.124.134 | ||
Machine 4 | lion | 192.168.124.135 |
虚拟机软件
vagrant
virtualbox
修改/etc/hosts
192.168.124.131 elephant
192.168.124.132 tiger
192.168.124.133 horse
192.168.124.134 monkey
192.168.124.137 lion
配置yum源
通过下面的文档查看repo信息
Cloudera Manager Version and Download Information
获取包来源
cd /etc/yum.repos.d
wget https://archive.cloudera.com/cm5/redhat/6/x86_64/cm/cloudera-manager.repo
安装 JDK
yum install -y oracle-j2sdk* echo -e 'export JAVA_HOME=/usr/java/default' >> /etc/profile
alternatives --install /usr/bin/java java /usr/java/jdk1.7.0_67-cloudera/bin/java 200
alternatives --set java /usr/java/jdk1.7.0_67-cloudera/bin/java
alternatives --install /usr/bin/javac javac /usr/java/jdk1.7.0_67-cloudera/bin/javac 200
alternatives --set javac /usr/java/jdk1.7.0_67-cloudera/bin/javac
设置数据库
数据库的指定,
默认的数据库,配置方法如下
1. 确认安装数据库包
2. 启动服务 service cloudera-scm-server-db start
[root@elephant x86_64]# service cloudera-scm-server-db start
The files belonging to this database system will be owned by user "cloudera-scm".
This user must also own the server process. The database cluster will be initialized with locale en_US.UTF8.
The default text search configuration will be set to "english". fixing permissions on existing directory /var/lib/cloudera-scm-server-db/data ... ok
creating subdirectories ... ok
selecting default max_connections ... 100
selecting default shared_buffers ... 32MB
creating configuration files ... ok
creating template1 database in /var/lib/cloudera-scm-server-db/data/base/1 ... ok
initializing pg_authid ... ok
setting password ... ok
initializing dependencies ... ok
creating system views ... ok
loading system objects' descriptions ... ok
creating conversions ... ok
creating dictionaries ... ok
setting privileges on built-in objects ... ok
creating information schema ... ok
vacuuming database template1 ... ok
copying template1 to template0 ... ok
copying template1 to postgres ... ok Success. You can now start the database server using: postgres -D /var/lib/cloudera-scm-server-db/data
or
pg_ctl -D /var/lib/cloudera-scm-server-db/data -l logfile start Adding configs
Creating SCM configuration file: /etc/cloudera-scm-server/db.properties
waiting for server to start.... done
server started
CREATE ROLE
CREATE DATABASE
Created db properties file /etc/cloudera-scm-server/db.properties
Creating DB amon for role ACTIVITYMONITOR
CREATE ROLE
CREATE DATABASE
Created DB for role ACTIVITYMONITOR
Creating DB rman for role REPORTSMANAGER
CREATE ROLE
CREATE DATABASE
Created DB for role REPORTSMANAGER
Creating DB nav for role NAVIGATOR
CREATE ROLE
CREATE DATABASE
Created DB for role NAVIGATOR
Creating DB navms for role NAVIGATORMETASERVER
CREATE ROLE
CREATE DATABASE
Created DB for role NAVIGATORMETASERVER
Enabled remote connections
waiting for server to shut down.... done
server stopped
DB initialization done.
waiting for server to start.... done
server started
使用mysql数据库,配置方法如下:
https://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.13.0/
[大数据入门]实战练习 安装Cloudera-Hadoop集群的更多相关文章
- 【大数据之数据仓库】安装部署GreenPlum集群
本篇将向大家介绍如何快捷的安装部署GreenPlum测试集群,大家可以跟着我一块儿实践一把^_^ 1.主机资源 申请2台网易云主机,操作系统必须是RedHat或者CentOS,配置尽量高一点.如果是s ...
- 流式大数据计算实践(2)----Hadoop集群和Zookeeper
一.前言 1.上一文搭建好了Hadoop单机模式,这一文继续搭建Hadoop集群 二.搭建Hadoop集群 1.根据上文的流程得到两台单机模式的机器,并保证两台单机模式正常启动,记得第二台机器core ...
- [大数据学习研究] 错误排查,Hadoop集群部分DataNode不能启动
错误现象 不知道什么原因,今天发现我的hadoop集群启动后datanode只有一台了,我的集群本来有三台的,怎么只剩一台了呢? 用jps命令检查一下,发现果然有两台机器的DataNode没有启动. ...
- 大数据平台搭建 - cdh5.11.1 - hadoop集群安装
一.前言 由于线下测试的需要,需要在公司线下(测试)环境搭建大数据集群. 那么CDH是什么? hadoop是一个开源项目,所以很多公司再这个基础上进行商业化,不收费的hadoop版本主要有三个,分别是 ...
- 大数据学习系列(7)-- hadoop集群搭建
1.配置ssh免登陆 #进入到我的home目录 cd ~/.ssh ssh-keygen -t rsa 执行完这个命令后,会生成两个文件id_rsa(私钥).id_rsa.pub(公钥) 将公钥拷贝到 ...
- CentOS6安装各种大数据软件 第五章:Kafka集群的配置
相关文章链接 CentOS6安装各种大数据软件 第一章:各个软件版本介绍 CentOS6安装各种大数据软件 第二章:Linux各个软件启动命令 CentOS6安装各种大数据软件 第三章:Linux基础 ...
- 使用yum安装CDH Hadoop集群
使用yum安装CDH Hadoop集群 2013.04.06 Update: 2014.07.21 添加 lzo 的安装 2014.05.20 修改cdh4为cdh5进行安装. 2014.10.22 ...
- 入门大数据---基于Zookeeper搭建Spark高可用集群
一.集群规划 这里搭建一个 3 节点的 Spark 集群,其中三台主机上均部署 Worker 服务.同时为了保证高可用,除了在 hadoop001 上部署主 Master 服务外,还在 hadoop0 ...
- 实战CentOS系统部署Hadoop集群服务
导读 Hadoop是一个由Apache基金会所开发的分布式系统基础架构,Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高 ...
随机推荐
- Web图片编辑控件发布-Xproer.ImageEditor
版权所有 2009-2014 荆门泽优软件有限公司 保留所有权利 官方网站:http://www.ncmem.com 产品首页:http://www.ncmem.com/webplug/image-e ...
- 编写高质量代码改善C#程序的157个建议——建议75:警惕线程不会立即启动
建议75:警惕线程不会立即启动 现代的大多数操作系统都不是一个实时的操作系统,Windows系统也是如此.所以,不能奢望我们的线程能够立即启动.Windows内部会实现特殊的算法以进行线程之间的调度, ...
- 深入理解java虚拟机(七)类加载的时机
Class 文件中描述的各种信息都必须加载到虚拟机中才能运行和使用.而虚拟机怎么加载这些Class 文件呢?Class 文件进入到虚拟机中会发生什么变化呢? 虚拟机类加载机制是指 虚拟机把描述类的数据 ...
- DLL的概念、dll导出类(转贴)
1. DLL的概念DLL(Dynamic Linkable Library),动态链接库,可以向程序提供一些函数.变量或类.这些可以直接拿来使用.静态链接库与动态链接库的区别:(1)静态链接库与动态链 ...
- VC6.0 如何显示代码行号
VC6.0是一款比较经典.稳定的功能强大的IDE,目前也有很多人在使用.但美中不足的是它不能像其他IDE那样显示行号.这里需要用到一个插件VC6LineNumberAddin, 下载地址:http:/ ...
- PyCharm社区版+Django搭建web开发环境-1
PyCharm开源社区版不像商业版那样可以直接通过Django来创建项目,必须通过以下几个步骤进行: 1. 创建项目:在cmd命令行下输入:django-admin startproject Demo ...
- Android-相对布局(RelativeLayout)
<?xml version="1.0" encoding="utf-8"?><RelativeLayout xmlns:android=&qu ...
- mybatis 单表的增删改查
添加数据返回id mapper.xml mapper -> insert -> selectKey mybatis 内置别名
- android的样式(style)与主题(theme)
Android上的Style分为了两个方面: 1,Theme是针对窗体级别的,改变窗体样式: 2,Style是针对窗体元素级别的,改变指定控件或者Layout的样式. Android系统的themes ...
- WinForm心得
如果有UI部分可以复用,那么可以单独设置为一个UserControl或者一个自定义子类控件 如果是单一一个控件,只是继承并修改了默认控件的样式行为,那么可以直接创建一个class并继承该控件,缺点是D ...