Hadoop实战1：MapR在ubuntu集群中的安装

　　由于机器学习算法在处理大数据处理的时候在所难免的会效率降低，公司需要搭建hadoop集群，最后采用了商业版的Hadoop2（MapR）。

　　官网：　　http://doc.mapr.com/display/MapR/Installing+MapR+Software

　　一前期有一些集群的准备工作：

　　请参考本人前几篇集群搭建的总结文档及官方文档 http://doc.mapr.com/display/MapR/Preparing+Each+Node

　　二搭建MapR

　　1 创建本地仓库

　　1）root用户登陆，拥有最高权限

　　2）创建以下目录结构

~/mapr

.

├── dists

│   └── binary

│       └── optional

│           └── binary-amd64

└── mapr

　　3）下载两个文件到本地，url：注意替换相应的版本号: 本人使用的 v5.0.0

http://package.mapr.com/releases/v<version>/ubuntu/mapr-v<version>GA.deb.tgz

http://package.mapr.com/releases/ecosystem-5.x/ubuntu/mapr-ecosystem-5.x-<datestamp>.deb.tgz

　　文件共7G，比较大，网速好的时候下。并解压文件。

　　4）进入路径/root/mapr/，并创建文件 Packages.gz

dpkg-scanpackages . /dev/null | gzip -9c > ./dists/binary/optional/binary-amd64/Packages.gz

　　5）把路径 /root/mapr 下的所有文件移动到路径 /var/www/html 下。为了方便 Apache HTTP Server 发布。

　　2 安装 Apache HTTP Server

sudo apt-get apache2

　　验证安装成功：浏览器 http://127.0.0.1 显示欢迎页面

　　注意：apache 发布的文件默认路径在 /var/www/html

　　3 配置apt命令

　　1）配置文件/etc/apt/sources.list，增加下面的一行：

deb http://<host>/mapr binary optional

deb http://10.4.45.249/mapr binary optional

本人的hostname是apm，在hostname表中配置，并且绑定静态ip，这些都是准备工作，可以查看本人前几篇文。

　　2）更新sources.list文件：

apt-get update

　　4 安装mapr包的key：

wget -O - http://package.mapr.com/releases/pub/maprgpg.key | sudo apt-key add -

　　5 安装mapr的子模块：

apt-get install <package_name> <package_name> <package_name>

　　具体例：eq 安装mapr-fileserver mapr-tasktracker两个模块

apt-get install mapr-fileserver mapr-tasktracker

　　对应的安装自己需要的模块即可。

　　自动在本地下载这些依赖。

　　6 查看安装成功否

# ls -l /opt/mapr/roles

total

-rwxr-xr-x  root root  Aug  : fileserver

-rwxr-xr-x  root root  Aug  : tasktracker

-rwxr-xr-x  root root  Aug  : webserver

-rwxr-xr-x  root root  Aug  : zookeeper

　　说明 fileserver tasktracker webserver zookeeper 四个模块已经成功安装。

　　设置环境变量略，mapr的根目录在 /opt/mapr

　　插曲：开始本人使用联网下载方式安装这些模块，结果公司网络代理部给力，所以采用了本地的模式安装这个仓库。

　　若你也是这样，那一定要清空cache里的缓存，否则apt-get 的时候不会成功。

　　附录：各模块表，只参考YARN那一列即可：

Hadoop实战1：MapR在ubuntu集群中的安装的更多相关文章

Spark在集群中的安装
今天由于所以要安装spark做一些实验.我已有的环境是: 操作系统:CentOS6.5 hadoop:hadoop2.4.1 JDK:1.7 集群环境:四个节点闲话不说,以下是我的安装步骤: 说 ...
hadoop伪分布式集群搭建与安装（ubuntu系统）
1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...
Hadoop数据分析平台项目实战(基于CDH版本集群部署与安装)
1.Hadoop的主要应用场景: a.数据分析平台. b.推荐系统. c.业务系统的底层存储系统. d.业务监控系统. 2.开发环境:Linux集群(Centos64位)+Window开发模式(win ...
hadoop+tachyon+spark的zybo cluster集群综合配置
1.zybo cluster 架构简述: 1.1 zybo cluster 包含5块zybo 开发板组成一个集群,zybo的boot文件为digilent zybo reference design提 ...
Linux下Hadoop集群环境的安装配置
1)安装Ubuntu或其他Linux系统: a)为减少错误,集群中的主机最好安装同一版本的Linux系统,我的是Ubuntu12.04. b)每个主机的登陆用户名也最好都一样,比如都是hadoop,不 ...
Hadoop（五）搭建Hadoop客户端与Java访问HDFS集群
阅读目录(Content) 一.Hadoop客户端配置二.Java访问HDFS集群 2.1.HDFS的Java访问接口 2.2.Java访问HDFS主要编程步骤 2.3.使用FileSystem A ...
Hadoop学习笔记—13.分布式集群中节点的动态添加与下架
开篇:在本笔记系列的第一篇中,我们介绍了如何搭建伪分布与分布模式的Hadoop集群.现在,我们来了解一下在一个Hadoop分布式集群中,如何动态(不关机且正在运行的情况下)地添加一个Hadoop节点与 ...
Hadoop 2.6.4单节点集群配置
1.安装配置步骤 # wget http://download.oracle.com/otn-pub/java/jdk/8u91-b14/jdk-8u91-linux-x64.rpm # rpm -i ...
Hadoop集群中添加硬盘
Hadoop工作节点扩展硬盘空间接到老板任务,Hadoop集群中硬盘空间不够用,要求加一台机器到Hadoop集群,并且每台机器在原有基础上加一块2T硬盘,老板给力啊,哈哈. 这些我把完成这项任务的步 ...

随机推荐

android View的测量和绘制
本篇内容来源于android 群英传(徐易生著) 我写到这里,是觉得徐易生讲的确实很好, 另外加入了一些自己的理解,便于自己基础的提高. 另外参考:http://www.gcssloop.com/cu ...
Flink入门宝典（详细截图版）
本文基于java构建Flink1.9版本入门程序,需要Maven 3.0.4 和 Java 8 以上版本.需要安装Netcat进行简单调试. 这里简述安装过程,并使用IDEA进行开发一个简单流处理程序 ...
新手学习FFmpeg - 调用API调整视频局部速率
通过修改setpts代码实现调整视频部分的播放速率. 完整代码可参考: https://andy-zhangtao.github.io/ffmpeg-examples/ 在前面提到了PTS/DTS/T ...
Cookie的有效路径
程序实现: protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletE ...
charles 禁用缓存
本文参考:charles 禁用缓存 No caching Settings/无缓存工具的用法弹窗面板上一句话概括了他的工作原理:通过修改请求和响应头来防止缓存; 无缓存工具无缓存工具阻止客户端应用 ...
Spring+Mybatis整合的练手小项目（一）项目部署
声明:教程是网上找的,代码是自己敲的项目目录大致如下: 1. 首先创建Maven工程,在pom.xml中加入项目所需依赖: <?xml version="1.0" enco ...
创建进程池与线程池concurrent.futures模块的使用
一.进程池. 当并发的任务数量远远大于计算机所能承受的范围,即无法一次性开启过多的任务数量就应该考虑去限制进程数或线程数,从而保证服务器不会因超载而瘫痪.这时候就出现了进程池和线程池. 二.conc ...
学习方法分享：为何一年半就能拿到大厂 offer
毕竟是聊聊曾经,放一张大学课堂上灵光一现,手写的一个我曾经一直使用的网名前言原文地址:Nealyang/personalBlog 讲真,的确是运气,才有机会进大厂.也没想到,那篇一年半工作经验试水 ...
seo搜索引擎的优化方法
现在互联网的入口,一般都是被搜索引擎霸占.所以我们要想让别人搜索时,优先看到我们的网站.有两种方法: 1.竞价排名.这是需要钱的,给的钱越多,排名越靠前.参考某度.. 2.不想花钱,就使用seo搜索引 ...
敏捷测试--之scrum--原理
Scrum 是一个用于开发和维持复杂产品的框架 ,是一个增量的.迭代的开发过程.在这个框架中,整个开发过程由若干个短的迭代周期组成,一个短的迭代周期称为一个Sprint,每个Sprint的建议长度是2 ...

Hadoop实战1：MapR在ubuntu集群中的安装

Hadoop实战1：MapR在ubuntu集群中的安装的更多相关文章

随机推荐

热门专题