cdh5 hadoop redhat 本地仓库配置
cdh5 hadoop redhat 本地仓库配置
cdh5 在网站上的站点位置:
http://archive-primary.cloudera.com/cdh5/redhat/6/x86_64/cdh/
在RHEL6上配置指向这个repo非常简单,只要把:
http://archive-primary.cloudera.com/cdh5/redhat/6/x86_64/cdh/cloudera-cdh5.repo
下载存储到本地即可:
/etc/yum.repos.d/cloudera-cdh5.repo
但是如果是离线情况下,网络连接不可用,就需要把整个资源镜像到本地,然后在cloudera-cdh5.repo中配置。我写了一个脚本,用于下载整个站点。虽然用wget一个命令可以搞定,为了练练shell脚本,我还是写了一个。基本思路就是分析网页,找到资源链接,存储到本地目录。脚本中:PATH_MUST_BE_EXSITED必须指向已经存在的本地目录。不废话,上代码:
#!/bin/bash # # @file # cdh5_rhel6-downloads.sh # # @date # 2014-12-18 # # @author # cheungmine # # @version # 0.0.1pre # # downloads all from CDH_URL_PREFIX: # http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh/ # ################################################################################ # specify where you want to save downloaded packages here: # PATH_MUST_BE_EXSITED="../libs/cdh" # get real path from relative path function real_path() { \cd "$1" /bin/pwd } # server dist resources: # CDH_URL_PREFIX="http://archive.cloudera.com/cdh5/redhat/6/x86_64/cdh" CDH_GPGKEY=$CDH_URL_PREFIX"/RPM-GPG-KEY-cloudera" CDH_REPO=$CDH_URL_PREFIX"/cloudera-cdh5.repo" CDH5_REPODATA=$CDH_URL_PREFIX"/5/repodata/" CDH5_RPMS_NOARCH=$CDH_URL_PREFIX"/5/RPMS/noarch/" CDH5_RPMS_X86_64=$CDH_URL_PREFIX"/5/RPMS/x86_64/" # source packages not used: CDH5_SRPMS=$CDH_URL_PREFIX"/5/SRPMS/" # get local absolute path for storing the downloaded: CDH5_LOCALPATH=$(real_path $PATH_MUST_BE_EXSITED) echo "**** downloaded packages will be stored in folder: "$CDH5_LOCALPATH # first we get index pages: # repodata_html=$CDH5_LOCALPATH"/.repodata.index.html" x86_64_html=$CDH5_LOCALPATH"/.x86_64.index.html" noarch_html=$CDH5_LOCALPATH"/.noarch.index.html" wget -c $CDH5_REPODATA -P $CDH5_LOCALPATH -O $repodata_html wget -c $CDH5_RPMS_NOARCH -P $CDH5_LOCALPATH -O $noarch_html wget -c $CDH5_RPMS_X86_64 -P $CDH5_LOCALPATH -O $x86_64_html wget -c $CDH_GPGKEY -P $CDH5_LOCALPATH wget -c $CDH_REPO -P $CDH5_LOCALPATH # download repodata # CDH5_REPODATA repodata_dir=$CDH5_LOCALPATH"/5/repodata" mkdir -p $repodata_dir echo -e "process file: '$repodata_html'" while read line do # start with: <td><a href=" a=`echo $line | sed -n '/<td><a href="/p'` if [ -n "$a" ]; then b=`echo $a | sed -n '/Parent Directory/p'` # do including: Parent Directory if [ -z "$b" ]; then # end with: </a></td> b=`echo $a | sed -n '/<\/a><\/td>/p'` if [ -n "$b" ]; then a=`echo $a | sed -e 's/.*<td><a href="//;s/">.*//'` url=$CDH5_REPODATA$a echo -e "download: $url" wget -c $url -P $repodata_dir -O $repodata_dir/$a fi fi fi done < $repodata_html # download noarch # CDH5_RPMS_NOARCH noarch_dir=$CDH5_LOCALPATH"/5/RPMS/noarch" mkdir -p $noarch_dir echo -e "process file: '$noarch_html'" while read line do # start with: <td><a href=" a=`echo $line | sed -n '/<td><a href="/p'` if [ -n "$a" ]; then b=`echo $a | sed -n '/Parent Directory/p'` # do including: Parent Directory if [ -z "$b" ]; then # end with: </a></td> b=`echo $a | sed -n '/<\/a><\/td>/p'` if [ -n "$b" ]; then a=`echo $a | sed -e 's/.*<td><a href="//;s/">.*//'` url=$CDH5_RPMS_NOARCH$a echo -e "download: $url" wget -c $url -P $noarch_dir -O $noarch_dir/$a fi fi fi done < $noarch_html # download x86_64 # CDH5_RPMS_X86_64 x86_64_dir=$CDH5_LOCALPATH"/5/RPMS/x86_64" mkdir -p $x86_64_dir echo -e "process file: '$x86_64_html'" while read line do # start with: <td><a href=" a=`echo $line | sed -n '/<td><a href="/p'` if [ -n "$a" ]; then b=`echo $a | sed -n '/Parent Directory/p'` # do including: Parent Directory if [ -z "$b" ]; then # end with: </a></td> b=`echo $a | sed -n '/<\/a><\/td>/p'` if [ -n "$b" ]; then a=`echo $a | sed -e 's/.*<td><a href="//;s/">.*//'` url=$CDH5_RPMS_X86_64$a echo -e "download: $url" wget -c $url -P $x86_64_dir -O $x86_64_dir/$a fi fi fi done < $x86_64_html # TODO: do we need to check all packages? # remove index pages: rm -f $repodata_html $x86_64_html $noarch_html echo "download all packages successfully."
上面脚本可以重复多次运行,不会重复下载。PATH_MUST_BE_EXSITED里面保存了cdh5全部内容。最后把PATH_MUST_BE_EXSITED的全部内容上传到本地ftp服务器上,确保可以访问:
ftp://your-server-ip/pub/libs/cdh/
然后在需要访问的RHEL6机器上,增加一个repo文件,我的是:
# /etc/yum.repos.d/cdh5.repo
[cloudera-cdh5] # Packages for Cloudera's Distribution for Hadoop, Version 5, on RedHat or CentOS 6 x86_64 name = Cloudera's Distribution for Hadoop, Version 5 baseurl = ftp://your-server-ip/pub/libs/cdh/5/ gpgkey = ftp://your-server-ip/pub/libs/cdh/RPM-GPG-KEY-cloudera gpgcheck = 1 enabled = 1
好了,cdh的本地仓库建好了。只要能访问到这个ftp的服务器中存在这个 /etc/yum.repos.d/cdh5.repo 文件,就可以安装cdh hadoop的软件包。比如安装个zookeeper服务端:
#Installing the ZooKeeper Base Package $ yum install zookeeper # Installing the ZooKeeper Server Package $ yum install zookeeper-server # start zookeeper-server $ service zookeeper-server init --myid=1 Using myid of 1
zookeeper安装在/usr/lib/zookeeper,进入bin目录启动和关闭:
$ zkServer.sh start $ zkServer.sh stop
OK!
cdh5 hadoop redhat 本地仓库配置的更多相关文章
- (三)Maven仓库介绍与本地仓库配置
1.Maven本地仓库/远程仓库的基本介绍 示意图: 本地仓库是指存在于我们本机的仓库,在我们加入依赖时候,首先会跑到我们的本地仓库去找,如果找不到则会跑到远程仓库中去找.对于依赖的包大家可以从这个地 ...
- Maven本地仓库配置
一. 为什么配置? 默认情况下,maven的本地仓库在C盘下用户文件夹: .m2/repository.全部的maven构件(artifact)都被存储到该仓库中.以方便重用. 可是放在C盘一个是占用 ...
- Java开发环境配置(4)--Maven安装 环境变量配置,本地仓库配置---插件安装
说明在前:本人用过的 luna mars 等,都已经自带maven插件的了,以下有些文章是很老的,讲到maven插件的安装都可以忽略掉. maven安装eclipse在线配置maven搞定所有插件_ ...
- Maven 教程(3)— Maven仓库介绍与本地仓库配置
原文地址:https://blog.csdn.net/liupeifeng3514/article/details/79537837 1.Maven本地仓库/远程仓库的基本介绍 本地仓库是指存在于我们 ...
- eclipse的maven配置及本地仓库配置
一.下载maven并解压 下载地址:http://maven.apache.org/download.cgi 解压后如下: 二.配置环境变量 配置MAVEN_HOME 再path中添加 安装成功 三. ...
- 淘淘商城 本地仓库配置和仓库jar包下载
SVN服务器的搭建请查看该文:<Win7 x64 svn 服务器搭建> 1:仓库包存放位置: 2:setting.xml 文件配置信息 <?xml version="1.0 ...
- gradle本地、远程仓库配置
本地仓库配置 配置环境变量GRADLE_USER_HOME,并指向你的一个本地目录,用来保存Gradle下载的依赖包. 远程仓库配置 一般Gradle.maven从中央仓库mavenCentral() ...
- gradle本地、远程仓库配置--转
https://blog.csdn.net/x_iya/article/details/75040806 本地仓库配置配置环境变量GRADLE_USER_HOME,并指向你的一个本地目录,用来保存Gr ...
- Maven本地仓库/中央仓库(阿里镜像)/JDK配置
第一步打开你已经下载好的Maven,进入:根磁盘:\......\apache-maven-3.6.2\conf文件夹找到settings.xml文件(没有的可以自行创建一个同名的文件即可) 使用文本 ...
随机推荐
- Scala:集合类型Collection和迭代器
http://blog.csdn.net/pipisorry/article/details/52902549 Scala Collection Scala 集合分为可变的和不可变的集合. 可变集合可 ...
- tomcat启动批处理——setclasspath.bat
除了上面两个批处理,还有一个比较重要的脚本,即是setclasspath.bat,它主要负责寻找.检查JAVA_HOME和JRE_HOME两个变量. ************************* ...
- Android Studio安装Genymotion插件
Android Studio安装Genymotion插件 Eclipse就不介绍了,谷歌都已经放弃Eclipse了,你还在坚持什么. 安装Genymotion 官网:https://www.genym ...
- FFmpeg的H.264解码器源代码简单分析:解码器主干部分
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
- Android性能优化之Listview(ViewHolder重用机制)
相信大家在很多时候都会用到ListView这个控件,因为确实是用的很多很多,但是有木有遇到过当数据很多很多的时候,往下滑ListView时有时候会卡顿,这就需要我们来优化它了. ListView优化主 ...
- OpenCV实时美颜摄像并生成H264视频流
为什么美颜摄像这么简单的功能,OpenCV这个开源项目网上很少有代码呢?对于在windows平台下,生成h264视频流也比价麻烦,没有现成的api可以使用,需要借助MinGw编译libx264,或者f ...
- 《java入门第一季》之对文件和字符串进行MD5加密工具类
上一篇介绍了MD5加密算法,之前写的代码有些冗余,而且可读性很差.今天把对文本数据的加密,以及获取文件的md5值做一个封装类.代码如下: package com.itydl.utils; import ...
- 简单RPC实现之Netty实现
所谓RPC就是远程方法调用(Remote Process Call ),简单的来说就是通过MQ,TCP,HTTP或者自己写的网络协议来传输我要调用对方的什么接口,对方处理之后再把结果返回给我.就这么 ...
- 使用JavaScript在Canvas上画出一片星空
随着Html5的迅猛发展,画布也变得越来越重要.下面我就写一个关于在canvas上画出一片星空的简单的代码的示例. 理论基础 初始化一个canvas,获得一个用于绘制图形的上下文环境context.并 ...
- UNIX环境高级编程——存储映射I/O(mmap函数)
共享内存可以说是最有用的进程间通信方式,也是最快的IPC形式,因为进程可以直接读写内存,而不需要任何数据的拷贝.对于像管道和消息队列等通信方式,则需要在内核和用户空间进行四次的数据拷贝,而共 ...