0.修改IP,主机名,hosts文件
setup 修改网卡IP
service network restart 重启网络服务使IP生效
vim /etc/sysconfig/network修改主机名
vim /etc/hosts/修改hosts文件
192.168.126.128 hadoop001
192.168.126.129 hadoop002
192.168.126.130 hadoop003
192.168.126.131 hadoop004
1.安装jdk环境
alt + p 打开远程连接SecureCRT远程传输工具sftp put c:/........tar.gz 把win上软件传到linux
mkdir -p /java/jdk 建多级文件夹
tar -zxvf jdk----.tar.gz -C /java/jdk 解压jdk到指定路径
vim /etc/profile 修改全局环境变量
export JAVA_HOME=/java/jdk/jdk1.7.0_65
export PATH=$JAVA_HOME/bin:$PATH
source /etc/profile重新加载配置文件
echo$JAVA_HOME打印变量JAVA_HOME
java -version查看环境变量配置是否成功
安装protobuf
tar -zxvf protobuf-2.5.0.tar.gz
cd protobuf-2.5.0
./configure --prefix=/opt
配置环境变量加入/opt/bin
protoc -–version
2.安装Hadoop
tar -zxvf hadoop-2.4.1.tar.gz -C /java/解压Hadoop
ls lib/native/查看解压目录下有哪些文件
cd etc/hadoop/进入配置文件目录
vim hadoop-env.sh修改配置文件环境变量(export JAVA_HOME=/java/jdk/jdk1.7.0_65)
*-site.xml*
vim core-site.xml修改配置文件(去官网找参数含义)
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop001:9000<value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/java/hadoop-2.4.1/tmp<value>
</property>
</configuration>
vim hdfs-site.xml修改hdfs配置文件
<configuration>
<property>
<!-- 副本数量,默认3 -->
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>
cp mapred-site.xml.template mapred-site.xml复制一份配置文件样本
vim mapred-site.xml修改mapreduce配置文件
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
vim yarn-site.xml配置yarn配置文件,也可以配置主机名,前提是修改hosts文件映射
<configuration>
<!-- Site specific YARN configuration properties -->
<!-- 主节点 -->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop001</value>
</property>
<!-- 从节点 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
vim slaves配置从节点(可以是主机名)
192.168.126.128
192.168.126.129
192.168.126.130
scp /java/hadoop-2.4.1/ root@192.168.126.129:/java/hadoop-2.4.1/复制到其他机器
cd /java/hadoop-2.4.1/bin
./hadoop namenode -format格式化HDFS文件系统(建文件和文件夹)
成功:INFO common.Storage: Storage directory /java/hadoop-2.4.1/tmp/dfs/name has been successfully formatted
3.启动
jps看java进程,此时什么都没有
cd sbin/到sbin下找启动命令
./start-dfs.sh启动hdfs
[root@hadoop001 sbin]# jps
2488 NameNode
2746 SecondaryNameNode
2872 Jps
2601 DataNode
[root@hadoop002 ~]# jps
2422 DataNode
2485 Jps
4.启动hdfs客户端
cd /java/hadoop-2.4.1/bin进入bin
./hdfs dfs -ls /查看hsfs /下内容
./hdfs dfs -put /root/install.log hdfs://hadoop001:9000/向hdfs文件系统存入文件(每块128M)
./hdfs dfs -ls /查看hsfs /下内容
ls /java/hadoop-2.4.1/tmp/dfs/查看文件保存位置(namenode,datanode)
ls /java/hadoop-2.4.1/tmp/dfs/(datanode)只有data文件夹
cd /java/hadoop-2.4.1/tmp/dfs/data/current/BP-343820156-192.168.126.128-1443868868316/current/finalized查看文件分了几块
./hdfs dfs -get hdfs://hadoop001:9000/install.log从hdfs上把文件下载下来(get后面指定下载的目录)
原理:
touch hadoop.tar.gz建一个空文件
cat block1 >> hadoop.tar.gz把block追加到hadoop.tar.gz
cat block2 >> hadoop.tar.gz 把block2追加到hadoop.tar.gz
./hdfs dfshdfs其他命令
./hdfs dfs -chown tangwan:hadoop /install.log改变hdfs文件用户所有者和组
./hdfs dfs -ls /install.log查看更改后状态
./hdfs dfs -chmod 600 /install.log更改权限
./hdfs dfs -ls /查看权限
改权限后用户依旧可以下载但是如果建一个文件夹给权限,就只能是指定权限用户上传
./hdfs dfs -df /查看hdfs还剩多少空间kb
./hdfs dfs -df -h /查看hdfs还剩多少空间M,G
./hdfs dfs -mkdir -p /aaa/bbb在hdfs创建文件夹
./hadoop fs -du -s / #查看hdfs占用空间
停止hdfs:
/java/hadoop-2.4.1/sbin进入sbin
./stop-dfs.sh停止hdfs
hadoop001:50070浏览器界面(可以下载不可以上传)
- Hadoop基础-HDFS集群中大数据开发常用的命令总结
Hadoop基础-HDFS集群中大数据开发常用的命令总结 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 本盘博客仅仅列出了我们在实际生成环境中常用的hdfs命令,如果想要了解更多, ...
- 大数据-HDFS 集群搭建的配置文件
1.HDFS简单版集群搭建相关配置文件 1.core-site.xml文件 <property> <name>fs.defaultFS</name> <val ...
- hadoop高可用集群搭建小结
hadoop高可用集群搭建小结1.Zookeeper集群搭建2.格式化Zookeeper集群 (注:在Zookeeper集群建立hadoop-ha,amenode的元数据)3.开启Journalmno ...
- hadoop namenode HA集群搭建
hadoop集群搭建(namenode是单点的) http://www.cnblogs.com/kisf/p/7456290.html HA集群需要zk, zk搭建:http://www.cnblo ...
- 大数据之Hadoop完全分布式集群搭建
1.准备阶段 1.1.新建三台虚拟机 Hadoop完全分市式集群是典型的主从架构(master-slave),一般需要使用多台服务器来组建.我们准备3台服务器(关闭防火墙.静态IP.主机名称).如果没 ...
- 从零自学Hadoop(06):集群搭建
阅读目录 序 集群搭建 监控 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 上一 ...
- hadoop伪分布式集群搭建与安装(ubuntu系统)
1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...
- hadoop HA分布式集群搭建
概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...
- 1、hadoop HA分布式集群搭建
概述 hadoop2中NameNode可以有多个(目前只支持2个).每一个都有相同的职能.一个是active状态的,一个是standby状态的.当集群运行时,只有active状态的NameNode是正 ...
随机推荐
- Angular通过CORS实现跨域方案
以前有一篇很老的文章网上转了很多,包括现在如果你百度"跨域"这个关键字,前几个推荐的都是"Javascript跨域总结与解决方案".看了一下感觉手段有点陈旧了, ...
- charles抓包工具的中文乱码解决方法
charles是 MAC上最好用的抓包工具.charles 网上的参考文档已经很多,我就不再赘述啦.只是说说我在安装过程遇到的问题和解决方法,仅供参考. charles抓包的数据中的中文内容显示乱码, ...
- Elasticsearch之client源码简要分析
问题 让我们带着问题去学习,效率会更高 1 es集群只配置一个节点,client是否能够自动发现集群中的所有节点?是如何发现的? 2 es client如何做到负载均衡? 3 一个es node ...
- jquery cdn/////////////////zzz
jquery-2.1.1 注:jquery-2.0以上版本不再支持IE 6/7/8)百度引用地址 (推荐目前最稳定的,不会出现延时打不开情况) 百度压缩版引用地址:<script src=&qu ...
- 在virtualbox中安装CentOS-7
当初才接触linux的时候,因为条件限制,只能在虚拟机中安装linux系统使用,由于是小白,爬了好多坑.于是决定写一篇关于在虚拟机中安装linux系统的博客.一是为了巩固自己的知识,二是希望能够对新手 ...
- [osx] android studio下修改avd的hosts文件
1. 启动avd 安装/启动avd就不说啦,可以直接在android studio里面操作的 2. 进入adb目录 当然是打开终端来敲命令啦. cd /Users/birdylee/Library/A ...
- Apache Commons CLI官方文档翻译 —— 快速构建命令行启动模式
昨天通过几个小程序以及Hangout源码学习了CLI的基本使用,今天就来尝试翻译一下CLI的官方使用手册. 下面将会通过几个部分简单的介绍CLI在应用中的使用场景. 昨天已经联系过几个基本的命令行参数 ...
- Subversion Edge
http://www.collab.net/downloads/subversion#tab-1
- jquery 重写 ajax提交并判断权限后 使用load方法报错解决方法
jQuery(function ($) { // 备份jquery的ajax方法 var _ajax = $.ajax; // 重写ajax方法,先判断登录在执行succes ...
- MaxScale:实现MySQL读写分离与负载均衡的中间件利器
1. MaxScale 是干什么的? 配置好了 MySQL 的主从复制结构后,我们希望实现读写分离,把读操作分散到从服务器中,并且对多个从服务器能实现负载均衡. 读写分离和负载均衡 是MySQL集群的 ...