CentOS 6.4 配置 Hadoop 2.6.5
(以下所有文件:点此链接
里面还有安装的视频教学,我这里是亲测了一次,如有报错请看红色部分。实践高于理论啊兄弟们!!)
CentOS6.4版本:
一.安装CentOS 6.4 在VMWare虚拟机上,我设置的用户是hadoop,密码是hadoop;
二.安装完成后以root用户进入,密码还是之前设的密码hadoop。
配置网络:右键右上角符号,
Edit Connections
选择Edit
要想填这个,打开windows的命令行(直接win+R,输入cmd),输入ipconfig,查看无线局域网适配器的iPv4地址,子网掩码和默认网关,并填写到虚拟机的相对应位置(注意,ipv4的地址不能一样,最好改的就差一位就好),并虚拟机的DNS servers 输入8.8.8.8,8.8.4.4,Search domains输入4.4.4.4:(输入完后点击Apply,再点击close就可以了)
完成后桌面右键open int terminal,输入service network restart,显示下图时就完成了
打开Windows的命令行,输入ping (之前填的ipv4地址),ping通就成功了。
P.S.注意,关于网络配置这一部分,每次换一个网络环境就要重来一次,因为ipv4的地址会随着你的网络环境而变换。
error:我”service network restart“这里没成功:
解决方式:在terminal中输入以下命令行:
你会看见一直出现RTNETLINK answers: File exists。不用管他,输入service network restart,就成功了。
error:我又没ping通。。
1.设置虚拟机为桥接模式
VM -> Settings -> Network Adapter: Bridged
2.配置虚拟机的ip等信息
修改ip: gedit /etc/sysconfig/network-scripts/ifcfg-eth0
# Advanced Micro Devices [AMD] 79c970 [PCnet32 LANCE]
DEVICE=eth0
BOOTPROTO=static
IPADDR=10.128.192.213 (主机ip:10.128.192.212)
NETMASK=255.255.192.0 (子网掩码同主机)
GATEWAY=10.128.192.1 (网关同主机)
BROADCAST=192.168.16.113
HWADDR=:0C::C9:0A:
ONBOOT=yes 重启服务 /etc/init.d/network restart
关闭Linux防火墙 chkconfig iptables off
关闭虚拟机的selinux: gedit /etc/selinux/config //把SELINUX=enforcing改为SELINUX=disabled 关闭windows防火墙(控制面板里)
关闭所有windows的杀毒软件(如果所有配置都做了,仍然不通,把杀毒软件关了试试)
三.后面的过程我们用一个工具,SecureCRT来完成。
连接过程如下图:
连接以后需要输入密码。
后面是一系列的命令行:
关闭防火墙:service iptables stop chkconfig iptables off vim /etc/selinux/config //把SELINUX=enforcing改为SELINUX=disabled ,需要输入时按i,退出保存是先按esc按钮,然后:wq! 修改主机名:vim /etc/sysconfig/network //把HOSTNAME改为hadoop 修改映射关系:vim /etc/hosts //添加一行 10.128.197.213 hadoop(注意,中间不是一个空格,是一个tab) 重启机器:reboot (这里重启完了以后虚拟机会重启,再从虚拟机登录进去后再用secureCRT连接)
P.S.有一个编译器叫gedit,如果是桌面安装的话可以直接用 gedit xxxx 命令,可以直接在文本上进行修改
P.S.这里重启后出错了,解决:点此链接 配置ssh:
ssh-keygen -t rsa //四个回车键
ssh-copy-id 10.128.197.213
ssh 10.128.197.213 //此时不需要输入密码说明配置成功
CentOS7版本:
1.安装CentOS7
这里需要注意一下,和6.4版本不同,中间会有需要选择的地方。可以选择在安装过程中配置好网络,安装源。软件选择默认是最小安装,即不安装桌面环境。如果要安装桌面需要选择gnome桌面。 后面部分不分centos版本:
配置jdk:
创建文件夹(这个步骤实际上可以直接在虚拟机上手动完成,不一定要输入命令行): cd /home rm -r hadoop //删除home下的hadoop文件夹 mkdir softwares //创建软件文件夹 mkdir data //创建数据文件夹 mkdir tools //创建放包的文件夹(注意,这三个文件夹都是在home目录下的) rpm -qa|grep jdk //查看系统是否自带jdk rpm -qa|grep java //还是在查看系统是否自带java yum install -y lrzsz //安装一个上传下载的插件(实际上这个没必要,直接从Windows里拖拽进去就好了,或者安装一个软件WinSCP tar -zxf jdk-8u151-linux-x64.tar.gz -C ../software //将jdk的包解压到software文件夹中
//顺便说一句,jdk的包真的很长,自己打特别不科学,你先写一个jdk然后按tab键就可以全部出来!!!很方便的有木有亲~ cd /home/software/jdk1..0_151/ //进入jdk安装路径 pwd //找到安装路径,复制 vim /etc/profile //打开这个文件夹,加入:(注意啊,这两行后面部分千万不要加空格,否则就会报bash: export: `=': not a valid identifier 这个错)
export JAVA_HOME=/home/software/jdk1.8.0_151
export HADOOP_HOME=/home/software/hadoop-2.6.5
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin source /etc/profile //保存执行
java -version //检查是否java安装成功,下面出现版本号就是安装成功了
sudo权限配置:给hadoop用户也添加权限(注意,我此时还是root权限,如果不是root权限输入命令行 su,切换至root权限)
chmod u+w /etc/sudoers //添加文件的写权限
vim /etc/sudoers
(中间是tab不是空格)
至此,hadoop的前置环境就配完了,接下来我们配hadoop环境。
打开Hadoop官网:http://hadoop.apache.org/,按照下面两个图片,进入Hadoop 2.6.5 的伪分布式安装配置中(注意,如果你要自己下载hadoop的安装包,请安装tar.gz结尾的那个,那个是有配置的,而不是src.tar.gz结尾的,无配置版本还要配置,时间花费很多)
同样,解压包到software里
tar -zxf /home/tools/hadoop-2.6..tar.gz -C /home/software/
tar -zxf /home/tools/protobuf-2.5..tar.gz -C /home/software/
tar -zxf /home/tools/apache-maven-3.0.-bin.tar.gz -C /home/software/
tar -zxf /home/tools/findbugs-1.3..tar.gz -C /home/software/
配置maven,findbugs环境路径:类似于上面的jdk配置,记得source重置,查看完成与否:mvn -v,findbugs -version
配置protobuf:
进入protobuf下:
cd /home/software/protobuf-2.5./
./configure
安装依赖:
yum -y install autoconf automake libtool cmake ncurses-devel openssl-devel lzo-devel zlib-devel gcc gcc-c++ 再进入protobuf,重新configure一下
./configure
make install
error:使用yum时报错:Cannot find a valid baseurl for repo
解决方式:Cannot find a valid baseurl for repo: base
我在这篇博文里详细写了各种网搜的解决方法
下面就是配置Hadoop的各种配置文件了,这里推荐一个工具,notepad++,添加一个插件NppFTP.dll,远程连接虚拟机。安装包:点此链接
使用方法:点击上排最右边的按钮
右边出现工具栏
选择Profile settings,填写内容(自己的配置):
点击连接:
如果连接不上,一种可能是没联网,一种可能是网络变动换ip地址了,虚拟机终端ifconfig查看IP地址
进入hadoop的安装目录,首先是etc/hadoop/hadoop-env.sh
export JAVA_HOME=/home/software/jdk1..0_151
然后是etc/hadoop/core-site.xml:(创建文件夹/home/software/hadoop-2.6.5/data/tmp)
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/software/hadoop-2.6.5/data/tmp</value>
</property>
</configuration>
etc/hadoop/hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
etc/hadoop/mapred-site.xml:(文件夹下原名mapred-site.xml.template,把名字改一下)
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
etc/hadoop/yarn-site.xml:
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
进入hadoop安装目录:
bin/hdfs namenode -format
sbin/start-dfs.sh
sbin/start-yarn.sh
输入命令行jps,查看几个运行(正常有6个)
如果不用hadoop,关闭进程:
sbin/stop-dfs.sh
sbin/stop-yarn.sh
error:bash: jps: command not found
解决:
cd
vim .bash_profile 里面path地方改成:
PATH=$PATH:$HOME/bin:/home/software/jdk1..0_151/bin source .bash_profile
P.S.Linux中含有两个重要的文件 /etc/profile和.bash_profile 每当系统登陆时都要读取这两个文件,用来初始化系统所用到的变量,其中/etc/profile是超级用户所用,.bash_profile是每个用户自己独立的,我们可以修改该文件来设置一些变量。
实际上后来一直还是打不开,我也不知道为什么,总是找不到jps。两种方法,第一种就是找不到就source .bash_profile,第二种是进入jdk的安装目录,进入bin文件夹,打开终端,运行./jps。亲测可用。
至此,CentOS6.4下Hadoop 2.6.5的所有配置就完毕了。
error:后来改了配置以后,nodemanager消失了,这是改了配置以后会出现的问题。那么先stop两个sh,再重新format了以后再start就ok了。
CentOS 6.4 配置 Hadoop 2.6.5的更多相关文章
- Centos 6.x 配置hadoop的环境变量
1.安装jdk 原来是用的rpm安装的1.7,所以先使用rpm -qa|grep jdk,找到安装的1.7后 rpm -e --nodeps xxx.使用securecrt把官网下载的jdk-8u18 ...
- CentOS 配置hadoop
Hadoop是用作处理大数据用的,核心是HDFS.Map/Reduce.虽然目前工作中不需要使用这个,但是,技多不压身,经过虚拟机很多遍的尝试,终于将Hadoop2.5.2的环境顺利搭建起来了. ...
- CentOS安装配置Hadoop 1.2.1(伪分布模式)
CentOS安装配置Hadoop1.2.1 1.下载安装文件 下载2个安装文件 JAVA环境:jdk-6u21-linux-i586.bin Hadoop环境:hadoop-1.2.1.tar.gz ...
- Linux环境安装Eclipse及配置hadoop插件
摘要:第一次使用hadoop,另外eclipse也不太熟悉,所以把自己在安装过程中得琐碎记录下来.以备以后查看. 硬软件环境: ▪ 虚拟机: VMware Workstation 11.0.0 bui ...
- CentOS的网络配置(终端环境)
在虚拟机中安装了Server版的CentOS,用于做Hadoop相关的实验.Server版的CentOS默认是没有桌面环境的,eth0的网络默认也没有开启,需要我们手动启动网络. 关键配置说明 网络和 ...
- 集群安装配置Hadoop具体图解
集群安装配置Hadoop 集群节点:node4.node5.node6.node7.node8. 详细架构: node4 Namenode,secondnamenode,jobtracker node ...
- centos 4.4配置使用 and Nutch搜索引擎(第1期)_ Nutch简介及安装
centos 4.4配置使用 1.Nutch简介 Nutch是一个由Java实现的,开放源代码(open-source)的web搜索引擎.主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的 ...
- Mac配置Hadoop最详细过程
Mac配置Hadoop最详细过程 原文链接: http://www.cnblogs.com/blog5277/p/8565575.html 原文作者: 博客园-曲高终和寡 https://www.cn ...
- CentOS 6.5配置SSH免密码登录
centos 系统对权限的设置非常微妙,如果权限设置大了则ssh 拒绝,如果权限小了,则ssh 更是被拒绝(我曾经配置好久没有打通,就是因为权限过大的原因) 参考链接:http://www.linux ...
随机推荐
- maven常用命令介绍
mvn 3.0.4 创建maven项目命令 mvn archetype:generate -DgroupId=damocles-autocredit -DartifactId=damocles ...
- 使用phpstorm提交svn代码版本管理系统遇到的问题解决办法
1.当自己提交代码的时候显示out of date的时候,表示我们本地的代码过时啦,需要更新一下再提交. 即:更新一下再提交即可. 2.当自己的代码和服务器上的冲突的时候,我们右键点击冲突的文件,选择 ...
- vue项目中遇到的问题
在 export defaul new Router({ )} 这个路由配置中一定要加mode : 'history' 否者就会在路由前面默认添加# 路由跳转的几种方式: 在VUE中使用less来编译 ...
- tcp/ip 卷一 读书笔记(2)物理层和链路层网络
物理层和链路层网络 术语 链路 是一对相邻结点间的物理线路,中间没有任何其他的交换结点. 数据链路 除了物理线路外,还必须有通信协议来控制这些数据的传输. 帧 数据链路层的协议数据单元(PDU) 串行 ...
- nodejs之socket.io模块——实现了websocket协议
Nodejs实现websocket的4种方式:socket.io.WebSocket-Node.faye-websocket-node.node-websocket-server,主要使用的是sock ...
- [微信JSSDK] 解决SDK注入权限验证 安卓正常,IOS出现config fail
实测有效 解决微信游览器和企业微信游览器JSSDK注入权限验证 安卓正常,IOS出现config fail 一开始我们想到的是可能微信这边的Bug,但细想一下应该不是.因为可能涉及到了IOS的底层原理 ...
- linux rsync实时同步
rsync同步 同步与复制的差异:复制:完全拷贝源到目标同步:增量拷贝,只传输变化过的数据 同步操作:remote sync 远程同步支持本地复制,或与其他ssh,rsync主机同步.官方网站:htt ...
- Linux基础一
基本命令 useradd xxx 创建一个用户 uname 查看系统架构信息 uname -a 显示详细信息 uname -r 显示内核信息 date 显示当前网络时间 cat ...
- MS SQL xp_instance_regwrite设置注册表疑惑
以前写过一篇博文"MS SQL 日志记录管理",里面介绍了如何设置SQL Server的错误日志的最大归档数量,如果在SSMS的UI界面设置,可以从"Manageme ...
- 把mmapv1存储引擎存储的mongodb3.0数据库数据复制到WiredTiger存储引擎的mongodb3.2中
mongodb3.0在mmapv1的存储引擎基础上添加了一个新的存储引擎WiredTiger.但是3.0的默认存储引擎依旧是mmapv1,因此我们项目之前也就用的默认方式. 但是mongodb更新实在 ...