CentOS 6.4 配置 Hadoop 2.6.5

（以下所有文件：点此链接

里面还有安装的视频教学，我这里是亲测了一次，如有报错请看红色部分。实践高于理论啊兄弟们！！）

CentOS6.4版本：

一.安装CentOS 6.4 在VMWare虚拟机上，我设置的用户是hadoop，密码是hadoop；

二.安装完成后以root用户进入，密码还是之前设的密码hadoop。

配置网络：右键右上角符号，

Edit Connections

选择Edit

要想填这个，打开windows的命令行（直接win+R，输入cmd），输入ipconfig，查看无线局域网适配器的iPv4地址，子网掩码和默认网关，并填写到虚拟机的相对应位置（注意，ipv4的地址不能一样，最好改的就差一位就好），并虚拟机的DNS servers 输入8.8.8.8，8.8.4.4，Search domains输入4.4.4.4：（输入完后点击Apply，再点击close就可以了）

完成后桌面右键open int terminal，输入service network restart，显示下图时就完成了

打开Windows的命令行，输入ping （之前填的ipv4地址），ping通就成功了。

P.S.注意，关于网络配置这一部分，每次换一个网络环境就要重来一次，因为ipv4的地址会随着你的网络环境而变换。

error：我”service network restart“这里没成功：

解决方式：在terminal中输入以下命令行：

你会看见一直出现RTNETLINK answers: File exists。不用管他，输入service network restart，就成功了。

error：我又没ping通。。

1.设置虚拟机为桥接模式

VM -> Settings -> Network Adapter: Bridged

2.配置虚拟机的ip等信息

 修改ip: gedit /etc/sysconfig/network-scripts/ifcfg-eth0

# Advanced Micro Devices [AMD] 79c970 [PCnet32 LANCE]

DEVICE=eth0

BOOTPROTO=static

IPADDR=10.128.192.213  （主机ip:10.128.192.212）

NETMASK=255.255.192.0   （子网掩码同主机）

GATEWAY=10.128.192.1       （网关同主机）

BROADCAST=192.168.16.113

HWADDR=:0C::C9:0A:

ONBOOT=yes

重启服务 /etc/init.d/network restart

关闭Linux防火墙 chkconfig iptables off

关闭虚拟机的selinux：

gedit /etc/selinux/config 　　   //把SELINUX=enforcing改为SELINUX=disabled 

关闭windows防火墙（控制面板里）

关闭所有windows的杀毒软件（如果所有配置都做了，仍然不通，把杀毒软件关了试试）

三.后面的过程我们用一个工具，SecureCRT来完成。

连接过程如下图：

连接以后需要输入密码。

后面是一系列的命令行：

关闭防火墙：service iptables stop

chkconfig iptables off

vim /etc/selinux/config 　　   //把SELINUX=enforcing改为SELINUX=disabled ,需要输入时按i，退出保存是先按esc按钮，然后:wq!

修改主机名：vim /etc/sysconfig/network  //把HOSTNAME改为hadoop

修改映射关系：vim /etc/hosts  //添加一行 10.128.197.213　　hadoop（注意，中间不是一个空格，是一个tab）

重启机器：reboot

（这里重启完了以后虚拟机会重启，再从虚拟机登录进去后再用secureCRT连接）

P.S.有一个编译器叫gedit，如果是桌面安装的话可以直接用 gedit xxxx 命令，可以直接在文本上进行修改
P.S.这里重启后出错了，解决：点此链接

配置ssh：

ssh-keygen -t rsa  //四个回车键

ssh-copy-id 10.128.197.213

ssh 10.128.197.213  //此时不需要输入密码说明配置成功

CentOS7版本：
1.安装CentOS7
这里需要注意一下，和6.4版本不同，中间会有需要选择的地方。可以选择在安装过程中配置好网络，安装源。软件选择默认是最小安装，即不安装桌面环境。如果要安装桌面需要选择gnome桌面。

后面部分不分centos版本：
配置jdk：

创建文件夹（这个步骤实际上可以直接在虚拟机上手动完成，不一定要输入命令行）：

cd /home

rm -r hadoop  //删除home下的hadoop文件夹

mkdir softwares  //创建软件文件夹

mkdir data  //创建数据文件夹

mkdir tools  //创建放包的文件夹（注意，这三个文件夹都是在home目录下的）

rpm -qa|grep jdk  //查看系统是否自带jdk

rpm -qa|grep java  //还是在查看系统是否自带java

yum install -y lrzsz  //安装一个上传下载的插件（实际上这个没必要，直接从Windows里拖拽进去就好了，或者安装一个软件WinSCP                     

tar -zxf jdk-8u151-linux-x64.tar.gz -C ../software  //将jdk的包解压到software文件夹中   
                                       //顺便说一句，jdk的包真的很长，自己打特别不科学，你先写一个jdk然后按tab键就可以全部出来！！！很方便的有木有亲~

 cd /home/software/jdk1..0_151/    //进入jdk安装路径

pwd   //找到安装路径，复制

vim /etc/profile  //打开这个文件夹，加入:（注意啊，这两行后面部分千万不要加空格，否则就会报bash: export: `=': not a valid identifier 这个错）

export JAVA_HOME=/home/software/jdk1.8.0_151
export HADOOP_HOME=/home/software/hadoop-2.6.5

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

source /etc/profile  //保存执行
java -version   //检查是否java安装成功，下面出现版本号就是安装成功了

sudo权限配置：给hadoop用户也添加权限（注意，我此时还是root权限，如果不是root权限输入命令行 su，切换至root权限）

chmod u+w /etc/sudoers    //添加文件的写权限

vim /etc/sudoers

（中间是tab不是空格）

至此，hadoop的前置环境就配完了，接下来我们配hadoop环境。

打开Hadoop官网：http://hadoop.apache.org/，按照下面两个图片，进入Hadoop 2.6.5 的伪分布式安装配置中（注意，如果你要自己下载hadoop的安装包，请安装tar.gz结尾的那个，那个是有配置的，而不是src.tar.gz结尾的，无配置版本还要配置，时间花费很多）

同样，解压包到software里

tar -zxf /home/tools/hadoop-2.6..tar.gz -C /home/software/

tar -zxf /home/tools/protobuf-2.5..tar.gz -C /home/software/

tar -zxf /home/tools/apache-maven-3.0.-bin.tar.gz -C /home/software/

tar -zxf /home/tools/findbugs-1.3..tar.gz -C /home/software/

配置maven，findbugs环境路径：类似于上面的jdk配置，记得source重置，查看完成与否：mvn -v，findbugs -version

配置protobuf：

进入protobuf下：

cd /home/software/protobuf-2.5./

./configure

安装依赖：

yum -y install autoconf automake libtool cmake ncurses-devel openssl-devel lzo-devel zlib-devel gcc gcc-c++

再进入protobuf，重新configure一下
./configure
make install

error：使用yum时报错：Cannot find a valid baseurl for repo

解决方式：Cannot find a valid baseurl for repo: base

我在这篇博文里详细写了各种网搜的解决方法

下面就是配置Hadoop的各种配置文件了，这里推荐一个工具，notepad++，添加一个插件NppFTP.dll，远程连接虚拟机。安装包：点此链接

使用方法：点击上排最右边的按钮

右边出现工具栏

选择Profile settings，填写内容（自己的配置）：

点击连接：

如果连接不上，一种可能是没联网，一种可能是网络变动换ip地址了，虚拟机终端ifconfig查看IP地址

进入hadoop的安装目录，首先是etc/hadoop/hadoop-env.sh

export JAVA_HOME=/home/software/jdk1..0_151

然后是etc/hadoop/core-site.xml:(创建文件夹/home/software/hadoop-2.6.5/data/tmp)

<configuration>

<property>

        <name>fs.defaultFS</name>

        <value>hdfs://localhost:9000</value>

    </property>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/home/software/hadoop-2.6.5/data/tmp</value>

    </property>

</configuration>

etc/hadoop/hdfs-site.xml:

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>1</value>

    </property>

</configuration>

etc/hadoop/mapred-site.xml:(文件夹下原名mapred-site.xml.template，把名字改一下)

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

</configuration>

etc/hadoop/yarn-site.xml:

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

</configuration>

进入hadoop安装目录：

bin/hdfs namenode -format

sbin/start-dfs.sh

sbin/start-yarn.sh

输入命令行jps，查看几个运行（正常有6个）

如果不用hadoop，关闭进程：

sbin/stop-dfs.sh

sbin/stop-yarn.sh

error:bash: jps: command not found

解决：

cd

vim .bash_profile

里面path地方改成：

PATH=$PATH:$HOME/bin:/home/software/jdk1..0_151/bin

source .bash_profile

P.S.Linux中含有两个重要的文件 /etc/profile和.bash_profile 每当系统登陆时都要读取这两个文件，用来初始化系统所用到的变量，其中/etc/profile是超级用户所用，.bash_profile是每个用户自己独立的，我们可以修改该文件来设置一些变量。

实际上后来一直还是打不开，我也不知道为什么，总是找不到jps。两种方法，第一种就是找不到就source .bash_profile，第二种是进入jdk的安装目录，进入bin文件夹，打开终端，运行./jps。亲测可用。

至此，CentOS6.4下Hadoop 2.6.5的所有配置就完毕了。

error：后来改了配置以后，nodemanager消失了，这是改了配置以后会出现的问题。那么先stop两个sh，再重新format了以后再start就ok了。

CentOS 6.4 配置 Hadoop 2.6.5的更多相关文章

Centos 6.x 配置hadoop的环境变量
1.安装jdk 原来是用的rpm安装的1.7,所以先使用rpm -qa|grep jdk,找到安装的1.7后 rpm -e --nodeps xxx.使用securecrt把官网下载的jdk-8u18 ...
CentOS 配置hadoop
Hadoop是用作处理大数据用的,核心是HDFS.Map/Reduce.虽然目前工作中不需要使用这个,但是,技多不压身,经过虚拟机很多遍的尝试,终于将Hadoop2.5.2的环境顺利搭建起来了. ...
CentOS安装配置Hadoop 1.2.1（伪分布模式）
CentOS安装配置Hadoop1.2.1 1.下载安装文件下载2个安装文件 JAVA环境:jdk-6u21-linux-i586.bin Hadoop环境:hadoop-1.2.1.tar.gz ...
Linux环境安装Eclipse及配置hadoop插件
摘要:第一次使用hadoop,另外eclipse也不太熟悉,所以把自己在安装过程中得琐碎记录下来.以备以后查看. 硬软件环境: ▪ 虚拟机: VMware Workstation 11.0.0 bui ...
CentOS的网络配置（终端环境）
在虚拟机中安装了Server版的CentOS,用于做Hadoop相关的实验.Server版的CentOS默认是没有桌面环境的,eth0的网络默认也没有开启,需要我们手动启动网络. 关键配置说明网络和 ...
集群安装配置Hadoop具体图解
集群安装配置Hadoop 集群节点:node4.node5.node6.node7.node8. 详细架构: node4 Namenode,secondnamenode,jobtracker node ...
centos 4.4配置使用 and Nutch搜索引擎（第1期）_ Nutch简介及安装
centos 4.4配置使用 1.Nutch简介 Nutch是一个由Java实现的,开放源代码(open-source)的web搜索引擎.主要用于收集网页数据,然后对其进行分析,建立索引,以提供相应的 ...
Mac配置Hadoop最详细过程
Mac配置Hadoop最详细过程原文链接: http://www.cnblogs.com/blog5277/p/8565575.html 原文作者: 博客园-曲高终和寡 https://www.cn ...
CentOS 6.5配置SSH免密码登录
centos 系统对权限的设置非常微妙,如果权限设置大了则ssh 拒绝,如果权限小了,则ssh 更是被拒绝(我曾经配置好久没有打通,就是因为权限过大的原因) 参考链接:http://www.linux ...

随机推荐

Socket网络通信之数据传递
Socket通信的步骤: 1.创建ServerSocket和Socket 2.打开连接到Socket的输入/输出流 3.按照协议对Socket进行读/写操作 4.关闭输入输出流.关闭Socket 服务 ...
[记录]CentOS搭建SVN服务器(主从同步)
CentOS搭建SVN服务器(主从同步)1.安装步骤如下: 1)安装: #yum install subversion 2)查看安装位置: #rpm -ql subversion 3)查看版本: #/ ...
Linux系统软件安装的几种方式
Linux系统,一个文件能不能执行看的是有没有可执行权限x,不过真正的可执行文件是二进制文件(binary file),举例来说Linux上的c语言源码编写完后,通过gcc程序编译后就可以创建一个可执 ...
P2P技术如何将实时视频直播带宽降低75%？
本文内容来自学霸君资深架构师袁荣喜的技术分享. 1.前言实时视频直播经过去年的千播大战后已经成为互联网应用的标配技术,但直播平台的成本却一直居高不下,各个平台除了挖主播.挖网红以外,其背后高额的带宽 ...
js中checkbox的全选和反选的实现
<head> <meta charset="utf-8"/> <script type="text/javascript"> ...
Egret学习笔记 (Egret打飞机-4.添加主角飞机和实现飞行效果)
今天继续写点击了开始之后,添加一个飞机到场景中,然后这个飞机的尾巴还在冒火的那种感觉先拆解一下步骤 1.首先完成飞机容器的图片加载 2.然后把容器添加到场景中 3.然后实现动画 -首先,我们新建一个 ...
Django在form提交CSRF验证失败. 相应中断问题
CSRF验证失败. 相应中断. 1).首先,我们可以先看一下出现问题的所在的原因. Your browser is accepting cookies. The view function passe ...
Ansible自动化运维笔记2(Ansible的组件介绍)
1.Ansible Inventory (1)静态主机文件默认的ansible invetory是/etc/hosts文件,可以通过ANSIBLE_HOSTS环境变量或者通过运行命令的时候加上-i ...
java复习
局部变量的作用域只在方法内部有效,在方法外无效用类型作为形参传递会改变实参的值,但是String是特殊的引用类型,作为形参传递不会影响实参的值. HashMap非线程安全,在多个线程访问Hashta ...
OkHttp拆解之调用流程图

CentOS 6.4 配置 Hadoop 2.6.5

CentOS 6.4 配置 Hadoop 2.6.5的更多相关文章

随机推荐

热门专题