最近在学习hadoop,自己下了个视频教程,他的教学版本是hadoop0.20.2版本,现在的最新版本都到了3.0了,版本虽然有点老,但是还是学了一下,觉得有借鉴的价值. 不废话了,开始介绍: 先说一下环境:ubuntu14.04,其中要装上ssh open-server服务,装上jdk环境. 伪分布式模式安装和配置步骤如下图: 详细步骤 1 首先把文件导入linux系统(我用的ubuntu虚拟机,hadoop-0.20.2.tar.gz安装包放在了桌桌面).首先把这个安装包放在/opt目录下,…
Hadoop伪分布式安装之Linux环境准备 一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位 二.实现Linux服务器联网功能 网络适配器双击选择VMnet8 2.1 VMare NAT工作模式 只有CentOS和Windows中的VMnet8生成的虚拟网卡都在VMare虚拟网关字段中才能组成一个网络,实现联网功能. 2.2 VMare设置 1.打开VMare -> 编辑 -> 虚拟网络编辑器 2.VMnet8 -> NAT设置 ->…
Hadoop,简单理解为HDFS(分布式存储)+Mapreduce(分布式处理),专为离线和大规模数据分析而设计. Hadoop可以把很多linux的廉价PC组成分布式结点,然后编程人员也不需要知道分布式算法之类的,只需根据mapreduce的规则定义好的接口方法,剩下的就交给hadoop,它会自动把相关的计算分布到各个结点上去,然后得到结果. 比如,有一个1PB的文件,我们要分析其中的有用的数据,首先我们把1PB的数据文件导入到HDFS中,然后编程人员定义好map和reduce函数,也就是把文…
1. 准备工作 1.1. 软件准备 1.安装VMWare 2.在VMWare上安装CentOS6.5 3.安装XShell5,用来远程登录系统 4.通过rpm -qa | grep ssh 检查cent os 是否安装了ssh server和ssh client ,然后使用ssh localhost测试一下SSH是否可用. 如果没有安装那么使用下面的命令安装: yum install openssh-clients yum install openssh-server yum install o…
说明: 搭建环境是VMware10下用的是Linux CENTOS 32位,Hadoop:hadoop-2.4.1  JAVA :jdk7 32位:本文是本人在网络上收集的HADOOP系列视频所附带的课堂笔记(这里直接抄过来的,望原谅,我不是坏人),记录备忘. 开始前让我们简单修改下LINUX系统的JDK:一般情况下,我们都要将linux自带的OPENJDK卸载掉,然后安装SUN的JDK(下面的代码来源网络,请注意真实自己环境) <1> 查看已经安装的JAVA版本信息 # java -vers…
1. 配置linux系统环境 centos 6.4 下载地址:http://pan.baidu.com/s/1geoSWuv[VMWare专用CentOS.rar](安装打包好的VM压缩包) 并配置虚拟机网络连接为"仅主机模式"(使主机和虚拟机可以互通)      3.  设置虚拟机固定ip,设置好重启网络:service network restart            2. 关闭防火墙 1 2 3 4 5 6 su root service iptables stop #关闭防…
步骤1:修改IP 地址和主机名: vi /etc/sysconfig/network-scripts/ifcfg-eth0 如果该文件打开为空白文件代表你计算机上的网卡文件不是这个名称“ifcfg-eth0” ,可以 cd /etc/sysconfig/network-scripts/ 这个目录查看以ifcfg-***开头的文件,就是你的网卡文件.再进行编辑 vi /etc/sysconfig/network-scripts/ifcfg-*** 主要修改项为: BOOTPROTO="static…
hadoop的伪分布安装:一台实体机或虚拟机的安装. 环境:Windows7.VMWare.CentOS 1.1 设置ip地址 说明:在CentOS中的网络的类型: 仅主机模式:虚拟机在Windows外单独建立一个网 桥接模式:虚拟机的IP和Windows的IP在同一个局域网的同一网段,并且IP不能冲突,虚拟机可以访问Windows里的文件. 前期:在Windows中 在装好的CentOS中   开始:执行命令 service network restart         验证: ifconf…
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4       jdk8       hadoop-3.1.1 伪分布式就一台机器:主节点和从节点都在一个机器上,这里我们使用:node1 192.168230.11 一.平台和软件平台:GNU/Linux软件:JDK+SSH+rsync+hadoop3.1.1修改主机/etc/hosts和/etc/sysconfig/network: [切记]192.168.230.1…
0. 关闭防火墙 重启后失效 service iptables start ;#立即开启防火墙,但是重启后失效. service iptables stop ;#立即关闭防火墙,但是重启后失效. 重启后生效 chkconfig iptables on ;#开启防火墙,重启后生效 chkconfig iptables off ;#关闭防火墙,重启后生效 1. 配置主机 注意安装hadoop的集群主机名不能有下划线!!不然会找不到主机!无法启动! 配置主机名 # vim /etc/sysconfig…