一伪分布模式
            特点:在单机上,模拟一个分布式的环境,具备Hadoop的所有功能
                    HDFS:NameNode + DataNode + SecondaryNameNode
                    Yarn:ResourceManager + NodeManager
                    
            (*)hadoop-env.sh    JAVA_HOME    /root/training/jdk1.8.0_144
 
1:进入Hadoop目录下
            cd ~/training/hadoop-2.7.3/etc/hadoop
进入之后如下只有有个
 
 
 
二:需要配置的文件目录如下:
首先进行配置  (*)hdfs-site.xml
            
                    <!--配置数据块的冗余度,默认是3-->
                    <!--原则冗余度跟数据节点个数保持一致,最大不要超过3-->
                    <property>    
                        <name>dfs.replication</name>
                        <value>1</value>
                    </property>
 
                    <!--是否开启HDFS的权限检查,默认是true-->
                    <!--使用默认值,后面会改为false-->
                    <!--
                    <property>    
                        <name>dfs.permissions</name>
                        <value>false</value>
                    </property>                
                    -->      
              
(1)将如上代码放入到  hdfs-site.xml中的  
        进行命令 进入到hdfs-site.xml文件中  vi hdfs-site.xml  
并将上面的配置信息放入<configuration> </configuration>中,保存并退出。如下:
 
 
 
(2)进行配置   (*)core-site.xml
            
                    <!--配置HDFS主节点的地址,就是NameNode的地址-->
                    <!--9000是RPC通信的端口-->
                    <property>    
                        <name>fs.defaultFS</name>
                        <value>hdfs://bigdata111:9000</value>
                    </property>    
 
                    <!--HDFS数据块和元信息保存在操作系统的目录位置-->
                    <!--默认是Linux的tmp目录,一定要修改-->
                    <property>    
                        <name>hadoop.tmp.dir</name>
                        <value>/root/training/hadoop-2.7.3/tmp</value>
                    </property>
 
首先创建一个tmp目录在 /root/training/hadoop-2.7.3 下。
 
             (因为 HDFS数据块和元信息保存在操作系统的目录位置。。-默认是Linux的tmp目录,一定要修改。默认的tmp目录特点是一开机这里面的所有文件都会被删除了的)
 
返回到cd ../etc/hadoop/。进行命令  vi core-site.xml。然后将以上的配置信息加入到配置文件中的<configuration> </configuration>中,保存并退出
      如下:
 
 
 
(3)进行配置(*)mapred-site.xml(默认没有这个文件)
   而默认是mapred-site.xml.template。
 
 <!--MR程序运行容器或者框架-->
                    <property>    
                        <name>mapreduce.framework.name</name>
                        <value>yarn</value>
                    </property>        
*********************************************************************8
 
这里我们将这个文件改为mapred-site.xml
    命令: mv mapred-site.xml.template mapred-site.xml
 
 
vi mapred-site.xml
            将以上配置信息写入该配置文件中。保存并退出
 
                   
 
(4)进行配置(*)yarn-site.xml
 
                    <!--配置Yarn主节点的位置-->
                    <property>    
                        <name>yarn.resourcemanager.hostname</name>
                        <value>bigdata111</value>
                    </property>            
 
                    <!--NodeManager执行MR任务的方式是Shuffle洗牌-->
                    <property>    
                        <name>yarn.nodemanager.aux-services</name>
                        <value>mapreduce_shuffle</value>
                    </property>    
                    
进入该配置文件。
        vi yarn-site.xml
并将如上的配置信息放入到里面。保存并退出
 
 
(5)将如上配置信息配置完成后并没结束。还要 对HDFS的NameNode进行格式化  -----> 目录:/root/training/hadoop-2.7.3/tmp
                    举例:软盘,需要格式化
                    
                    命令:hdfs namenode -format
                    日志:Storage directory /root/training/hadoop-2.7.3/tmp/dfs/name has been successfully formatted.  如果出现该日志则表明格式化成功
 
 
三:欧克,以上伪分布就已经完全部署上了。看看我们的成果吧!!
首先来启动一下。直接启动所有  start-all.sh
        
            (*)启动:
                    HDFS:start-dfs.sh
                    Yarn: start-yarn.sh
                    统一的:start-all.sh
  
这里由于没有设置免密码。启动的时候要输入4次密码。。哦!对了,在启动的过程中会提示是否继续。记得按yes哦!!!
 
 
 
输入jps查看进程:
    如果出现入下信息则表示启动成功!!
还可以进行网页端查看  。在浏览器中输入http://192.168.40.111:8088/cluster/apps    hdfs端口
                                                                http://192.168.40.111:50070/dfshealth.html#tab-datanode   yarn端口
      进行查看
 Web Console访问:hdfs: 端口: 50070
                                     yarn: 端口:8088
 
 
 
 

Linux中伪分布的搭建的更多相关文章

  1. 通过win下的eclipse连接虚拟机中伪分布的hadoop进行调试

    VMware虚拟机配置Ubuntu桥接方式(Bridged)使虚拟机和宿主机能互相ping通, 通过win下的eclipse连接虚拟机中伪分布的hadoop进行调试 1.设置Bridged上网方式 V ...

  2. Hadoop.2.x_伪分布环境搭建

    一. 基本环境搭建 1. 设置主机名.静态IP/DNS.主机映射.windows主机映射(方便ssh访问与IP修改)等 设置主机名: vi /etc/sysconfig/network # 重启系统生 ...

  3. Hadoop之伪分布环境搭建

    搭建伪分布环境 上传hadoop2.7.0编译后的包并解压到/zzy目录下 mkdir /zzy 解压 tar -zxvf hadoop.2.7.0.tar.gz -C /zzy     配置hado ...

  4. Hadoop2.6.0伪分布环境搭建

    用到的软件: 一.安装jdk: 1.要安装的jdk,我把它拷在了共享文件夹里面.   (用优盘拷也可以) 2.我把jdk拷在了用户文件夹下面. (其他地方也可以,不过路径要相应改变) 3.执行复制安装 ...

  5. Linux中samba服务器的搭建

    使用的vmware12虚拟机安装的centos6.8和物理机上的windows10,实现在windows10 上访问CentOs上的samba服务. 一.先查看系统中是否安装有samba服务相关的软件 ...

  6. Linux 中NFS服务器的搭建

    serve端IP:192.168.2.128 客户端IP:192.168.2.131 server端配置: 1.安装nfs,rpcbind,可以参考Linux 中yum的配置来安装: yum inst ...

  7. hadoop-2.7.1伪分布环境搭建

    1.准备Linux环境  1.0 点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet i ...

  8. hbase 单机+伪分布环境搭建学习-1

    1.单机模式: (1)编辑hbase-env.sh user@EBJ1023.local:/usr/local/flume_kafka_stom/hbase_1.1.2> vim conf/hb ...

  9. Linux中Zabbix4.0的搭建

    Zabbix简介 Zabbix是一个高度集成的企业级开源网络监控解决方案,与Cacti.nagios类似,提供分布式监控以及集中的web管理界面.zabbix具备常见商业监控软件所具备的功能,例如主机 ...

随机推荐

  1. UVA - 11427 Expect the Expected (概率dp)

    Some mathematical background. This problem asks you to compute the expected value of a random variab ...

  2. 爬虫综合大作业——网易云音乐爬虫 & 数据可视化分析

    作业要求来自于https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 爬虫综合大作业 选择一个热点或者你感兴趣的主题. 选择爬取的对象 ...

  3. SDOI 2019 R1 摸鱼记

    Day -1 学文化课第一天,也是这周最后一天. 昨晚 mxl 让我们今天下午放学走,大概六点的样子,感觉良好. 早读班主任送来请假条,跟我讲中午放学走??? 很懵逼,以为班主任口胡了,问了一句&qu ...

  4. django中引入bootstrap4.3

    1.下载bootstrap4.3的包:https://getbootstrap.com/ 2.将下载后的文件放在project下新创建的static目录下.例如我的project是mysite,则放在 ...

  5. cmake 递归依赖

    现在有3个模块:main.service.base,main依赖service的service.h.service依赖base的base.h,怎么写CMakeList.txt避免main直接耦合bas ...

  6. [Android] Android Build 时报错: java.io.IOException: Could not parse XML from android/accounts/annotations.xml

    Android构建时报错: app:lintVitalRelease[Fatal Error] :3:214: 与元素类型 “item” 相关联的 “name” 属性值不能包含 ‘<’ 字符. ...

  7. <HTML>页面与互联网

    托管 1.数据传输:托管公司允许你在一定时间内向访问者发送的页面和数据量. 2.备份:公司是否对你的页面定期备份,从而在服务器出现硬件故障时能够恢复. 域名 www.starbuzzcoffee.co ...

  8. 【LOJ 6041】「雅礼集训 2017 Day7」事情的相似度

    Description 人的一生不仅要靠自我奋斗,还要考虑到历史的行程. 历史的行程可以抽象成一个 01 串,作为一个年纪比较大的人,你希望从历史的行程中获得一些姿势. 你发现在历史的不同时刻,不断的 ...

  9. JS数组(JSON)整合篇-方法整理

    遍历:arr_Param.forEach(function (item, i) {}); 反序排序:arr_Param.reverse(); 合并数组:arr_Param.push.apply(arr ...

  10. Python面向对象之反射

    一.反射的基本概念 二.反射示例 三.反射的应用 一.反射的基本概念 反射:可以用字符串的方式去访问对象的属性,调用对象的方法(但是不能去访问方法),Python中一切皆对象,都可以使用反射. 反射有 ...