《Hadoop大数据技术开发实战》学习笔记(一)
基于CentOS7系统
新建用户
1、使用“su-”命令切换到root用户,然后执行命令:
adduser zonkidd
2、执行以下命令,设置用户zonkidd的密码:
passwd zonkidd
修改用户权限
1、 切换到root用户,然后修改sudoers:
vi /etc/sudoers
2、在文本root ALL = (ALL)ALL的下方加入代码,使hadoop用户可以使用sudo命令:
hadoop ALL=(ALL)
3、执行sudo命令默认五分钟后密码过期,下次使用需重新输入密码,若不想输入,改为:
hadoop ALL=(ALL) NOPASSWD:ALL
关闭防火墙
1、执行以下命令关闭防火墙:
sudo systemctl stop firewalld.service
2、禁止防火墙开机启动
sudo systemctl disable firewalld.service
3、若需要查看防火墙是否已经关闭,可以执行以下命令,查看防火墙的状态
sudo firewall-cmd --state
4、开启防火墙命令如下
sudo systemctl start firewalld.service
设置固定IP (略去)
修改主机名
1、使用hadoop用户登录系统,输入命令,查看主机名:
hostname
2、执行命令,设置主机名为centos01:
sudo hostname centos01
3、永久修改主机名,需要修改/etc/hostname文件
配置集群各节点的SSH无密钥登录
无密钥登录原理
从A服务器无密钥登录到B服务器的具体流程如下:
1)在A服务器中生成密钥对,包括公钥和私钥。
2)将公钥复制到B服务器的授权文件(authorized_keys)中
3)A服务器将访问数据用私钥加密,然后发送给B服务器
4)B服务器接收到数据以后,到授权文件中查找A服务器的公钥,并使用该公钥将数据解密
5)B服务器将需要返回的数据用A服务器的公钥加密后,返回给A服务器
6)A服务器接收到数据后,用私钥将其解密
总结来说,判定是否允许无密钥登录,关键在于登录节点的密钥信息是否存在于被登录节点的授权文件中,如果存在,则允许登录。
无密钥登录步骤
具体的配置方式有两种:手动复制和命令复制
1)手动复制方式
1、将各节点的公钥加入到同一个授权文件中
a、 在centos01节点中,生成密钥文件,并将公钥信息加入到授权文件中,命令如下:
cd ~/.ssh/ #若没有该目录,先执行一次ssh localhost命令
ssh-keygen -t rsa #生成密钥文件,会有提示输入加密信息,都按回车键即可
cat ./id_rsa.pub >> ./authorized_keys #将密钥内容加入到授权文件中
b、在centos02节点中,生成密钥文件,并将公钥文件远程复制到centos01节点的相同目录,且重命名为id_rsa.pub.centos02,命令如下:
cd ~/.ssh/ #若没有该目录,先执行一次ssh localhost命令
ssh-keygen -t rsa #生成密钥文件,会有提示输入加密信息,都按回车键即可
scp ~/.ssh/id_rsa.pub hadoop@centos01:~/.ssh/id_rsa.pub.centos02 #远程复制
c、在centos03节点中,执行与centos02相同的操作,命令如下:
cd ~/.ssh/ #若没有该目录,先执行一次ssh localhost命令
ssh-keygen -t rsa #生成密钥文件,会有提示输入加密信息,都按回车键即可
scp ~/.ssh/id_rsa.pub hadoop@centos01:~/.ssh/id_rsa.pub.centos03 #远程复制
d、回到centos01节点,将centos02和centos03节点的密钥文件信息都加入到授权文件中,命令如下:
cat ./id_rsa.pub.centos02 >> ./authorized_keys #将centos02的密钥加入到授权文件
cat ./id_rsa.pub.centos03 >> ./authorized_keys #将centos03的密钥加入到授权文件
2、复制授权文件到各节点
将centos01节点中的授权文件远程复制到其他节点的相同目录,命令如下:
scp ~/.ssh/authorized_keys hadoop@centos02:~/.ssh/
scp ~/.ssh/authorized_keys hadoop@centos03:~/.ssh/
3、测试无密钥登录
使用ssh命令测试从一个节点无密钥登录到另一个节点,如:从centos01节点无密钥登录到centos02节点
ssh centos02
如果登录失败,可能是授权文件authorized_key的权限分配问题,命令如下:
chmod 700 ~/.ssh #只有拥有者有读、写权限
chmod 600 ~/.ssh/authorized_keys #只有拥有者有读、写、执行权限
2)命令复制方式
ssh-copy-id命令可以把本地主机的公钥复制并追加到远程主机的authorized_keys文件中,该命令也会给远程主机的用户主目录(home)、~/.ssh目录和~/.ssh/authorized_keys设置合适的权限。
1、分别在三个节点执行以下命令,生成密钥文件
cd ~/.ssh/ #若没有该目录,请先执行一次ssh localhost命令
ssh-keygen -t rsa #生成密钥文件,会有提示输入加密信息,都按回车即可
2、分别在三个节点中执行以下命令,将公钥信息复制并追加到对方节点的授权文件authorized_keys中:
ssh-copy-id centos01
ssh-copy-id centos02
ssh-copy-id centos03
命令执行过程中需要输入当前用户的密码
3、测试ssh无密钥登录
《Hadoop大数据技术开发实战》学习笔记(一)的更多相关文章
- 《Hadoop》大数据技术开发实战学习笔记(二)
搭建Hadoop 2.x分布式集群 1.Hadoop集群角色分配 2.上传Hadoop并解压 在centos01中,将安装文件上传到/opt/softwares/目录,然后解压安装文件到/opt/mo ...
- 超人学院Hadoop大数据技术资源分享
超人学院Hadoop大数据技术资源分享 http://bbs.superwu.cn/forum.php?mod=viewthread&tid=807&fromuid=645 很多其它精 ...
- java大数据最全课程学习笔记(1)--Hadoop简介和安装及伪分布式
Hadoop简介和安装及伪分布式 大数据概念 大数据概论 大数据(Big Data): 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合,是需要新处理模式才能具有更强的决策力,洞察发 ...
- hadoop大数据技术架构详解
大数据的时代已经来了,信息的爆炸式增长使得越来越多的行业面临这大量数据需要存储和分析的挑战.Hadoop作为一个开源的分布式并行处理平台,以其高拓展.高效率.高可靠等优点越来越受到欢迎.这同时也带动了 ...
- 除Hadoop大数据技术外,还需了解的九大技术
除Hadoop外的9个大数据技术: 1.Apache Flink 2.Apache Samza 3.Google Cloud Data Flow 4.StreamSets 5.Tensor Flow ...
- 大数据技术之_09_Flume学习_Flume概述+Flume快速入门+Flume企业开发案例+Flume监控之Ganglia+Flume高级之自定义MySQLSource+Flume企业真实面试题(重点)
第1章 Flume概述1.1 Flume定义1.2 Flume组成架构1.2.1 Agent1.2.2 Source1.2.3 Channel1.2.4 Sink1.2.5 Event1.3 Flum ...
- 大数据技术之_19_Spark学习_01_Spark 基础解析 + Spark 概述 + Spark 集群安装 + 执行 Spark 程序
第1章 Spark 概述1.1 什么是 Spark1.2 Spark 特点1.3 Spark 的用户和用途第2章 Spark 集群安装2.1 集群角色2.2 机器准备2.3 下载 Spark 安装包2 ...
- 大数据技术之_16_Scala学习_01_Scala 语言概述
第一章 Scala 语言概述1.1 why is Scala 语言?1.2 Scala 语言诞生小故事1.3 Scala 和 Java 以及 jvm 的关系分析图1.4 Scala 语言的特点1.5 ...
- 大数据技术之_16_Scala学习_04_函数式编程-基础+面向对象编程-基础
第五章 函数式编程-基础5.1 函数式编程内容说明5.1.1 函数式编程内容5.1.2 函数式编程授课顺序5.2 函数式编程介绍5.2.1 几个概念的说明5.2.2 方法.函数.函数式编程和面向对象编 ...
随机推荐
- markdown 显示图片的三种方式
插入网络图片 插入本地图片 base64 图片(data:image/png;base64,iVBORw0KG........) ps:base64编码的图片可以通过站长工具编码 https://to ...
- JAVA的选择结构
1.基本选择结构if 案例:如果Java考试成绩大于98分则奖励MP4 public class Demo02 { public static void main ...
- MongoDB 分片管理(三)服务器管理
MongoDB 分片管理(三)服务器管理
- break,continue,return的区别 x
这三个东西特别坑,一定要记准了!! 1)break 直接跳出当前的循环,从当前循环外面开始执行,忽略循环体中任何其他语句和循环条件测试.他只能跳出一层循环: 注意:如果你的循环是嵌套循环,那么 ...
- requests记录
http://docs.python-requests.org/zh_CN/latest/user/quickstart.html r = requests.get('http://httpbin.o ...
- JavaScript 取两位小数有效数字
a=2.33332.3333a.toFixed(2)"2.33"
- vue日常学习
1.$refs可以用来进行父子级间通信.ref被用于作为子组件的索引ID,用以方便的在js中直接访问子组件.用法如下parent.$refs.idname 使用方法: 在父级元素上加上ref属性 &l ...
- 小程序wx.showLoading的使用
比如说在用户点击登录的时候,为了防止用户点击点第二次,可以加一个loading,在请求结束之后就关闭
- Dockerfile HEALTHCHECK详解
Dockerfile中使用HEALTHCHECK的形式有两种: 1.HEALTHCHECK [options] CMD command(本次详细解释) 2.HEALTHCHECK NODE 意思是禁止 ...
- Centos7 安装Redis,报错[adlist.o] Error jemalloc/jemalloc.h: No such file or directory
redis官网 https://redis.io/download 安装 $ wget http://download.redis.io/releases/redis-5.0.4.tar.gz $ t ...