修改内核参数

在/etc/sysctl.conf文件中添加如下配置（需要root权限）
以下参数的默认值是在centos7下查看的
fs.file-max = 6815744   //文件描述符总数，默认值：94121
fs.aio-max-nr = 1048576   //最大并发io请求数，默认值：1048576
net.core.rmem_default = 262144   //操作系统接收缓冲区的默认大小，默认值：212992
net.core.wmem_default = 262144   //操作系统发送缓冲区的默认大小，默认值：212992
net.core.rmem_max = 16777216   //操作系统接收缓冲区的最大值，默认：212992   
net.core.wmem_max = 16777216   //操作系统发送缓冲区的最大值，默认：212992  
net.ipv4.tcp_rmem = 4096 262144 16777216   //接收窗口尺寸的最小、默认、最大值，默认值：4096 87380 6291456
net.ipv4.tcp_wmem = 4096 16384 4194304   //接收窗口尺寸的最小、默认、最大值，默认值：4096 87380 6291456
保存文件，在命令行执行sysctl -p动态加载配置，也可以使用sysctl -a查看内核配置。

文件系统限制

为了避免集群中的任何文件描述符错误，需要增加单个用户或者进程一次打开文件数量的限制

查看当前操作系统最大打开文件数和最大用户进程数

[root@test ~]# ulimit -Sn //最大文件数软限制
1024
[root@test ~]# ulimit -Hn //最大文件数硬限制

4096

[root@test ~]# ulimit -Su //用户打开最大进程数，软硬限制一样。
3757
[root@test ~]# ulimit -Hu
3757

对于Hadoop集群来说肯定是不够的。当然也可以直接使用ulimit -a查看所有的配置。

在/etc/security/limits.conf文件添加如下的配置。

* - nofile 65535
* - nproc unlimited

其中的*代表所有用户，如果想要只添加对单个用户的修改，可以直接写用户名，其中 -(横线) 代表软硬限制都使用一样的配置。

如果想要配置生效，需要重新开启另外一个会话，查看修改后的值：

[root@test ~]# ulimit -Sn
65535
[root@test ~]# ulimit -Hn
65535
[root@test ~]# ulimit -Su
unlimited
[root@test ~]# ulimit -Hu
unlimited
[root@test ~]#

磁盘设置

确保在挂载磁盘的时候使用noatime时间以及挂载所有目录时使用nodir时间，这样可以避免在对Linux文件系统中的文件和目录进行读取操作时进行不必要的写入操作，从而提高集群性能，。

eg：

修改：

重新挂载磁盘

# mount -o remount /dev/mapper/centos-root

# mount -o remount /dev/mapper/centos-home

测试磁盘的IO速度

使用hdparm -t命令测试磁盘的速度，hdparm需要安装

[root@test ~]# hdparm -t /dev/mapper/cl-data 

/dev/mapper/cl-data:

 Timing buffered disk reads:  MB in  3.05 seconds =  52.50 MB/sec     //速度最好是达到70MB/s 以上

启用NTP服务

确保集群的时间同步是开启的，centos7默认的时间同步是使用chrony，配置文件/etc/chrony.conf。当然也可以重新安装ntp服务。这两个功能是一样的。

检查DNS

使用主机名而不是IP来标识节点，理想状态下，集群中的所有节点都必须配置NDS和反向DNS，确保所有主机名配置完全限定域名(FQDN)，例如：

[root@test ~]# hostname --fqdn

test    //我这里就不是

如果无法配置DNS，需要把主机名和IP的对于关系加入到/etc/hosts文件

禁用swap

swap交换分区，会降低处理速度
# swapoff -a   //关闭交换分区
# swapon -s 　　//检查服务器的状态
# swapon -a    //开启交换分区
默认情况下，大多数操作系统的swappiness值为60，这个值表示当内存还剩余多少时开始使用交换分区，设置为0表示除非内存不足(现在对0的解释是0意味着“在任何情况下都不要发生交换”)，不然不适用交换分区，设置为100，表示立即使用。
这里如果开启了交换分区，那么应该在/etc/sysctl.conf文件添加如下配置
vm.swappiness = 10
# sysctl -p

禁用SElinux

[root@test ~]# sed -i 's/SELINUX=enforcing/SELINUX=disabled/g' /etc/selinux/config 

[root@test ~]# setenforce

关闭IPv6

在/etc/sysctl.conf文件最后配置如下：

net.ipv6.conf.all.disable_ipv6 = 1
net.ipv6.conf.default.disable_ipv6 = 1
net.ipv6.conf.lo.disable_ipv6 = 1

也可以通过环境变量HADOOP_OPTS添加如下参数来禁止Hadoop的的IPv6.

export HADOOP_OPTS=-Djava.net.preferIPv4Stack=true

防火墙

如果是自己测试可以关闭防火墙，生产环境就自己配置相应的值了

SSH

# ssh-keygen -t rsa -P  '' -f ~/.ssh/id_rsa    //指定生产秘钥的文件

内存脏页(脏数据)

请查看

https://www.cnblogs.com/yinzhengjie/p/9994207.html

部署Hadoop集群之前的一些系统配置的更多相关文章

Docker部署Hadoop集群
Docker部署Hadoop集群 2016-09-27 杜亦舒前几天写了文章"Hadoop 集群搭建"之后,一个朋友留言说希望介绍下如何使用Docker部署,这个建议很好,Doc ...
如何部署hadoop集群
假设我们有三台服务器,他们的角色我们做如下划分: 10.96.21.120 master 10.96.21.119 slave1 10.96.21.121 slave2 接下来我们按照这个配置来部署h ...
批量部署Hadoop集群环境（1）
批量部署Hadoop集群环境(1) 1. 项目简介: 前言:云火的一塌糊涂,加上自大二就跟随一位教授做大数据项目,所以很早就产生了兴趣,随着知识的积累,虚拟机已经不能满足了,这次在服务器上以生产环境来 ...
阿里云ECS服务器部署HADOOP集群（一）：Hadoop完全分布式集群环境搭建
准备: 两台配置CentOS 7.3的阿里云ECS服务器: hadoop-2.7.3.tar.gz安装包: jdk-8u77-linux-x64.tar.gz安装包: hostname及IP的配置: ...
阿里云ECS服务器部署HADOOP集群（二）：HBase完全分布式集群搭建（使用外置ZooKeeper）
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...
阿里云ECS服务器部署HADOOP集群（三）：ZooKeeper 完全分布式集群搭建
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...
阿里云ECS服务器部署HADOOP集群（六）：Flume 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...
阿里云ECS服务器部署HADOOP集群（七）：Sqoop 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建阿里云ECS服务器部署HADOOP集群(二):HBase完全分布式集群搭建(使用外置ZooKeeper) 阿 ...
阿里云ECS服务器部署HADOOP集群（五）：Pig 安装
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建. 1 环境介绍一台阿里云ECS服务器:master 操作系统:CentOS 7.3 Hadoop ...

随机推荐

vue-cli 3.0 安装
一.安装vue-cli 脚手架命令 npm install -g vue-cli 适用于vue-cli 2.0 npm install -g @vue/cli 适用于vue-cli 3.0 卸载命 ...
用JS实现输出两个数范围内的随机数
const rs = require("readline-sync"); function roundNum(min = 0, max = 0) { if (!isNaN(min) ...
下载css-loader 安装及使用
1.通过require的方式来引入css,我们来看具体的方法,首先需要安装css-loader, style-loader(安装style-loader的目的是为了在html中以style的方式嵌入c ...
Scrapy 框架的使用
Scrapy 框架的介绍 Scrapy 是一个基于Twisted的异步处理框架,是纯Python实现的爬虫框架,其架构清晰模块之间的耦合成都低,可扩展性极强,可以灵活完成各种需求.我们只需要定制开发几 ...
ORACLE 清理SYSAUX表空间
在数据库检查中发现SYSAUX表空间占用过大,SYSAUX是ORACLE10G开始提供的功能,用于数据库为SYSTEM表空间减负. 用以下语句查出相应的表空间值 select a.tablespace ...
Android笔记(七十三) Android权限问题整理非常全面
Android权限系统非常庞大,我们在Android系统中做任何操作都需要首先获取Android系统权限,本文记录了所有的Android权限问题,整理一下分享给大家. 访问登记属性 android.p ...
Android笔记（四十三） Android中的数据存储——SQLite（五）delete
SQLite通过delete()方法删除数据 delete()方法参数说明: delete()方法参数对应sql部分描述 table delte from table_name 要删除的表 whe ...
Linux学习django-CentOS部署自己本地的django项目
前言自己本地写好的django项目,如何部署到linux服务器上,让其他的小伙伴也能访问呢?本篇以centos系统为例,把本地写好的django项目部署到linux服务器上环境准备: 环境准备:1. ...
Linux硬盘满了，系统速度贼慢，居然是Jenkins.log太大了
用查找命令找出大于1G的文件 find / -size +1G -print 为什么jenkins.log会产生40+G的文件? 以上在Windows上的时候,运行了几个月,也没有发生这种现象? 而在 ...
php最快测试环境建立
win下待验证,但linux下真快. 不要nginx,不要php-fpm,就一个字,快! 1, 安装php yum install php 输出如下: Dependencies Resolved == ...

部署Hadoop集群之前的一些系统配置