事件

公司XX游戏 S114服启动失败(使用 pomelo - node.js 框架的项目), 提示 : Caught exception: Error: watch EMFILE

处理过程

  1. 怀疑是 "单进程可打开的最大文件句柄数" 受限

    # 查看单个任务最多可同时打开的文件数
    ulimit -n # 65535

    查看各进程打开的文件句柄数

    lsof -n|awk '{print $3}'|sort|uniq -c|sort -nr

    输出结果:

        228 18942	# mysqld
    125 1450
    89 29749 # 以下皆是游戏进程
    77 23603
    73 29183
    71 6912
    71 31880
    71 28674
    71 28059
    71 27888
    70 6899
    70 3212
    70 31866
    70 3083
    70 29741
    ...

    当前服务器已经启动多个项目实例, 唯独在启动当前这个新的实例时才报错。上面的输出结果显示, 游戏的每个进程打开的文件句柄数也才 80 左右,不可能达到上限。

  2. inotify 限制?

    查看当前inotify限制:

    [root@vm10-140-85-116 ~]# sysctl -a | grep fs.inotify
    fs.inotify.max_user_instances = 128
    fs.inotify.max_user_watches = 8192
    fs.inotify.max_queued_events = 16384

    百度了一下,项目使用 pomelo,”reloadHandlers会监听handler文件的修改,导致了这个fs.watch这个问题“

    inotify 是linux的文件系统时间监控机制。

    在/proc/sys/fs/inotify目录下有三个文件,对inotify机制有一定的限制

    • max_user_watches:设置inotifywait或inotifywatch命令可以监视的文件数量(单进程)
    • max_user_instances:设置每个用户可以运行的inotifywait或inotifywatch命令的进程数
    • max_queued_events:设置inotify实例事件(event)队列可容纳的事件数量。

    尝试临时修改该参数配置:

    echo 256 > /proc/sys/fs/inotify/max_user_instances

    再次启动游戏服务端, OJBK 了, 确认没问题, 将上述修改的参数持久化(不然重启一下服务器又得重设)

    echo "fs.inotify.max_user_instance=256" >> /etc/sysctl.conf

总结

这个问题在于, 开启过多的 pomelo 实例,导致用户(pomelo进程所属)运行的 inotify 命令数超过默认的阀值,而非单个pomelo进程打开的文件句柄数超过限制。

参考资料

小知识点

单进程文件句柄限制

Linux 是有文件句柄限制的, 默认不高, 一般是 1024。作为生产环境的话很容易超出这个数值,因此大多数时候都需要调高该限制数。

文件句柄数限制是针对:

  1. 针对单个进程的限制
  2. 修改该值时不影响当前运行中的程序

查看当前句柄数限制ulimit -n

  1. 临时修改句柄数限制 (仅当前Session有效): ulimit -n 65535

    此处设置文件句柄数限制为 65535

  2. 写入配置文件 (永久生效)

    vim /etc/security/limits.conf

    末尾追加/修改

    *	hard	nofile	65535
    * soft nofile 65535

    hard 是硬限制,即实际限制 ;soft 是软限制,即warning

分析句柄数

(1)统计各进程打开句柄数:lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr

(2)统计各用户打开句柄数:lsof -n|awk '{print $3}'|sort|uniq -c|sort -nr

(3)统计各命令打开句柄数:lsof -n|awk '{print $1}'|sort|uniq -c|sort -nr

系统总文件句柄限制

除了对单进程可打开的文件句柄数量限制外, linux还会对系统级别的能够打开的文件句柄的数量进行限制, 即是对整个系统的限制, 而非针对单用户或单进程.

查看当前系统级别能够打开的文件句柄数量:

cat /proc/sys/fs/file-max	# 794168 Centos7 的默认值

系统级打开最大文件句柄的数量永久生效的修改方法:

  1. /etc/sysctl.conf 文件末尾追加 fs.file-max = 2000000
  2. 执行 sysctl -p ,使修改配置立即生效

sysctl命令用于运行时配置内核参数,这些参数位于/proc/sys目录下

-w 临时改变某个指定参数的值

-p 从指定的文件加载系统参数,如不指定即从/etc/sysctl.conf中加载

查看系统已分配句柄数: cat /proc/sys/fs/file-nr

已分配文件句柄的数目, 已分配但未使用的文件句柄的数目, 文件句柄的最大数目

对于服务器,一般修改进程级的最大打开文件句柄数即可(系统默认1024,有点小)。一般不需要调整系统级的最大数。

如果出现了达到系统级别最大限制时,也需要同步调整系统级的最大数的。

inotify 文件系统事件监控

inotify 是linux的文件系统时间监控机制。

在/proc/sys/fs/inotify目录下有三个文件,对inotify机制有一定的限制

  • max_user_watches:设置inotifywait或inotifywatch命令可以监视的文件数量(单进程)
  • max_user_instances:设置每个用户可以运行的inotifywait或inotifywatch命令的进程数
  • max_queued_events:设置inotify实例事件(event)队列可容纳的事件数量。

如出现 "too many open files" 提示, 记得来确认下是否是该参数配置问题

临时修改该参数配置:

echo 256 > /proc/sys/fs/inotify/max_user_instances

参数持久化

echo "fs.inotify.max_user_instance=256" >> /etc/sysctl.conf
sysctl -p

[原创] 项目 watch EMFILE 报错处理过程的更多相关文章

  1. ASP.NET MVC 复制MVC项目代码到同一个项目的时候报错The request for ‘home’ has found the following matching controll

    ASP.NET MVC 复制MVC项目代码到同一个项目的时候报错The request for ‘home’ has found the following matching controll “/” ...

  2. maven 项目启动tomcat报错 java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderListener

    maven项目启动tomcat报错: java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderLi ...

  3. iOS-C文件添加到iOS项目中,运行报错

    iOS-C文件添加到iOS项目中,运行报错 问题: 往项目中添加一个空的c文件, 编译运行; 出现2,30个编译错误. 原因: 由于在项目中添加了Pch文件,在文件中所有代码还没有开始运行之前, pc ...

  4. maven web 项目中启动报错 Java.lang.ClassNotFoundException: org.springframework.web.servlet.DispatcherServlet

    主要原因是maven项目里面的jar包吗,没有导入到项目中 maven web 项目中启动报错 Java.lang.ClassNotFoundException: org.springframewor ...

  5. eclipse运行项目,tomcat报错:Exception in thread :http-bio-8080-exec-4

    eclipse运行项目,tomcat报错:Exception in thread :http-bio-8080-exec-4 转自 https://www.cnblogs.com/yby-blogs/ ...

  6. 导入项目的时候报错Error:Could not find com.android.support.constraint:constraint-layout:1.0.0-alpha7

    问题描述 今天在导入项目的时候报错: Error:Could not find com.android.support.constraint:constraint-layout:1.0.0-alpha ...

  7. 新建SpringBoot项目运行页面报错Whitelabel Error Page This application has no explicit mapping for /error, so yo

    新建SpringBoot项目运行页面报错Whitelabel Error Page This application has no explicit mapping for /error, so yo ...

  8. Eclipse的maven项目一直无故报错

    maven项目里面没报错,就是项目名称上有红色的叉叉,看着很不舒服: install都成功,但还是有红叉,刷新也没有用,最后搞了好一会才好: 操作步骤: 1.先把项目clean下: 选中要清理的项目, ...

  9. java项目连接jdbc报错:com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Could not create connection to database server

    java项目连接jdbc报错:com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Could not creat ...

随机推荐

  1. LinuxSystemProgramming-vi

    Basic VI

  2. Linux网络配置之虚拟网卡的配置(Red Hat 6.5)

    怎么查看当前的网络状态,这里就不着重描述,用ifconfig命令就可以.我们直接进入主题. red hat系统中的网卡配置在这个目录中:/etc/sysconfig/network-scripts 1 ...

  3. Java代码加密与反编译(二):用加密算法DES修改classLoader实现对.class文件加密

    Java代码加密与反编译(二):用加密算法DES修改classLoader实现对.class文件加密 二.利用加密算法DES实现java代码加密 传统的C/C++自动带有保护机制,但java不同,只要 ...

  4. 实践作业4---DAY4阶段三。

    阶段三:给出结论 这一阶段,我们首先列表从核心功能.细节.用户体验.辅助功能差异化功能.软件的适应性和成长性展开.我们得结论前参考了权威网站数据.并自己也做了相应分析. 结论:经过这么多工作,这个软件 ...

  5. 编写高质量代码改善C#程序的157个建议——建议113:声明变量前考虑最大值

    建议113:声明变量前考虑最大值 假设正在开发一个工资系统,其中一个模块负责处理加薪.代码如下: static void Main(string[] args) { ; salary = (); Co ...

  6. 迟到的成果——Qt 小学生出题神器设计

    Github传送门 Part 1.成果展示及感想 原先一直有个疑惑的问题困扰着对Qt一无所知的我:如何才能使得C++代码在Qt上运行.然而这种困惑在进一步对Qt的了解过程中都得到了慢慢的解决,逐渐有一 ...

  7. 51nod1298圆与三角形——(二分法)

    1298 圆与三角形  题目来源: HackerRank 基准时间限制:1 秒 空间限制:131072 KB 分值: 0 难度:基础题  收藏  关注 给出圆的圆心和半径,以及三角形的三个顶点,问圆同 ...

  8. centos 7 Hadoop2.7.4完全分布式搭建(一)

    (一)系统准备与安装 1.准备下载centos7 (百度自行下载)可以到开源镜像站下载,速度比较快,比如清华的或者阿里的 在vmware上安装 这里我用的是vmware12 打开Vmware 选择文件 ...

  9. C++裁剪文件,截断文件,_chsize()

    errno_t _chsize_s( int fd, __int64 size ); 详见msdn知识库 _chsize将文件裁剪为指定大小,大小的度量方法与 long ftell(FILE * fp ...

  10. Nutch 快速入门(Nutch 2.2.1+Hbase+Solr)

    http://www.tuicool.com/articles/VfEFjm Nutch 2.x 与 Nutch 1.x 相比,剥离出了存储层,放到了gora中,可以使用多种数据库,例如HBase, ...