欢迎关注Github:https://github.com/teaey/

### 背景

银时跟我讲,想从 Netty3迁移到Netty4 。


问其原因是由于 Netty3在容器里会报错,错误堆栈:

java.io.IOException: 无法马上完毕一个非阻止性套接字操作。

at sun.nio.ch.SocketDispatcher.close0(Native Method)

at sun.nio.ch.SocketDispatcher.preClose(SocketDispatcher.java:44)

at sun.nio.ch.SocketChannelImpl.implCloseSelectableChannel(SocketChannelImpl.java:677)

at java.nio.channels.spi.AbstractSelectableChannel.implCloseChannel(AbstractSelectableChannel.java:201)

at java.nio.channels.spi.AbstractInterruptibleChannel.close(AbstractInterruptibleChannel.java:97)

### 分析

看到这个问题,之前我也没有遇到过,只是假设 netty3有这个问题,netty4应该也会存在。那就看看究竟什么导致这个问题。

找到 SocketDispatcher的close0 方法,这是个本地方法:

找到 Windows的实现:

Windows平台通过调用closesocket( winsock2.h)关闭套接字。
接着查看巨硬的 官方文档,内容摘要:

if no error occurs, closesocket returns zero. Otherwise, a value of SOCKET_ERROR is
returned, and a specific error code can be retrieved by calling WSAGetLastError.

意思就是假设正确返回 0,假设错误返回SOCKET_ERROR。而且通过 WSAGetLastError函数获取错误状态。

这里非常明显是发生出错误向上抛出了异常。
通过分析 closesocket的错误状态信息以及谷歌“无法马上完毕一个非阻止性套接字操作”,确诊为错误状态 WSAEWOULDBLOCK  。

阅读 官方文档,得知该错误状态是设置了 SO_LINGER所致。

于是回过头去看下代码,果然,图为截取的 Netty代码片段:


巨硬的文档是这么说的:

Setting the l_onoff member of the  linger structure
to nonzero and the l_linger member with a nonzero timeout interval on a nonblocking socket is not recommended.

意思是,在非堵塞的 Socket情况下不建议设置SO_LINGER參数。

In this case, the call to  closesocket  will
fail with an error of WSAEWOULDBLOCK if
the close operation cannot be completed immediately. If  closesocket fails
with WSAEWOULDBLOCK the
socket handle is still valid, and a disconnect is not initiated. The application must call closesocket again to close the socket.

假设设置了 SO_LINGER,而且制定了超时时间,这时,我们调用 closesocket方法,方法不能马上完毕的话,会抛出 WSAEWOULDBLOCK  错误。可是,这个 socket此时还是有效的,能够一段时间之后再次调用 close方法进行关闭尝试。

### 解决方法

可是 java抛出简单IOException ,我们无法推断是否为 WSAEWOULDBLOCK  错误。非常难推断是否是由于其它原因导致的 IOException,所以不可能进行重试。

终于,解决方法去掉

这行代码。

改进之后,在调用 close方法时,不会抛出异常而且在底层 socket关闭前,系统会尽可能的把将缓冲队列的数据发送给对端。原文例如以下:

If the l_onoff member of the  LINGER structure
is zero on a stream socket, the closesocket call will return immediately and does not receive  whether the socket is blocking or nonblocking. However, any data queued for transmission will be sent, if possible, before the underlying socket is closed.

### 总结

在使用NIO 的时候,最好不要配置 SO_LINGER,假设设置了该參数,在 close的时候如缓冲区有数据待写出,会抛出 IOException。

后记:近期银时发现,Zookeeper之前的版本号也是有设置这个參数,而且在最新版本号去掉了这个參数,难道大神们的代码也是Ctrl+C,Ctrl+V过来的。呵呵。

### 參考资料

NIO设置SO_LINGER引发的异常的更多相关文章

  1. 选择目录,选择文件夹的COM组件问题。在可以调用 OLE 之前,必须将当前线程设置为单线程单元(STA)模式。请确保您的 Main 函数带有 STAThreadAttribute 标记。 只有将调试器附加到该进程才会引发此异常。

    异常: 在可以调用 OLE 之前,必须将当前线程设置为单线程单元(STA)模式.请确保您的 Main 函数带有 STAThreadAttribute 标记. 只有将调试器附加到该进程才会引发此异常. ...

  2. c# Clipboard.SetDataObject(bmp1) 在可以调用 OLE 之前,必须将当前线程设置为单线程单元(STA)模式。请确保您的 Main 函数带有 STAThreadAttribute 标记。 只有将调试器附加到该进程才会引发此异常

    c# Clipboard.SetDataObject(bmp1)  在可以调用 OLE 之前,必须将当前线程设置为单线程单元(STA)模式.请确保您的 Main 函数带有 STAThreadAttri ...

  3. 2019-4-12-WPF-类型的构造函数执行符合指定的绑定约束的调用时引发了异常

    title author date CreateTime categories WPF 类型的构造函数执行符合指定的绑定约束的调用时引发了异常 lindexi 2019-04-12 08:52:35 ...

  4. 调试器地址出现大小端紊乱,引发的异常: 0xC0000005: 读取位置 0xFFFFFFFFFFFFFFFF 时发生访问冲突。

    今天在编写一系列新增需求代码后,开始调试代码 发现上个版本正常可运行的代码出现了:引发的异常: 0xC0000005: 读取位置 0xFFFFFFFFFFFFFFFF 时发生访问冲突. 上个版本数代码 ...

  5. 将不确定变为确定~DateTime.MinValue和MaxValue引发的异常

    回到目录 问题描述: SqlDateTime 溢出.必须介于 1/1/1753 12:00:00 AM 和 12/31/9999 11:59:59 PM 之间 概念相关 .Net中的DateTime结 ...

  6. WPF控件ComboBox 每个Item的ToolTip引发的异常

    介绍 首先介绍下要实现的任务.做一个下拉框,当选择每个项的时候将鼠标发在上面显示该项的ToolTip的内容(Image). 实现 Model: public class SkinInfo : Noti ...

  7. VS2010 F5调试时出现:“ 尝试运行项目时出错:未捕获通过反射调用的方法引发的异常”解决

    VS2010 F5调试时出现 尝试运行项目时出错:未捕获通过反射调用的方法引发的异常 两个解决方法:1) 打开项目属性,选择调试选项卡,将“启用非托管代码调试”一项钩上.2) 打开项目属性,选择调试选 ...

  8. setsockopt 设置 SO_LINGER 选项

    setsockopt 设置 SO_LINGER 选项 最近和后台的server通信 server发现在读数据的时候  客户端已经关闭连接 ,也就是 没有等服务器读完数据,客户端已经fclose了, 联 ...

  9. WPF关于“在“System.Windows.Markup.StaticResourceHolder”上提供值时引发了异常。”问题解决办法

    在WPF中添加样式,在MainWindow.xaml使用自定义按钮FButton时报错,报错信息如下: "System.Windows.Markup.XamlParseException&q ...

随机推荐

  1. 2、Python djang 框架下的word Excel TXT Image 等文件的下载

    2.python实现文件下载 (1)方法一.直接用a标签的href+数据库中文件地址,即可下载.缺点:word excel是直接弹框下载,对于image txt 等文件的下载方式是直接在新页面打开. ...

  2. 2013年12月26日 星期四 doxygen入门--很好

    body{ font-family: "Microsoft YaHei UI","Microsoft YaHei",SimSun,"Segoe UI& ...

  3. Apache 支持PHP

    ①加载PHP模块到Apache中: LoadModule php5_module "d:\php5\php5apache2_2.dll"   ②加入识别扩展名为.php文件(也可以 ...

  4. python cookielib

    # HttpClient.py is written by [xqin]: https://github.com/xqin/SmartQQ-for-Raspberry-Piimport cookiel ...

  5. 快速搭建高速稳定三层B/S架构

  6. go bytes缓冲区使用介绍

    缓冲区原理简介: go字节缓冲区底层以字节切片做存储,切片存在长度len与容量cap, 缓冲区写从长度len的位置开始写,当len>cap时,会自动扩容.缓冲区读会从内置标记off位置开始读(o ...

  7. [BZOJ 3620] 似乎在梦中见过的样子 【KMP】

    题目链接:BZOJ - 3620 题目分析 这道题使用 KMP 做 O(n^2) 的暴力就能过. 首先,我们依次枚举字串左端点 l ,然后从这个左端点开始向后做一次 KMP. 然后我们枚举右端点 r  ...

  8. ORACLE数据缓冲区DB cache

    DB CACHE是以数据块为单位组织的缓冲区,数据库刚刚启动的时候,DB CACHE中几乎没有用户数据的缓冲,当会话访问数据库中的表或索引时,首先会检查DB CACHE中是否存在该数据,如果不存在,就 ...

  9. MSbuild 教程

    在.Net framework中,一个不太被大家熟知的工具就是MSBuild.这个命令行工具通过执行XML脚本可以自动生成软件工程文件. 但问题来了,“我为什么想要我的生成过程自动化?”. 其实,大部 ...

  10. Intervals(差分约束)

    http://poj.org/problem?id=1201 题意:给出N个整数区间[ai,bi],并且给出一个约束ci,( 1<= ci <= bi-ai+1),使得数组Z在区间[ai, ...