背景: 要爬取某网站的数据,数据每页10条,有很多页(形式如同table表格).使用HttpClient 逐行逐页爬取数据,但在循环爬取多次时,总会在不确定的位置报错 在检查代码逻辑无果之后,开始疯狂百度,网上给出的解释: 服务器端因为某种原因关闭了Connection,而客户端依然在读写数据. 给出的解决方案是: 客户端和服务器统一使用TCP长连接或者短连接. 客户端关闭了连接,检查代码,并无关闭. 以上两种情况均无法解决,于是决定自己看错误源码: int read(byte b[], int…