connection reset by peer, socket write error问题排查

2018-03-15更新:弄明白connection reset产生的原因,见重新分析connection reset by peer, socket write error错误原因

在开发文件上传功能时遇到了connection reset by peer, socket write error的错误,排查废了一番功夫,记录一下。

在网上搜索了一下,得到的原因有这些:

  1. 服务器的并发连接数超过了其承载量,服务器会将其中一些连接Down掉;
  2. 客户关掉了浏览器,而服务器还在给客户端发送数据;
  3. 浏览器端按了Stop;

但是看了服务器,不太可能;网络状况了也挺好(测试环境而已)。
跟浏览器也没关系,因为这里上传文件使用的是apache httpclient在上传文件,而且timeout都设置比较长。

最后分析到的问题原因,出在服务端上。服务端是这么处理的:上传文件时在header里含有了文件信息,上传文件成功,记录文件相关信息在DB;如果再次上传这个文件,根据header的文件信息在DB判断是否已经上传,如果确认是重复文件,则直接返回“文件重复”。(这个业务设计有点bug,暂时忽略)

但是现在却遇到重复上传时,客户端httpclient报了“connection reset by peer, socket write error”的错误。

是由于在重复上传时,服务端只取了header就判断了文件重复直接response了,这个时候客户端还在“欢快”的传输文件呢,而服务端直接response把连接关闭了,所以客户端就懵逼了,报了错误。

这个问题暂时还没有找到技术上如何解决(如果找到,后面再补充),所以在业务上进行解决的。在客户端遇到SocketException时,尝试重新上传前,先查询服务端是否已经完成了此文件的上传,如果已经存在,则不用重复上传了,也就可以避免因为重复上传导致的问题,毕竟重复上传也是为了保证在网络不佳时能补偿。

posted @ 2017-09-01 23:19  liqipeng  阅读(109509)  评论(2编辑  收藏  举报