socket连接关闭问题分析

socket编程过程中往往会遇到这样那样的问题,出现了这些问题,有的是由于并发访问量太大造成的,有些却是由于代码中编程不慎造成的。比如说,最常见的错误就是程序中报打开的文件数过多这个错误。socket建立连接的时候是三次握手,这个大家都很清楚,但是socket关闭连接的时候,需要进行四次挥手,但很多人对于这四次挥手的具体流程不清楚,吃了很多亏。

CLOSE_WAIT分析

socket是一种全双工的通信方式,建立完socket连接后,连接的任何一方都可以发起关闭操作。这里不妨假设连接的关闭是客户端发起。客户端的代码如下:

代码片段1.1

ret = CS_GetConnect(&client,ipAddr,9010);
if (ret == 0) {
    printf("connected success.");
}
CloseSocket(client);

基本逻辑就是,连接建立后立即关闭。其中CloseSocket函数是自定义函数,仅仅封装了在windows和linux下关闭socket的不同实现而已

代码片段1.2

#if defined(WIN32) || defined(WIN64)
#define CloseSocket(fd) do{ closesocket(fd);/* shutdown(fd, 2);*/ }while(0)
#else
#define CloseSocket(fd) do{ close(fd); /*shutdown(fd,2);*/ }while(0)
#endif

客户端调用了CloseSocket之后,发送FIN信号到服务器端,告诉socket程序,连接已经断开。服务器端接收到FIN信号后,会将自身的TCP状态置为`CLOSE_WAIT`,同时回复 一个ACK信号给客户端,客户端接收到这个ACK信号后,自身将处于`FIN_WAIT_2`状态。

但是tcp是全双工的通信协议,虽然客户端关闭了连接,但是服务器端对于这个关闭动作不予理睬怎么办。对于服务器端来说,这是个不幸的消息,因为它将一直处于`CLOSE_WAIT`状态,虽然客户端已经不需要和服务器间进行通信了,但是服务器端的socket连接句柄一直得不到释放;如果老是有这种情况出现,久而久之服务器端的连接句柄就会被耗尽。对于发起关闭的客户端来说,他处于`FIN_WAIT_2`状态,如果出现服务器端一直处于`CLOSE_WATI`状态的情况,客户端并不会一直处在`FIN_WAIT_2`状态,因为这个状态有一个超时时间,这个值可以在/etc/sysctl.conf中进行配置。在这个文件中配置`net.ipv4.tcp_fin_timeout=30`即可保证`FIN_WAIT_2`状态最多保持30秒,超过这个时间后就进入TIME_WAIT状态(下面要讲到这个状态)。

注意:这里socket的关闭从客户端发起,仅仅是为了举例说明,socket的关闭完全也可以从服务器端发起。比如说你写了一个爬虫程序去下载互联网上的某些web服务器上的资源的时候,某些要下载的web资源不存在,web服务器会立即关闭当前的socket连接,但是你的爬虫程序不够健壮,对于这种情况没有做处理,同样会使你的爬虫客户端处于CLOSE_WAIT状态。

那么怎样预防SOCKET处于CLOSE_WATI状态呢,答案在这里:

代码片段1.3

    while(true) {
        memset(getBuffer,0,MY_SOCKET_BUFFER_SIZE);
        Ret = recv(client, getBuffer, MY_SOCKET_BUFFER_SIZE, 0);
        if ( Ret == 0 || Ret == SOCKET_ERROR )
        {
            printf("对方socket已经退出,Ret【%d】!\n",Ret);
            Ret = SOCKET_READE_ERROR;//接收服务器端信息失败
            break;
        }
    }
clear:
    if (getBuffer != NULL) {
        free(getBuffer);
        getBuffer = NULL;
    }
    closesocket(client);

这里摘录了服务器端部分代码,注意这个recv函数,这个函数在连接建立时,会堵塞住当前代码,等有数据接收成功后才返回,返回值为接收到的字节数;但是对于连接对方socket关闭情况,它能立即感应到,并且返回0.所以对于返回0的时候,可以跳出循环,结束当前socket处理,进行一些垃圾回收工作,注意最后一句closesocket操作是很重要的,假设没有写这句话,服务器端会一直处于CLOSE_WAIT状态。如果写了这句话,那么socket的流程就会是这样的:

TIME_WAIT分析

服务器端调用了CloseSocket操作后,会发送一个FIN信号给客户端,客户端进入`TIME_WAIT`状态,而且将维持在这个状态一段时间,这个时间也被成为2MSL(MSL是maximum segment lifetime的缩写,意指最大分节生命周期,这是IP数据包能在互联网上生存的最长时间,超过这个时间将在互联网上消失),在这个时间段内如果客户端的发出的数据还没有被服务器端确认接收的话,可以趁这个时间等待服务端的确认消息。注意,客户端最后发出的ACK N+1消息,是一进入`TIME_WAIT`状态后就发出的,并不是在`TIME_WAIT`状态结束后发出的。如果在发送ACK N+1的时候,由于某种原因服务器端没有收到,那么服务器端会重新发送FIN N消息,这个时候如果客户端还处于`TIME_WAIT`状态的,会重新发送ACK N+1消息,否则客户端会直接发送一个RST消息,告诉服务器端socket连接已经不存在了。

有时,我们在使用netstat命令查看web服务器端的tcp状态的时候,会发现有成千上万的连接句柄处在`TIME_WAIT`状态。web服务器的socket连接一般都是服务器端主动关闭的,当web服务器的并发访问量过大的时候,由于web服务器大多情况下是短连接,socket句柄的生命周期比较短,于是乎就出现了大量的句柄堵在`TIME_WAIT`状态,等待系统回收的情况。如果这种情况太过频繁,又由于操作系统本身的连接数就有限,势必会影响正常的socket连接的建立。在linux下对于这种情况倒是有解救措施,方法就是修改/etc/sysctl.conf文件,保证里面含有以下三行配置:

配置型 2.1

#表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭  
    net.ipv4.tcp_tw_reuse = 1  
    #表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭  
    net.ipv4.tcp_tw_recycle = 1  
    #表示系统同时保持TIME_WAIT的最大数量,如果超过这个数字,
    #TIME_WAIT将立刻被清除并打印警告信息。默认为180000,改为5000。
    net.ipv4.tcp_max_tw_buckets = 5000

关于重用`TIME_WAIT`状态的句柄的操作,也可以在代码中设置:

代码片段2.1

int on = 1;
if (setsockopt(socketfd/*socket句柄*/,SOL_SOCKET,SO_REUSEADDR,(char *)&on,sizeof(on)))
{
    return ERROR_SET_REUSE_ADDR;
}

如果在代码中设置了关于重用的操作,程序中将使用代码中设置的选项决定重用或者不重用,/etc/sysctl.conf中`net.ipv4.tcp_tw_reuse`中的设置将不再其作用。

当然这样设置是有悖TCP的设计标准的,因为处于`TIME_WAIT`状态的TCP连接,是有其存在的积极作用的,前面已经介绍过。假设客户端的ACK N+1信号发送失败,服务器端在1MSL时间过后会重发FIN N信号,而此时客户端重用了之前关闭的连接句柄建立了新的连接,但是此时就会收到一个FIN信号,导致自己被莫名其妙关闭。

一般`TIME_WAIT`会维持在2MSL(linux下1MSL默认为30秒)时间,但是这个时间可以通过代码修改:

代码片段2.2

struct linger so_linger;
so_linger.l_onoff = 1;
so_linger.l_linger = 10;
if (setsockopt(socketfd,SOL_SOCKET,SO_LINGER,(char *)&so_linger,sizeof(struct linger)))
{
    return ERROR_SET_LINGER;
}

这里代码将`TIME_WAIT`的时间设置为10秒(在BSD系统中,将会是0.01*10s)。TCP中的`TIME_WAIT`机制使得socket程序可以“优雅”的关闭,如果你想你的程序更优雅,最好不要设置`TIME_WAIT`的停留时间,让老的tcp数据包在合理的时间内自生自灭。当然对于`SO_LINGER`参数,它不仅仅能够自定义`TIME_WAIT`状态的时间,还能够将TCP的四次挥手直接禁用掉,假设对于so_linger结构体变量的设置是这个样子的:

so_linger.l_onoff = 1;
    so_linger.l_linger = 0;

如果客户端的socket是这么设置的那么socket的关闭流程就直接是这个样子了:

这相当于客户端直接告诉服务器端,我这边异常终止了,对于我稍后给出的所有数据包你都可以丢弃掉。服务器端如果接受到这种RST消息,会直接把对应的socket句柄回收掉。有一些socket程序不想让TCP出现`TIME_WAIT`状态,会选择直接使用RST方式关闭socket,以保证socket句柄在最短的时间内得到回收,当然前提是接受有可能被丢弃老的数据包这种情况的出现。如果socket通信的前后数据包的关联性不是很强的话,换句话说每次通信都是一个单独的事务,那么可以考虑直接发送RST信号来快速关闭连接。

补充

1.文中提到的修改/etc/sysctl.conf文件的情况,修改完成之后需要运行`/sbin/sysctl -p`后才能生效。

2.图1中发送完FIN M信号后,被动关闭端的socket程序中输入流会接收到一个EOF标示,是在C代码中处理时recv函数返回0代表对方关闭,在java代码中会在InputStream的read函数中接收到-1:

代码片段3.1

Socket client = new Socket();//,9090
    try {
        client.connect(
            new InetSocketAddress("192.168.56.101",9090));
        while(true){
            int c = client.getInputStream().read();
            if (c > 0) {
                System.out.print((char) c);
            } else {//如果对方socket关闭,read函数返回-1
                break;
            }
             try {
                Thread.currentThread().sleep(2000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    } catch (IOException e2) {
        e2.printStackTrace();
    } finally {
        try {
            client.close();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}

3.如果主动关闭方已经发起了关闭的FIN信号,被动关闭方不予理睬,依然往主动关闭方发送数据,那么主动关闭方会直接返回RST新号,连接双方的句柄就被双方的操作系统回收,如果此时双方的路由节点之前还存在未到达的数据,将会被丢弃掉。

4.通信的过程中,socket双发中有一方的进程意外退出,则这一方将向其对应的另一方发送RST消息,所有双发建立的连接将会被回收,未接收完的消息就会被丢弃。

5.项目的配套代码可以从这里得到http://git.oschina.net/yunnysunny/socket_close

以上就是socket连接关闭问题分析的详细内容,更多关于socket连接关闭的资料请关注我们其它相关文章!

(0)

相关推荐

  • 浅谈socket TCP编程中connect的一些坑

    1.服务端listen成功后,系统就自动接收客户端请求了 man listen: 其中有一段 The  behavior of the backlog argument on TCP sockets changed with Linux        2.2.  Now it specifies the  queue  length  for  completely  established        sockets  waiting  to  be  accepted, instead o

  • 浅谈python中真正关闭socket的方法

    close方法可以释放一个连接的资源,但是不是立即释放,如果想立即释放,那么在close之前使用shutdown方法 shut_rd() -------关闭接受消息通道 shut_wr()--------关闭发送消息通道 shut_rdwr()-------连个通道都关闭 使用:在close()之前加上shutdown(num)即可  [shut_rd(), shut_wr(), shut_rdwr()分别代表num 为0  1  2 ] (但是测试过close()关闭,发现如果关闭后,那么ac

  • 浅谈socket同步和异步、阻塞和非阻塞、I/O模型

    在进行网络编程时,常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式 同步/异步主要针对C端: 同步:c端发出一个功能调用时,在没有得到结果之前,c端死等结果 例如:普通B/S模式(同步):提交请求->等待服务器处理->处理完毕返回 这个期间客户端浏览器不能干任何事 异步:c端一个异步过程调用发出后,调用者不会立刻得到结果.实际处理这个调用的部件在完成后,通过状态.通知和回调来通知调用者. 例如:ajax请求(异步): 事件触发->服务

  • 浅谈python socket函数中,send与sendall的区别与使用方法

    在python socket编程中,有两个发送TCP的函数,send()与sendall(),区别如下: socket.send(string[, flags]) 发送TCP数据,返回发送的字节大小.这个字节长度可能少于实际要发送的数据的长度.换句话说,这个函数执行一次,并不一定能发送完给定的数据,可能需要重复多次才能发送完成. 例子: data = "something you want to send" while True: len = s.send(data[len:]) if

  • 浅谈java socket的正确关闭姿势

    java socket对应的是网络协议中的tcp,tcp的三次握手.四次挥手.11中状态什么的这里就不说了,不知道大家平常使用socket的时候如果不注意的情况下,会不会遇到各种异常报错. 例如: java.net.SocketException:socket is closed 错误提示的出现场景: 自己主动关闭了socket,但是之后还从里面读写数据 Software caused connection abort: socket write error 错误提示的出现场景: 对方已经关闭s

  • socket连接关闭问题分析

    socket编程过程中往往会遇到这样那样的问题,出现了这些问题,有的是由于并发访问量太大造成的,有些却是由于代码中编程不慎造成的.比如说,最常见的错误就是程序中报打开的文件数过多这个错误.socket建立连接的时候是三次握手,这个大家都很清楚,但是socket关闭连接的时候,需要进行四次挥手,但很多人对于这四次挥手的具体流程不清楚,吃了很多亏. CLOSE_WAIT分析 socket是一种全双工的通信方式,建立完socket连接后,连接的任何一方都可以发起关闭操作.这里不妨假设连接的关闭是客户端

  • PHP中Socket连接及读写数据超时问题分析

    本文实例讲述了PHP中Socket连接及读写数据超时问题.分享给大家供大家参考,具体如下: 虽然PHP中对fsockopen()方法有连接socket的超时参数,但是没有类似C中的连接成功后对数据的读写超时参数设置.没关系,PHP中对stream提供了一系列的方法以防止超时 stream_set_blocking( $fp , false ) 设置数据流为阻塞模式,以防止数据没读完就退出 如果模式为 false, 给定的 socket 描述符将切换到非块模式, 如果为 true, 则切换到块模式

  • Python socket连接中的粘包、精确传输问题实例分析

    本文实例讲述了Python socket连接中的粘包.精确传输问题.分享给大家供大家参考,具体如下: 粘包: 发生原因: 当调用send的时候,数据并不是即时发给客户端的.而是放到了系统的socket发送缓冲区里,等缓冲区满了.或者数据等待超时了,数据才会发送,所以有时候发送太快的话,前一份数据还没有传给客户端,那么这份数据和上一份数据一起发给客户端的时候就会造成"粘包" . 解决方案: 解决根源的思想是避免不同段的数据一起发送. 方案1:前一段数据send完后,等待一段时间再send

  • java如何实现socket连接方法封装

    目录 Java实现socket连接技巧 Java Socket的封装 1 客户端Socket API要点 2 服务端Socket API要点 常见问题 Java使用socket实现一个多线程web服务器的方法 除了服务器类,还包括请求类和响应类 服务器处理类 请求类 响应类 Java实现socket连接技巧 Socket通信几乎无时不在,当然能够搜集到的信息也大量存在, 为了避免重复的劳作, 抽取了关于客户端和服务端的Socket, 并将其应用到适合JVM(LInux/Windows)或者DVM

  • python socket多线程通讯实例分析(聊天室)

    本文实例讲述了python socket多线程通讯方法.分享给大家供大家参考,具体如下: #!/usr/bin/evn python """ 这是一个Socket+多进程的例子(聊天服务端) """ import socket import threading # 处理中文数据用的 encoding = "GBK" def HKServer(client, addr): """ 与客户端时实通讯函

  • python中协程实现TCP连接的实例分析

    在网络通信中,每个连接都必须创建新线程(或进程) 来处理,否则,单线程在处理连接的过程中, 无法接受其他客户端的连接.所以我们尝试使用协程来实现服务器对多个客户端的响应. 与单一TCP通信的构架一样,只是使用协程来实现多个任务同时进行. #服务端 import socket from gevent import monkey import gevent monkey.patch_all() def handle_conn(seObj): while True: re_Data = seObj.r

  • Springboot之整合Socket连接案例

    Socket连接与硬件通信 一.如何让socket随着springboot项目一起启动 SpringBoot中CommandLineRunner的作用:平常开发中有可能需要实现在项目启动后执行的功能,SpringBoot提供的一种简单的实现方案就是添加一个model并实现CommandLineRunner接口,实现功能的代码放在实现的run方法中 具体实现 import org.springframework.beans.factory.annotation.Autowired; import

  • PHP中用mysqli面向对象打开连接关闭mysql数据库的方法

    如下所示: 代码如下: <meta http-equiv="content-type" content="text/html" charset="utf-8"/> <h1>用mysqli面向对象方法连接数据库!-姚远的博客</h1> <form method="POST" action="<?php echo htmlspecialchars($_SERVER['PHP

  • Android编程实现基于局域网udp广播自动建立socket连接的方法

    本文实例讲述了Android编程实现基于局域网udp广播自动建立socket连接的方法.分享给大家供大家参考,具体如下: android开发中经常会用到socket通讯.由于项目需要,最近研究了一下这方面的知识. 需求是想通过wifi实现android移动设备和android平台的电视之间的文件传输与控制. 毫无疑问这中间一定需要用到socket来进行通信.今天就两台设备的握手连接方式分享一下吧,该方法只是本人个人想法的实现,仅供参考,如有雷同,不胜荣幸. 要想使用socket进行通讯,就必须知

  • python使用socket连接远程服务器的方法

    本文实例讲述了python使用socket连接远程服务器的方法.分享给大家供大家参考.具体如下: import socket print "Creating socket...", s = socket.socket(socket.AF_INET,socket.SOCK_STREAM) print "done." print "Looking up port number...", port = socket.getservbyname('htt

随机推荐