系统提供select函数来实现多路复用I/O模型,select系统调用是用来让我们的程序监视多个文件句柄的状态变化的。程序会停在select这里等待,直到被监视的文件句柄有一个或多个发生了状态改变。

select API:

wKioL1fmmyHSQYlTAABH8E3J98o259.png

1)nfds参数指定被监听的文件描述符的总数。它通常被设置为select监听的所有文件描述符中的最大值加1,因为文件描述符是从0开始计数的。

2)readfds、writefds和exceptfds参数都是输入输出型参数,分别指向可读、可写和异常等事件对应的文件描述符集合。作为输入型参数,应用程序调用select参数时,通过这三个参数传入自己感兴趣的文件描述符。作为输出型参数,select调用返回时,内核将修改它们来通知应用程序哪些文件描述符已经就绪。

      fd_set结构体仅包含一个整型数组,该数组的每个元素的每一位(bit)标记一个文件描述符。fd_set能容纳的文件描述符数量由FD_SETSIZE指定,这就限制了select能同时处理的文件描述符的数量。

系统提供了一系列宏来访问fd_set结构体中的位:

wKiom1fmns3C4jgBAABJ_eq-Fkw106.png

3)timeout参数用来设置select函数的超时时间。它是一个timeval结构类型的指针,采用指针参数是将它设置为输入输出型参数,内核将修改它以告诉应用程序select等待了多久。

wKiom1fmn8yiaqP1AAAr1TZFI6Y614.png

select给我们提供了一个微秒级的定时方式。如果给timeout变量的tv_sec和tv_usec都传0,则select将立即返回。如果给timeout传递NULL,则select将一直阻塞,直到某个文件描述符就绪。

select成功时返回就绪(可读、可写和异常)文件描述符的总数。

如果在超时时间内没有任何文件描述符就绪,select将返回0。

select失败时返回-1并设置errno。如果在select等待期间,程序接收到信号,则select立即返回-1并设置errno为EINTER。

理解select

select模型的关键在于理解fd_set,假如取fd_set为一字节,fd_set中的每一bit可以对应一个文件描述符fd,则1字节长的fd_set最大可以对应8个fd。

(1)执行 

fd_set set;FD_ZERO(&set);

   则set用位表示是0000 0000。

(2)若fd=5,执行

FD_SET(fd, &set);

   后set变为 0001 0000(第5位设置为1)。

(3)若再加入fd = 2,fd = 1则set变为 0001 0011。

(4)执行

select(6, &set, NULL, NULL, NULL);

   阻塞等待。

(5)若fd = 1, fd = 2上都发生可读事件,则select返回,此时set变为0000 0011。

   注意:没有事件发生的fd = 5被清空。

select模型的特点:

(1)可监控的文件描述符个数取决于sizeof(fd_set)的值,一般为512或1024。假如服务器上sizeof(fd_set)的值为512,每个bit表示一个文件描述符,则服务器上支持的最大文件描述符是512 * 8 = 4096。如果想要调整fd_set的大小,可以通过编译内核或其他方法。

(2)将fd加入select监控的同时,还要再使用一个数组Array保存放到select监控集中的fd,一是用于在select返回后,Array作为原数据和fd_set进行FD_ISSET判断。二是select返回后会把以前加入的但并无事件发生的fd清空,所以每次开始select前都要重新从Array取得fd逐一加入(FD_ZERO最先),扫描Array的同时取得fd的最大值max_fd,用于select的第一个参数。

(3)select模型必须在select前遍历Array(加fd,取max_fd),select返回后遍历Array(FD_ISSET判断是否有事件发生)。

select的优点:

         select的性能远远高于多进程、多线程。

select的缺点:

(1)select监视的文件描述符数量是有限的

(2)每次调用select,都需要把fd集合从用户态拷贝到内核态,这个开销在fd很多时会很大,导致服务器性能下降。

(3)每次调用都要在内核遍历传递进来的所有fd,这个开销在fd很多时也很大。

使用select 的TCP服务器