浅谈Java网络编程（一）——非阻塞I/O

2020/1/30 14:23:48

编程Tag： Java 后端 linux 网络

本文主要是介绍浅谈Java网络编程（一）——非阻塞I/O，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

译自：https://medium.com/@copyconst...

文件描述符（descriptors）

Unix中I/O的基本组成元素是字节序列。大多数程序应用于字节流或I/O流。
进程通过描述符引用I/O流，也被称作文件描述符。管道、文件、POSIX IPC's（消息队列，信号量，共享内存），事件队列等都是通过文件描述符引用I/O流。

创建和释放描述符

描述符创建：

通过系统命令调用（open,pipe,socket等）创建；
继承自父进程。

描述符释放：

进程退出
系统调用close
标记为close on exec的描述符在exec后释放

Close-on-exec

当进程forks时，所有描述符都会复制到子进程中。如果任意描述符被标记为close on exec，那么当子进程execs之前，父进程forks之后，这些描述符将关闭并且在子进程中不再可用。

使用描述符通过read、 write命令调用的数据转换

File Entry

每个描述符都指向内核中的File entry的数据结构。file entry为每个描述符维度了一个file offset。系统调用命令open创建file entry.

Fork/Dup and File Entries

由fork创建的描述符被父子进程共享，在file entry中引用同一个offset。dup/dup2的系统调用与此类似。

#include <unistd.h>  
#include <sys/stat.h>  
#include <fcntl.h>  
#include <stdio.h>

int main(char \*argv\[\]) {  
    int fd = open("abc.txt", O\_WRONLY | O\_CREAT | O\_TRUNC, 0666);  
    fork();  
    write(fd, "xyz", 3);  
    printf("%ld\\n", lseek(fd, 0, SEEK\_CUR));  
    close(fd);  
    return 0;  
}

运行结果

3
6

Offset-per-descriptor

因为多个描述符可能引用同一个file entry, file entry为每个描述符维护了一个file offset。read和write操作从这个file offset开始，并且在数据转换之后file offset也将更新。offset决定了下次read write操作的位置。当进程终止时，内核将回收所有该进程所持有的描述符，如果此进程是引用file entry的最后一个进程，内核将回收整个file entry。

剖析File Entry

每个file entry包含：

类型
函数指针数组。这个函数指针数组将通用的对描述符的操作转换为具体文件类型的实现。

稍微解释下，所有的描述符都对外提供了一套通用的API操作，包含读、写、修改描述符模式、截断描述符、ioctl操作、polling等。
针对不同类型的文件，这些操作都有所不同，并且有不同的实现。对sockets的读操作与对pipes的读操作就有所不同，即使它们高层次的API是一样的。open命令并不在此列，因为不同类型的文件的open操作差异非常大。但是一旦file entry由open创建，剩下的操作都可以使用同一套通用的API

大多数的网络通讯使用sockets。sockets由描述符引用，作为传输的终点。两个进程可以创建两个sockets，通过连接这两个sockets建立可靠的字节流传输。一旦连接建立，描述符可以使用file offsets进行读写。内核可以将一个进程的输出重定向到另一台机器的另一个进程。对于字节流连接，统一使用read write命令读写，但对于不同类型的消息（比如网络数据包）使用不同的系统命令处理。

非阻塞描述符

默认情况下，在没有数据可用时，通过描述符read将阻塞。write和send也是如此。多数描述符的操作都是如此，但是磁盘文件除外，因为写磁盘并不是直接写，而是通过内核的buffer cache。只有当open磁盘文件时使用O_SYNC标识才会同步写磁盘。

任何描述符（pipes, FIFOs, sockets, terminals, pseudo-terminals等）都可以设置为非阻塞模式。当一个描述符设置为非阻塞模式时，对此描述符的I/O调用都将立即返回，即使此请求并不能马上完成（请求完成期间将使进程阻塞）。返回值分为下列情况：

an error: 操作完全不能完成
a partial count: 输入或输出可以部分完成
the entire result: I/O操作可以完全完成

通过设置非延迟标识O_NONBLOCK将描述符设置为非阻塞模式。这个标识也被叫做“open-file”状态标识。

描述符就绪

当进程通过描述符执行I/O操作时不被阻塞，称为描述符就绪。描述符就绪与操作是否会传输数据无关，而只与I/O操作是否可以无阻塞执行相关。

当有I/O事件发生时描述符进行就绪状态，例如新输入的到达、socket连接完成或者当TCP将列队中的数据传输后，socket的发送buffer出现可用容量时。

有两种方式可以判断一个描述符是否进入就绪状态——edge triggered和level triggered

Level Triggered

可以把level triggered看作是拉模式（pull或poll模式）。为了判断一个描述符是否就绪，进程尝试执行非阻塞的I/O操作。进程可以执行任意次这样的操作。这为随后的I/O操作提供了更多灵活性。比如，一个描述符进入就绪状态，进程可以读取所有可用数据，也可以不执行任何I/O操作，或者不读取buffer中的所有数据。
下面举例来看下

在t0时间，进程尝试使用非阻塞描述符进行I/O操作。如果I/O操作阻塞，系统调用返回error。