我知道这是一个反复出现的问题,我已经阅读了类似下面的文章 http://www.mailinator.com/tymaPaulMultithreaded.pdf说 nio 的扩展性比 io 更好并不一定是真的。
但我正在努力了解 java nio 在开发 Web 服务器时如何比传统的接受器/工作线程架构更好地扩展?让我解释一下:
通常 Java Web 服务器使用以下模式来处理连接:
一些受限于内核数量的接受器线程阻塞在 ServerSocket 的 accept() 方法上:
while (true) { socket = serverSocket.accept(); // handleRequest submits the socket to a queue handleRequest(socket); socket.close(); }
当客户端套接字被检索到时,它被提交到一个非阻塞队列,然后由工作线程池中的一个工作线程处理。工作线程的数量取决于正在执行的 io 操作的持续时间。
如何使用 java.nio 使该架构更具可扩展性?
我的意思是我仍然需要工作线程来处理会执行阻塞操作(访问数据库或文件系统、调用外部服务)的请求。如果后端操作不像在 node.js 中那样异步执行,与 1 或 2 个事件调度程序线程相比,我仍然需要会限制整体可伸缩性的工作线程。
最佳答案
我真的很喜欢 Paul Tyma 关于这个问题的文章,它真的很深入。我会在他的文章中看到两个要点:
- 您可以通过传统的阻塞 IO 获得更好的吞吐量(他测量过)
- 传统的阻塞 IO 使您的服务器逻辑不太复杂 -- 客户端-服务器对话的状态在线程流中隐式定义。
使用非阻塞 NIO 的主要原因是当您有很多许多同时存在的空闲请求时。这样做的原因是:使用 NIO,您可以从同一个线程处理多个请求,这更好。
好的,这就是你随处都能看到的内容。现在...为什么这更好?
有两个主要原因,它们与每个线程带来的两种不同类型的开销有关:
- 当调度程序更改处理器正在执行的线程时,会出现一个“上下文切换”,这可能是一个代价高昂的操作(即线程在处理器中有一些状态——寄存器中的值,加载的大量数据L1、L2、L3 缓存等——必须在线程停止时“保存”在某处,并在线程继续执行时“重新加载”;此外,当您丢失 L1、L2、L3 缓存的内容时,您可能会得到大量的缓存未命中,这可能很糟糕(或不是,取决于工作量))
- 每个线程都必须分配自己独立的栈(通常用于存储局部变量和函数调用的返回地址)
因此,每个线程都带有更多“浪费”的内存和可能“浪费”的处理器周期(以执行“上下文切换”)。
现在,假设您有一个聊天服务器,客户端建立 HTTP 连接请求新消息,您的服务器仅在有新消息发送给该客户端时才响应它们(以便客户端立即收到新消息)。假设您有 10k 个这样的客户。在传统的、阻塞的、每个连接一个线程的模型中,你会有 10k 个线程。在 Java 中,线程堆栈大小 (-Xss) 的典型标准值为 256kb。使用 10k 线程,您将自动使用大约 2GB 内存!!!!!!!!!!更糟的是:即使您的聊天服务器上根本没有任何 Activity ,没有消息被发送,客户端仍然会让您浪费这 2GB。添加大量的上下文切换,你会发现你遇到了问题。
在这种情况下,您最好使用非阻塞 NIO,其中更少的线程(最终只有 1 个!)就足以处理所有 10k 个客户端,因此您可以节省上下文切换(即 cpu时间)和线程堆栈(即内存),甚至以更复杂的代码为代价,这通常是使用非阻塞 NIO 的副作用。
关于java - java.nio 对 Web 服务器有什么好处?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15850033/