ocaml - Lwt 泄漏文件描述符,不确定是 bug 还是我的代码

标签 ocaml resource-leak ocaml-lwt

(交叉发布到 lwt github 问题)

我已将我的用法归结为此代码示例,该示例将泄漏文件描述符。

假设你有:

#require "lwt.unix"

open Lwt.Infix

let echo ic oc = Lwt_io.(write_chars oc (read_chars ic))

let program =
  let server_address = Unix.(ADDR_INET (inet_addr_loopback, 2000)) in

  let other_addr = Unix.(ADDR_INET (inet_addr_loopback, 2001)) in

  let server = Lwt_io.establish_server server_address begin fun (tcp_ic, tcp_oc) ->
      Lwt_io.with_connection other_addr begin fun (nc_ic, nc_oc) ->

        Lwt_io.printl "Created connection" >>= fun () ->
        echo tcp_ic nc_oc <&> echo nc_ic tcp_oc >>= fun () ->
        Lwt_io.printl "finished"

      end
      |> Lwt.ignore_result

    end
  in
  fst (Lwt.wait ())

let () =
  Lwt_main.run program

然后您创建一个简单的服务器:

nc -l 2001

然后让我们启动 OCaml 代码 utop 示例.ml

然后打开客户端

nc localhost 2000
blah blah
^c

然后使用 lsof 查看端口 2000 的连接,我们看到

ocamlrun 71109 Edgar    6u  IPv4 0x7ff3e309cb80aead      0t0  TCP 127.0.0.1:callbook (LISTEN)
ocamlrun 71109 Edgar    7u  IPv4 0x7ff3e309c9dc8ead      0t0  TCP 127.0.0.1:callbook->127.0.0.1:54872 (CLOSE_WAIT)

事实上,对于 nc localhost 2000 的每次使用,我们都会从 lsof 使用中获得剩余的 CLOSE_WAIT 记录。

最终这将导致系统耗尽文件描述符,这最烦人的是不会使程序崩溃,但会导致 Lwt 挂起。

我无法判断我是否做错了什么,或者这是否是一个真正的错误,无论如何,这对我来说都是一个严重的错误,我在 10 小时内用完了文件描述符......

编辑:在我看来,问题在于连接的一侧已关闭,但另一侧未关闭,我认为 with_connection 应该在任何一侧关闭时进行清理/关闭,也称为 nc_icnc_oc 关闭时。

编辑 II:我已经尝试了使用 Lwt_io.close 手动关闭描述符的所有方法,但仍然收到 CLOSE_WAIT 消息。

编辑 III:甚至在给 with_connection 的可选 fd 参数的原始 fd 上使用 Lwt_unix.close ,也会产生类似的不良结果。

编辑 IV:最阴险的是,如果我使用 Lwt_daemon.daemonize,那么这个问题似乎就会消失

最佳答案

首先,不清楚为什么使用 join <&>而不是选择<?> 。我想如果双方之一都想关闭连接,就应该关闭它。

关于CLOSE_WAIT :来自 utop 的半封闭连接服务器至nc客户端。

一个TCP连接由两个半连接组成,它们独立关闭。来自nc的连接客户至utop服务器被 nc 关闭由于Ctrl-C 。但是您必须通过关闭输出流来显式关闭服务器端的相反连接。我不知道为什么Lwt.establish_server不会自动关闭它。可能,这是一个设计问题。

这对我在 CentOS 7 上有效:

Lwt_io.printl "Created connection" >>= fun () ->
echo tcp_ic nc_oc <?> echo nc_ic tcp_oc >>= fun () ->
Lwt_io.close tcp_oc >>= fun () ->
Lwt_io.printl "finished"

此外,还有一个简化的代码片段可以重现该问题:

#require "lwt.unix"

let program =
  let server_address = Unix.(ADDR_INET (inet_addr_loopback, 2000)) in

  let _server = Lwt_io.establish_server server_address begin fun (ic, oc) ->
    (* Lwt_io.close oc |> Lwt.ignore_result; *) ()
  end
  in
  fst (Lwt.wait ())

let () =
  Lwt_main.run program

运行nc localhost 2000多次获取CLOSE_WAIT中的连接状态。取消注释代码以解决问题。

关于ocaml - Lwt 泄漏文件描述符,不确定是 bug 还是我的代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34733384/

相关文章:

ocaml - 如何使用 ocamlbuild 将 -S 标志传递给 ocamlopt?

ocaml - 反编译 OCaml 字节码文件

memory-leaks - 服务的BandwidthIn和BandwidthOut图代表什么?

ocaml - 如何使某些东西支持 lwt?

node.js - OCaml/Node.JS 上的 Lwt.async 和 Lwt_main.run 有什么区别?

ocaml - 将多态类型转换为字符串('a -> string)

module - Ocaml 值与模块和签名中的参数化类型不匹配

c# - 检测 Oracle 连接泄漏的最佳方法?

.Net 4.0 上的 SQL 句柄泄漏,但 .Net 3.5 上没有

garbage-collection - 如何停止 OCaml 垃圾收集我的响应式(Reactive)事件处理程序?