python - 三重奏 : multiple tasks reading from the same fd

标签 python python-trio

我有一个文件描述符,我想通过多个任务读取它。 fd 上的每个 read() 请求都将返回一个完整的、独立的数据包(只要数据可用)。

我天真的实现是让每个工作人员运行以下循环:

async def work_loop(fd):
   while True:
     await trio.hazmat.wait_readable(fd)
     buf = os.read(fd, BUFSIZE)
     if not buf:
         break
     await do_work(buf)

不幸的是,这不起作用,因为如果多个任务在同一个 fd 上阻塞,则 trio 会引发 ResourceBusyError。所以我的下一次迭代是编写一个自定义等待函数:

async def work_loop(fd):
   while True:
     await my_wait_readable(fd)
     buf = os.read(fd, BUFSIZE)
     if not buf:
         break
     await do_work(buf)

哪里

read_queue = trio.hazmat.ParkingLot()
async def my_wait_readable():
    if name is None:
        name = trio.hazmat.current_task().name
    while True:
        try:
            log.debug('%s: Waiting for fd to become readable...', name)
            await trio.hazmat.wait_readable(fd)
        except trio.ResourceBusyError:
            log.debug('%s: Resource busy, parking in read queue.', name)
            await read_queue.park()
            continue
        log.debug('%s: fd readable, unparking next task.', name)
        read_queue.unpark()
        break

但是,在测试中我收到如下消息:

2018-09-18 13:09:17.219 pyfuse3-worker-37: Waiting for fd to become readable...
2018-09-18 13:09:17.219 pyfuse3-worker-47: Waiting for fd to become readable...
2018-09-18 13:09:17.220 pyfuse3-worker-53: Waiting for fd to become readable...
2018-09-18 13:09:17.220 pyfuse3-worker-51: fd readable, unparking next task.
2018-09-18 13:09:17.220 pyfuse3-worker-51: doing work
2018-09-18 13:09:17.221 pyfuse3-worker-47: Resource busy, parking in read queue.
2018-09-18 13:09:17.221 pyfuse3-worker-37: Resource busy, parking in read queue.
2018-09-18 13:09:17.221 pyfuse3-worker-53: Resource busy, parking in read queue.

换句话说:

  1. 所有任务进入trio.hazmat.wait_read
  2. 一个任务成功返回并尝试取消停放下一个任务(但没有)
  3. 其他任务收到 BusyError 并自行停止
  4. 什么也没发生,因为所有 worker 都停了下来

解决这个问题的正确方法是什么?

最佳答案

来自同一个 fd 的多个读取器没有意义,使用(或不使用)Trio 不会改变这个基本事实。您为什么要尝试这样做?

如果由于某种原因您确实需要并行多个任务来后处理数据,请使用一个读取任务将数据添加到队列中,并让您的处理任务从中获取数据。

或者,您可以使用锁:

read_lock = trio.Lock()
async def work_loop(fd):
   while True:
     async with read_lock:
        await trio.hazmat.wait_readable(fd)
        buf = os.read(fd, BUFSIZE)
     if not buf:
         break
     await do_work(buf)

关于python - 三重奏 : multiple tasks reading from the same fd,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52386609/

相关文章:

python - 将基于轮询的异步 API 包装为 Awaitable

python - 我需要做什么才能让 Watson 聊天机器人持续对话?

python - 如何将 django 请求的值传递给 Celery 中的周期性任务?

python - 结合 py.test 和 trio/curio

python - 检测当前异步库

python - 我怎么能用 trio 异步读取文件的特定行

python - salt 执行模块中的产量以在执行期间返回状态

python - 如何重命名 IPython 中的魔法函数?

python - 从 setup.py 安装依赖项

python - 没有IO操作的Trio执行时间