python - 通过TCP在python中接收分隔的Protobuf消息

标签 python sockets protocol-buffers

我正在尝试接收一条 protobuf 消息,该消息是从我的 python 应用程序中使用“writeDemitedTo()”的 java 应用程序发送的。

经过一些研究,我已经发现了这段代码来从套接字读取消息,对其进行解码并解析。

data = sock.recv()
(size, position) = decoder._DecodeVarint(data, 0)
msg = MessageWrapper_pb2.WrapperMessage().ParseFromString(data[position:position + size])

我现在得到的是 google.protobuf.message.DecodeError: Truncated message Exception。

有人遇到过类似的问题或者知道如何从套接字读取分隔数据并正确解析它吗?

编辑:

这是对我有用的解决方案。

def read_java_varint_delimited_stream(sock):
    buf = []
    data = sock.recv()
    rCount = len(data)
    (size, position) = decoder._DecodeVarint(data, 0)

    buf.append(data)
    while rCount < size+position:
        data = sock.recv(size+position-rCount)
        rCount += len(data)
        buf.append(data)

    return b''.join(buf), size, position

def readMessage(sock):
    data, size, position = read_java_varint_delimited_stream(sock)
    msg = MessageWrapper_pb2.WrapperMessage()
    msg.ParseFromString(data[position:position + size])

    return msg

最佳答案

TCP 是一种流协议(protocol),没有任何内容表明一端的 recv 与另一端的单个 send 配对。基于消息的协议(protocol)需要某种方式来标记其边界,以便接收者知道如何找到消息边界。

writeDelimitedTo docs假设先发送 varint 大小,然后发送数据。因此,读取 varint,然后读取该字节数。

深入挖掘,varint docs描述如何使用字节的高位来标记连续性来对其值进行编码。我们可以编写自己的解码器

import struct

def read_java_varint_delimited_stream(sock):
    sz = 0
    while True:
        vbyte, = struct.unpack('b', sock.recv(1))
        sz = (vbyte << 7) + (vbyte & 0x7f)
        if not vbyte & 0x80:
            break
    data = []
    while sz:
        buf = sock.recv(sz)
        if not buf:
            raise ValueError("Buffer receive truncated")
        data.append(buf)
        sz -= len(buf)
    return b''.join(buf)

关于python - 通过TCP在python中接收分隔的Protobuf消息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43897955/

相关文章:

python - Python 中的 mkdir -p 功能

python - 是否可以在 python 一个线性三元条件运算符中放置中断

java - ProgressDialog 不会消失!空指针异常

iphone - 关于 iPhone 上的 ProtocolBuffers

java - 如何使用 java 反射创建 protobuf 实例?

python - 图像预处理和数据增强应该如何用于语义分割?

python - 如何向此代码添加打印语句而不会出现缩进错误

带套接字的 Java IPC - 使用环回设备

java - Android 套接字输入流读取(后跟 EPIPE)

java - 为什么在java中使用 Protocol Buffer