<分区>
我真的很喜欢 Python 构造模块用于定义双向(二进制|文本)解析器/构建器的声明性语法。
我最近开始关注 golang,想知道是否有人见过(或可能是受人尊敬的作者)类似的 golang 库。
如果您从未使用过 construct模块,您基本上构建了一个 Python 对象的声明树,您可以将其提供给 Python 对象树并获取二进制 blob,或者将二进制 blob 解析为 Python 对象树。
构造网页中的一个简单示例:
>>> PascalString2 = ExprAdapter(PascalString,
... encoder = lambda obj, ctx: Container(length = len(obj), data = obj),
... decoder = lambda obj, ctx: obj.data
... )
>>> PascalString2.parse("\x05hello")
'hello'
>>> PascalString2.build("i'm a long string")
"\x11i'm a long string"
来源中的一个稍微复杂的示例,显示了硬盘 MBR 解析器。
mbr = Struct("mbr",
HexDumpAdapter(Bytes("bootloader_code", 446)),
Array(4,
Struct("partitions",
Enum(Byte("state"),
INACTIVE = 0x00,
ACTIVE = 0x80,
),
BitStruct("beginning",
Octet("head"),
Bits("sect", 6),
Bits("cyl", 10),
),
Enum(UBInt8("type"),
Nothing = 0x00,
FAT12 = 0x01,
XENIX_ROOT = 0x02,
XENIX_USR = 0x03,
FAT16_old = 0x04,
Extended_DOS = 0x05,
FAT16 = 0x06,
FAT32 = 0x0b,
FAT32_LBA = 0x0c,
NTFS = 0x07,
LINUX_SWAP = 0x82,
LINUX_NATIVE = 0x83,
_default_ = Pass,
),
BitStruct("ending",
Octet("head"),
Bits("sect", 6),
Bits("cyl", 10),
),
UBInt32("sector_offset"), # offset from MBR in sectors
UBInt32("size"), # in sectors
)
),
Const("signature", b"\x55\xAA"),
)
有一个 TCP/IP stack这个例子真正展示了构造模型的强大之处,它能够将一口大小的定义 block 组合到一个解析器/生成器中。
我知道有 PEG/EBNF 解析器生成器,但我希望能看到一些更漂亮的东西。