使用Python。 在我的语法中,我有这样一行:
ipv6_comp: [ipv6_hex (":" ipv6_hex)~0..5] "::" [ipv6_hex (":" ipv6_hex)~0..5]
我的变压器具有适当的功能
def ipv6_comp(self, args):
但是,args
看起来像这样:
<class 'list'>: ['2001', 'db8', '85a3', '8a2e', '370', '7334']
因为不包括文字。然而,从这个结构来看,我显然不可能知道原始ip是否像以下任何一个:
2001:db8:85a3::8a2e:370:7334
2001:db8:85a3:8a2e::370:7334
我想我可以用他们自己的规则来掩盖文字,例如
colon: ":"
doublecolon: "::"
ipv6_comp: [ipv6_hex (colon ipv6_hex)~0..5] doublecolon [ipv6_hex (colon ipv6_hex)~0..5]
这甚至可能更干净。然而,我使用的语法是半自动生成的,这需要更多的手工劳动。
有没有办法让我的转换器函数 ipv6_comp
在 args
参数中也包含文字?
最佳答案
有两种方法可以解决您的问题。
- 将
ipv6_comp
变成终端。然后 Lark 会在单个正则表达式中匹配所有内容,并返回所有匹配的字符:
IPV6_COMP: [HEX (":" HEX)~0..5] "::" [HEX (":" HEX)~0..5]
为您的标点符号提供一个名称(您建议的名称,但作为终端)
冒号:“:”
使用
!
运算符在规则中包含标点符号(即:未命名符号)
!ipv6_comp: [ipv6_hex (":" ipv6_hex)~0..5] "::" [ipv6_hex (":" ipv6_hex)~0..5]
我推荐第一种解决方案,因为它解析速度更快,并且解析完成后可以使用专用库将IPv6地址解析为组件。
关于python - lark : How to make literals appear in the tree,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58247933/