python - 以任何顺序和数字处理一系列 pyparsing 表达式

标签 python python-2.7 parsing pyparsing

使用 pyparsing,我需要指定两个表达式可以在两个大括号之间以任意顺序和任意数量出现。下面是我的代码。

import pyparsing as pp

def updateList(someList):
    def parseAction(str, loc, tokens):
        someList.append(tokens[0])
    return parseAction

msgNameList = []
ident = pp.Word(pp.alphanums + "_" + ".")
openBrace = pp.Suppress(pp.Literal("{"))
closeBrace = pp.Suppress(pp.Literal("}"))
fieldKw = pp.Keyword("field")
fieldExpr = fieldKw + ident + ident
msgKw = pp.Suppress(pp.Keyword("msg"))
msgName = ident.setParseAction(updateList(msgNameList))
msgExpr = pp.Forward()
msgBody = (openBrace + (pp.ZeroOrMore(fieldExpr) & pp.ZeroOrMore(msgExpr)) + closeBrace)
msgExpr << msgKw + msgName + pp.Optional(msgBody)

testStr1 = "msg msgNameA {msg msgNameAB {field type2 field2} field type1 field1}"
msgExpr.parseString(testStr1)
print msgNameList

msgNameList = []
testStr2 = "msg msgNameA {field type1 field1 msg msgNameAB {field type2 field2}}"
msgExpr.parseString(testStr2)
print msgNameList

产生这个输出:

['msgNameA', 'msgNameAB', 'type2', 'field2', 'type1', 'field1']
[]

请注意,我仅在解析 msgName 表达式时才将其添加到 msgNameList。 (最终的表达式和解析函数会更复杂。)

我想要的两个测试字符串的输出是:

['msgNameA', 'msgNameAB']

我确定我对 msgBody 的解析表达式不正确,但我不知道如何在 pyparsing 中表达我需要的内容。在大括号内,msgExpr 或 fieldExpr 可以以任何顺序和任何数量出现(msgExpr ... fieldExpr ... 或 fieldExpr ... msgExpr ...)。一些例子:

  1. msgExpr msgExpr fieldExpr fieldExpr fieldExpr msgExpr
  2. fieldExpr msgExpr fieldExpr fieldExpr msgExpr fieldExpr
  3. msgExpr fieldExpr fieldExpr

我知道一定有办法做到这一点,但我想念它。

提前致谢

最佳答案

(首先,以后请准备一个MCVE你的问题,你的问题的要点是

Using pyparsing, I need to specify that two expressions can occur in any order and in any number between two braces. Below is my code.

所以请准备一个仅包含足够详细信息的问题。)

假设我们开始

from pyparsing import *

foo = Literal('foo')
bar = Literal('bar')

然后指定“括号内的任何顺序和任何数字”

openBrace = Suppress(Literal("{"))
closeBrace = Suppress(Literal("}"))

foo_or_bar = foo | bar
content = ZeroOrMore(foo_or_bar)
exp = openBrace + content + closeBrace

现在我们可以检查:

In [40]: exp.parseString('{foo}')
Out[40]: (['foo'], {})

In [41]: exp.parseString('{foobarfoo}')
Out[41]: (['foo', 'bar', 'foo'], {})

关于python - 以任何顺序和数字处理一系列 pyparsing 表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38925138/

相关文章:

python - 填充或截断 Python 列表

python - 使用具有不同参数的 cv2.ellipse 时椭圆拟合异常?

android - 解析 XML 的最佳实践

javascript - 尽管格式看似正确,但 d3.js 无法将我的字符串解析为日期? (v4)

python - 按数据框中的一列进行分组,但将其中一些组汇总为一组

python - Flask reSTLess 无法构造查询

python - 比循环查找数据更快或更好的方法?

c# - 使用 LINQ 在 C# 中将分隔字符串转换为 xml

python - 在 Python 中使用数量时消除单位

python - 如何在 x 和两个函数之间填充(交集)?