python - Pyparsing分隔列表只返回第一个元素

标签 python pyparsing

这是我的代码:

l = "1.3E-2   2.5E+1"
parser = Word(alphanums + '+-.')
grammar = delimitedList(parser,delim='\t ')
print(grammar.parseString(l))

它返回:

['1.3E-2']

很明显,我想要所有两个值,而不是一个值,知道发生了什么吗?

最佳答案

正如@dawg 所解释的那样,delimitedList 适用于您的表达式带有分隔符非空白 的情况,通常是逗号。 Pyparsing 隐式跳过空格,因此在 pyparsing 世界中,您真正看到的不是 delimitedList,而是 OneOrMore(realnumber) .此外,parseString 在内部调用 str.expandtabs在提供的输入字符串上,除非您使用 parseWithTabs=True争论。将制表符扩展为空格有助于保持表格形式的数据的列对齐,当我最初编写 pyparsing 时,这是一个普遍的用例。

如果您可以控制此数据,那么您可能希望使用与 <TAB> 不同的分隔符,也许是逗号或分号。如果您坚持使用这种格式,但决定使用 pyparsing,那么请使用 OneOrMore。

随着您的前进,您还需要更精确地了解您定义的表达式和您使用的变量名称。 “parser”这个名字信息量不大,Word(alphanums+'+-.') 的模式除了科学记数法中的有效实数值外,还会匹配很多东西。我知道,如果您只是想让任何东西 正常工作,这是一个合理的第一步,您可以在一切正常后回来调整它。如果您实际上要解析实数,那么这里有一个可能有用的表达式:

realnum = Regex(r'[+-]?\d+\.\d*([eE][+-]?\d+)?').setParseAction(lambda t: float(t[0]))

然后您可以将您的语法定义为“OneOrMore(realnum)”,这也更加不言自明。解析操作会在解析时将您的字符串转换为 float ,这将在以后实际处理解析值时节省您的步骤。

祝你好运!

关于python - Pyparsing分隔列表只返回第一个元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27552627/

相关文章:

python - 以天为单位的日期时间差异的高性能计算

python - 保留文本结构信息 - pyparsing

python - Pyparsing 是否支持上下文相关语法?

Python 的 pyparsing : Implementing grammar to parse logical AND expression

python - 获取 NumPy 数组中多个索引处的元素

python - python 内置函数 min() 和 sorted() 中的参数

python - 属性错误: 'FigureCanvasWxAgg' object has no attribute '_idletimer'

python - 在 virtualenv 中使用 CUDA 为 Theano 服务

python - 对段落进行 Pyparsing

python - Pyparsing 中的贪婪表达式