所以我有以下字符串(每个字符串都是 .txt 文件的一行),并且我构建了一个解析器来解析第一行,如下所示:
第 1 行:“N1 0.00000000 0.00000000 0.00000000 N 型等级 4”
parser1 = Word(alphas + nums) + Word(printables + '.' + printables) + Word(printables + '.' + printables) \
+ Word(printables + '.' + printables) + Word(alphas) + Word(alphas) + Word(alphas) + Word(nums)
result = (['N1', '0.00000000', '0.00000000', '0.00000000', 'Type', 'N', 'Rank', '4'], {})
这太棒了。但是,此行之后仅跟随 float ,可能有也可能没有减号,例如:
line2 = " -1.064533
-0.000007 -0.130782 0.044770
0.335373 -0.000007 -0.000006 -0.451296 0.378061
-0.000034 -0.990753 -1.404081 -0.000067 -0.000150
-0.096208 -0.714299
-0.017676 0.000019 0.000034 0.804011 0.911492
0.000019 0.000027 0.441683 0.107567"
我尝试使用以下解析器来获取这些数字,但不幸的是它也会获取 line1:
parser2 = Word(printables + '.' + printables)
有没有一种方法可以解析 float ,可以更好地包含可打印的减号?
非常感谢(我是 pyparsing 的新手,所以要严厉一点)
最佳答案
Word(printables + '.' + printables)
不符合您的想法。 printables
是一个字符串,因此 printables + '.' + printables
计算结果为一个非常长的字符串,其中包含所有可打印字符,后跟一个句点,再后跟所有可打印字符。然后使用该字符串构造一个 Word
对象,该对象将匹配所有可打印字符集中的一组以空格分隔的字符(并且由于“.”是可打印的,因此它已经在该集合中了)。
我怀疑你真正想要用来解析带有可选前导减号的实数是这样的
Optional('-') + Word(nums) + '.' + Word(nums)`
请注意,加法是通过解析表达式完成的,而不是通过传递给 Word 的字符串完成的。这会将 '-1.23' 解析为 ['-', '1', '.', '23']
。要将所有内容作为单个字符串,请将其包装在组合中:
Combine(Optional('-') + Word(nums) + '.' + Word(nums))
然后,使用该表达式您将得到“-1.23”。之后您仍需要使用内置的 float()
将其转换为 Python float 。
pyparsing_common.real
是一个预定义的浮点解析表达式,它将处理前导符号,和在解析时从字符串转换为 float ,这样当你得到来自解析器的值,它已经转换为 float 。
关于python - 如何在 pyparsing 中解析 float ,包括减号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54325146/