python - PyYAML 未解析所有示例

标签 python yaml pyyaml

我正在尝试理解 https://pyyaml.org/wiki/PyYAML 上的声明那:

PyYAML features

- a complete YAML 1.1 parser. In particular, PyYAML can parse all 
  examples from the specification. 

如果您访问使用 PyYAML ( http://yaml-online-parser.appspot.com/ ) 的在线 YAML 解析器,那么从规范中获取的几个示例不起作用

我知道您需要为其中一些失败定义标签,并且在线解析器只能处理单个文档 YAML,我知道如何在使用 PyYAML 时“修复”这个问题。

但是示例 11 也失败了,它没有特殊标签并且是单个文档。 PyYAML 如何声称它可以解析所有示例,而它显然不能解析?这是因为 PyYAML 适用于 YAML 1.1 而示例来自 YAML 1.2 规范吗?

最佳答案

从最后一个问题开始:由于示例,这不是 来自后来的规范。假设你限制自己 规范中的预览章节/部分(与在线解析器一样), 考虑到我只比较了例子 视觉上(即不是逐个字符地),示例 1.2 和 1.1 规范中第 2 章/节的内容相同。

您的误解来自于在 在线解析器的标题。它实际上试图做的是加载 YAML,然后转储为 JSON、Python 或规范 YAML。 正在加载 PyYAML 由Processing Overview 中提到的阶段组成。 YAML 中的图片 规范(1.1 和 1.2 相同),从基于字符的开始 文档:解析、撰写和构建步骤。

PyYAML 不会在解析步骤中失败,但会在构建时失败 步骤,因为(如 @torek 所示)PyYAML 构造了一个 list 并且 不能用作 Python dict 的键。这是一个 Python 的 dict 实现的限制,在我看来是 PyYAML 的缺陷之一。

import sys
import yaml as pyyaml

yaml_1_1_example_2_11 = """\
? - Detroit Tigers
  - Chicago cubs
:
  - 2001-07-23

? [ New York Yankees,
    Atlanta Braves ]
: [ 2001-07-02, 2001-08-12,
    2001-08-14 ]
"""

for event in pyyaml.parse(yaml_1_1_example_2_11):
    print(event)

给出:

StreamStartEvent()
DocumentStartEvent()
MappingStartEvent(anchor=None, tag=None, implicit=True)
SequenceStartEvent(anchor=None, tag=None, implicit=True)
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='Detroit Tigers')
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='Chicago cubs')
SequenceEndEvent()
SequenceStartEvent(anchor=None, tag=None, implicit=True)
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='2001-07-23')
SequenceEndEvent()
SequenceStartEvent(anchor=None, tag=None, implicit=True)
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='New York Yankees')
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='Atlanta Braves')
SequenceEndEvent()
SequenceStartEvent(anchor=None, tag=None, implicit=True)
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='2001-07-02')
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='2001-08-12')
ScalarEvent(anchor=None, tag=None, implicit=(True, False), value='2001-08-14')
SequenceEndEvent()
MappingEndEvent()
DocumentEndEvent()
StreamEndEvent()

所以 PyYAML 可以正确解析它。不仅如此,如果在线“解析器” 不会尝试加载,然后转储,当发出规范的 YAML 时,它可以 处理这个例子(替换上面的最后两行 代码):

pyyaml.emit(pyyaml.parse(yaml_1_1_example_2_11), stream=sys.stdout, canonical=True)

如下所示:

---
{
  ? [
    ! "Detroit Tigers",
    ! "Chicago cubs",
  ]
  : [
    ! "2001-07-23",
  ],
  ? [
    ! "New York Yankees",
    ! "Atlanta Braves",
  ]
  : [
    ! "2001-07-02",
    ! "2001-08-12",
    ! "2001-08-14",
  ],
}

声明 PyYAML 解析所有示例,就像我声明我可以 读希腊语。我在 70 年代就学会了希腊字母,所以我可以 阅读希腊语(字符),但我不明白它们组成的单词。


ruamel.yaml (免责声明:我是该包的作者)中,您可以加载此示例,您甚至可以使用 PyYAML 来 转储加载的数据。

from pprint import pprint
import ruamel.yaml
import yaml as pyyaml

yaml = ruamel.yaml.YAML(typ='safe')
data = yaml.load(yaml_1_1_example_2_11)
pprint(data)
print('*' * 50)
yaml.dump(data, sys.stdout)
print('*' * 50)
pyyaml.safe_dump(data, sys.stdout)

这样给出:

{('Detroit Tigers', 'Chicago cubs'): [datetime.date(2001, 7, 23)],
 ('New York Yankees', 'Atlanta Braves'): [datetime.date(2001, 7, 2),
                                          datetime.date(2001, 8, 12),
                                          datetime.date(2001, 8, 14)]}
**************************************************
? [Detroit Tigers, Chicago cubs]
: [2001-07-23]
? [New York Yankees, Atlanta Braves]
: [2001-07-02, 2001-08-12, 2001-08-14]
**************************************************
? [Detroit Tigers, Chicago cubs]
: [2001-07-23]
? [New York Yankees, Atlanta Braves]
: [2001-07-02, 2001-08-12, 2001-08-14]

关于python - PyYAML 未解析所有示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53995421/

相关文章:

Python: pip 在根目录下安装子包

machine-learning - Kedro - 如何将嵌套参数直接传递给节点

python - Salt 和 Python 的 YAML 语法

python - 如果显示其他文本则终止 raw_input()

python - 在 'for in' 循环中访问迭代器

python - 如何拥有兼具元组和字典特性的数据结构

ruby - 用 Ruby 编写 YAML 文件 : lack of pretty printing formatting options

python - 如何处理 PyYaml 中的标签/类向后兼容性?

amazon-web-services - 使用 PyYAML 库解析 AWS CloudFormation 模板

python - 解析 YAML,返回行号