xml - 使用 Ruby 和 Hpricot 将 xml 转换为 yaml - 这里出了什么问题?

标签 xml ruby yaml

我正在尝试将 xml 文件 blog.xml 输出为 yaml,以便放入 vision.app,这是一种用于在本地设计 shopify 电子商务网站的工具。

Shopify 的 yaml 如下所示:

- id: 2
  handle: bigcheese-blog
  title: Bigcheese blog
  url: /blogs/bigcheese-blog
  articles:
    - id: 1
      title: 'One thing you probably did not know yet...'
      author: Justin
      content: Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.
      created_at: 2005-04-04 16:00
      comments:
        - 
          id: 1
          author: John Smith
          email: john@smith.com
          content: Wow...great article man.
          status: published
          created_at: 2009-01-01 12:00
          updated_at: 2009-02-01 12:00
          url: ""
        - 
          id: 2
          author: John Jones
          email: john@jones.com
          content: I really enjoyed this article. And I love your shop! It's awesome. Shopify rocks!
          status: published
          created_at: 2009-03-01 12:00
          updated_at: 2009-02-01 12:00
          url: "http://somesite.com/"
    - id: 2
      title: Fascinating
      author: Tobi
      content: Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.
      created_at: 2005-04-06 12:00
      comments:
  articles_count: 2
  comments_enabled?: true 
  comment_post_url: ""
  comments_count: 2
  moderated?: true

但是,示例 myxml 如下所示:

       <article>
          <author>Rouska Mellor</author>
          <blog-id type="integer">273932</blog-id>
          <body>Worn Again are hiring for a new Sales Director.

      To view the full job description and details of how to apply click &quot;here&quot;:http://antiapathy.org/?page_id=83</body>
          <body-html>&lt;p&gt;Worn Again are hiring for a new Sales Director.&lt;/p&gt;
      &lt;p&gt;To view the full job description and details of how to apply click &lt;a href=&quot;http://antiapathy.org/?page_id=83&quot;&gt;here&lt;/a&gt;&lt;/p&gt;</body-html>
          <created-at type="datetime">2009-07-29T13:58:59+01:00</created-at>
          <id type="integer">1179072</id>
          <published-at type="datetime">2009-07-29T13:58:59+01:00</published-at>
          <title>Worn Again are hiring!</title>
          <updated-at type="datetime">2009-07-29T13:59:40+01:00</updated-at>
        </article>
        <article>

我天真地认为从一种序列化数据格式转换为另一种序列化数据格式非常简单,我可以简单地这样做:

>> require 'hpricot'
=> true
>> b = Hpricot.XML(open('blogs.xml'))
>> puts b.to_yaml

但是我收到了这个错误。

NoMethodError: undefined method `yaml_tag_subclasses?' for Hpricot::Doc:Class
    from /usr/local/lib/ruby/1.8/yaml/tag.rb:69:in `taguri'
    from /usr/local/lib/ruby/1.8/yaml/rubytypes.rb:16:in `to_yaml'
    from /usr/local/lib/ruby/1.8/yaml.rb:391:in `call'
    from /usr/local/lib/ruby/1.8/yaml.rb:391:in `emit'
    from /usr/local/lib/ruby/1.8/yaml.rb:391:in `quick_emit'
    from /usr/local/lib/ruby/1.8/yaml/rubytypes.rb:15:in `to_yaml'
    from /usr/local/lib/ruby/1.8/yaml.rb:117:in `dump'
    from /usr/local/lib/ruby/1.8/yaml.rb:432:in `y'
    from (irb):6
    from :0
>>

我怎样才能得到这个问题顶部概述的表格中的数据输出?我尝试导入“yaml”gem,认为我缺少其中一些方法,但这也没有帮助:

最佳答案

抱歉,Josh,我认为你在这里发现的是 Hpricot 和/或 YAML 库中的限制,纯粹而简单。

我不确定 Hpricot 是否曾经以这种方式支持 YAML。有问题的方法由 YAML 库动态添加到 Object 类,以及其他基本的 Ruby 类型,但由于某种原因没有出现在 Hpricot::Doc 的定义中,即使 Hpricot::Doc 似乎继承了间接来自对象。

我可以说我也转载了,所以不只是你。

您可以很容易地添加缺少的方法:

class Hpricot::Doc
  def self.yaml_tag_subclasses?
    "true"
  end
end
b = Hpricot.XML(open('blogs.xml'))

但您会发现这并不能使您走得更远。这是我得到的:

--- !ruby/object:Hpricot::Doc 
options: 
  :xml: true

所以我们没有像我们应该的那样迭代容器。

在这一点上,要使用 YAML 库获得 YAML 支持,蛮力的方法(也许是唯一的方法)是将 to_yaml 方法添加到 Hpricot 的类中,教他们如何输出YAML 正确。看看“/usr/lib/ruby/1.8/yaml/rubytypes.rb”(在 Mac 上,类似于“/System/Library/Frameworks/Ruby.framework/Versions/1.8/usr/lib/ruby/1.8/yaml/rubytypes.rb") 获取如何为每个基本 Ruby 类型完成的示例。您可能需要将其添加到的类在 C 端定义:请参阅方法 Init_hpricot_scan 中的“hpricot/ext/hpricot_scan/hpricot_scan.rl”。

关于xml - 使用 Ruby 和 Hpricot 将 xml 转换为 yaml - 这里出了什么问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1289074/

相关文章:

ruby - 为什么 0 && 1 在 ruby​​ 中是 1 而 1 && 0 是 0?

ruby-on-rails - 在 8000 万行表上索引 UUID

ruby-on-rails - rails : can I use elasticsearch-model and active_model_serializers together?

Ansible 根据条件跳过 playbook 中的剩余任务

xml - XPath中的逻辑或?为什么不加工?

android - Cordova 不断将应用程序名称更改为 'Hello Cordova'

c# - 在 C# 中读取 XML

php - DOMDocument::loadXML():预期开始标记: "<"

doctrine - 如何强制 "hint"实体字段应在 yaml 中建立索引?

python - 使用 Python 读取 YAML 文件导致 AttributeError