ruby - 获取一串 html、将其切碎并将每一部分放入一个数组中的最佳方法是什么？

我对如何执行此操作有大致的了解，但无法确定具体如何完成。我相信它可以用某种正则表达式来完成。想知道这里是否有人能指出我正确的方向。

如果我有一串这样的html

some_html = '<div><b>This is some BOLD text</b></div>'

我想把它分成逻辑部分，然后将这些部分放入一个数组中，这样我就可以得到这样的结果

html_array = ["<div>", "<b>", "This is some BOLD text", "</b>","</div>" ]

最佳答案

我不使用正则表达式，而是使用 nokogiri gem(由 Aaron Patterson 编写的用于解析 html 的 gem - Rails 和 Ruby 的贡献者)。以下是如何使用它的示例:

html_doc = Nokogiri::HTML("<html><body><h1>Mr. Belvedere Fan Club</h1></body></html>")

然后您可以调用 html_doc.children 来获取 nodeset并从那里开始工作

html_doc.children  # returns a nodeset

关于ruby - 获取一串 html、将其切碎并将每一部分放入一个数组中的最佳方法是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7886326/

相关文章：

java - 查找数组中的非重复元素