我一直在尝试解析这些 HTML files与Nokogiri。这是我使用的代码
require 'nokogiri'
doc = Nokogiri::HTML File.open('usc...html', 'r')
children = doc.css('body div')
children.each do |child|
puts child.name
end
为所有子元素打印 div
,即使它们几乎是整个 p
、h3
和 h4
标签。有人可以解释为什么会这样吗?另外,如何从它们中获取 CSS 类?
最佳答案
这个:
doc.css('body div')
将选择页面上的每个 div。如果你想要你应该使用的每个元素:
doc.css('*')
您可以使用 child[:class]
获取 css 类
关于ruby - 如何从 Nokogiri::HTML 获取标签名称和 CSS 类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18089769/