ruby - 如何从 Nokogiri::HTML 获取标签名称和 CSS 类

标签 ruby nokogiri

我一直在尝试解析这些 HTML files与Nokogiri。这是我使用的代码

require 'nokogiri'
doc = Nokogiri::HTML File.open('usc...html', 'r')
children = doc.css('body div')
children.each do |child|
    puts child.name
end

为所有子元素打印 div,即使它们几乎是整个 ph3h4 标签。有人可以解释为什么会这样吗?另外,如何从它们中获取 CSS 类?

最佳答案

这个:

doc.css('body div')

将选择页面上的每个 div。如果你想要你应该使用的每个元素:

doc.css('*')

您可以使用 child[:class] 获取 css 类

关于ruby - 如何从 Nokogiri::HTML 获取标签名称和 CSS 类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18089769/

相关文章:

Ruby - 每第 n 次迭代

ruby - 导轨 : How do I pass custom params to a controller method?

ruby-on-rails - 如何使用 nokogiri 和 mechanize 从 <script> 标签中提取文本?

css - 当节点具有 xmlns 属性时,Nokogiri 查找 css 失败

ruby - Heroku 应用程序崩溃并显示 'libruby.so.1.9: cannot open shared object file'

ruby-on-rails - 运行 bundle install 时出现 Nokogiri 错误

ruby - 为什么括号会改变返回值?

ruby - 导入一个巨大的 csv 数据文件并使用标题访问使用 Ruby 的列

ruby-on-rails - Sidekiq 从控制台工作但不从应用程序工作

ruby - Nokogiri:如何解析文本片段?