java - 通过 CSS 选择器抓取

标签 java html css screen-scraping

我需要用 Java + Groovy 编写一个爬虫..

我想知道是否存在能够解析 HTML 文档并通过简单的 CSS 选择器选择我需要的信息(而不是遍历整个文档树并手动选择我需要的信息)的东西存在吗?类似于 Nokogiri对于 Ruby,只是为了让您了解我需要什么..

提前致谢!

最佳答案

我通过使用 Qt Webkit 加载一个页面并包含 JQuery 来做类似的事情。

这是一个 hack,但很适合我的用例。我需要一个不需要配置的解决方案 - 只需 sudo apt-get install libqt4-webkit 就可以开始了。

关于java - 通过 CSS 选择器抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4189534/

相关文章:

css - 为什么在 IE >= 9 中使用 border-radius :[value] fixed child Elements clipped?

java - 如何在java中获取录制的声音(音调)的频率值?

java - toString() 和重写方法的问题

Javascript 变量有时未定义

javascript - 尝试从外部设置影子 DOM 的样式

css - 显示滚动条时页面大小调整和整形

java - 任务 :app:compileDebugJavaWithJavac in Android Studio 执行失败

java - 存在的方法......不?

javascript - 如何从 HTML 按钮中删除效果?

html - 两个 div 周围的 css 边框