我目前正在尝试解析来自yahoo news的新闻文章的标题。使用Jsoup。它的效果很好,除了我只能得到有限数量的上述新闻文章。
我要解决的问题是如何获取仅在浏览器中滚动到网页底部后才加载的新闻。有没有办法用 Jsoup 加载它们然后解析?
谢谢!
最佳答案
can you give me a reference link that jsoup does not support javascript..cant seem to find one.
来自 SO 本身的一些链接:
“Jsoup 不支持 javascript,并且不模拟浏览器(...)”
Mosty Mostacho -Getting Jsoup to support dynamically generated html by JavaScript
“JSoup 是一个 HTML 解析器(...),它完全不知道初始页面加载后由 Javascript 添加到 DOM 的任何内容。”
fvu -Page content is loaded with javascript and Jsoup doesn't see it
“JSoup (...) 不是网络浏览器。它擅长解析静态 html 内容。它不运行任何 JavaScript,所以你运气不好。”
luksch -Jsoup get dynamically generated HTML
“JSoup 不处理 Javascript。”
N K -Extracting “hidden” HTML with Jsoup
关于java - Jsoup:如何用Java加载更多网页内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30527631/