javascript - 提取网页的源代码

标签 javascript html

您好,我想提取外部网站(不在我的域中)的源代码,然后对其进行解析以使其成为一个应用程序。我知道如何使用 JAVA 的 Jsoup 库来做到这一点,但我无法找到任何关于如何使用 Javascript 或 Jquery 或任何客户端 Web 编程语言来做到这一点的链接。 有人可以指导我应该使用哪个图书馆吗?基本上,我想获取网页的 HTML 源代码,然后对其进行解析以提取某些标签下的某些链接。

最佳答案

由于 same origin policy,您将无法单独使用 JavaScript 执行此操作.这会阻止您从其他域读取信息。

您需要做的是使用 serverside proxy获取信息。 Ajax 调用可以调用代理来获取页面。

关于javascript - 提取网页的源代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11779386/

相关文章:

javascript - AngularJS 工厂/过滤器未正确更新

html - 如何在 PHPStorm 中禁用 html 标记完成

javascript - Google 登录 gapi undefined

javascript - 当第一个参数为 null 时,.bind() 与闭包相同吗?

javascript - HTML5 Canvas - 用描边剪切填充区域

javascript - 为什么尝试建立网络套接字时连接被拒绝?

javascript - 将 CSS 应用于 ng-repeat 中的唯一 li

javascript - 从表格 HTML 中获取文本区域值

python - 如何从 <br/> 标签后的单元格中获取文本?

javascript - Pinterest 分享 HTML 链接错误