php - 如何下载包含所有依赖项的 HTML 页面?

标签 php javascript web download copy

我正在开发这个项目,我基本上需要能够在任何页面上放置一个 html 按钮(可以进行登录保护),一旦用户点击该按钮,页面 html 和依赖项(css、js、图像等)应发送到远程服务器。

最初,我通过使用 iframe 和隐藏表单并在用户单击按钮时将页面的 url 发布到远程服务器来实现它。然后我在 exec 中使用 wget 来获取页面和依赖项。但是,这显然不适用于 protected 页面。

所以我的下一个方法是通过表单将页面的innerHTML发送到远程服务器上的php脚本。然后我尝试使用 simplehtmldom 来运行 , 和 Tags ,将相对 url 转换为绝对 url ,将它们存储在数组中,并将 url 替换为同一目录中的路径。然后我在所有数组上应用了 wget 并下载了这些依赖项。

但是,我再次陷入困境,因为 CSS 中有背景图像,而 javascript 中有嵌入的 html 代码。

有人可以提出更好的解决方案吗?

谢谢

最佳答案

我不确定这是否会起作用。 事实是,除非您的网站确实非常简单(即具有很少的动态部分)并且存在于单击->加载->静态范例(这实际上不再是任何现代网站的工作方式),否则您总是会有一些缺少的部分/依赖项。

如果这是一个 super 简单的网站,您也许可以只发送 html,然后添加 <base> href 到重复项的头部?

如您所知,现在的网站更像是应用程序,您确实需要包含所有“移动部分”的整个网站

其他可能值得关注的事情:

  1. 使用PHP/.NET/Java/Ruby等的ftp功能来触发 template/css/img 目录移动到新位置。
  2. 也许看看 HTML 2 PDF/Canvas 工具,它们可以显示 将站点的当前状态直观地呈现给另一个站点 位置。

关于php - 如何下载包含所有依赖项的 HTML 页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10641684/

相关文章:

android - 在 Android 中使用 HTML 页面作为动态壁纸

html - 定位标题和img

java - 错误 GXJMake : "Index was out of range. Must be non-negative and less than the size of the collection"

php - WP_User_Query 和自定义用户表

php - 用大括号括住YouTube视频的PHP更改代码

php - 字符 : ' (single quotation) when trying to save to mySql 的问题

javascript - 如何将此 JSON 数据循环到表中?

javascript - 从单选按钮和复选框中选择的选项不传递数据

javascript - 当php获取字符串在当前url中时如何重定向URL

javascript - 如何使用 bootstrap 验证表单的字数和字母数字值