我正在开发这个项目,我基本上需要能够在任何页面上放置一个 html 按钮(可以进行登录保护),一旦用户点击该按钮,页面 html 和依赖项(css、js、图像等)应发送到远程服务器。
最初,我通过使用 iframe 和隐藏表单并在用户单击按钮时将页面的 url 发布到远程服务器来实现它。然后我在 exec 中使用 wget 来获取页面和依赖项。但是,这显然不适用于 protected 页面。
所以我的下一个方法是通过表单将页面的innerHTML发送到远程服务器上的php脚本。然后我尝试使用 simplehtmldom 来运行 , 和 Tags ,将相对 url 转换为绝对 url ,将它们存储在数组中,并将 url 替换为同一目录中的路径。然后我在所有数组上应用了 wget 并下载了这些依赖项。
但是,我再次陷入困境,因为 CSS 中有背景图像,而 javascript 中有嵌入的 html 代码。
有人可以提出更好的解决方案吗?
谢谢
最佳答案
我不确定这是否会起作用。 事实是,除非您的网站确实非常简单(即具有很少的动态部分)并且存在于单击->加载->静态范例(这实际上不再是任何现代网站的工作方式),否则您总是会有一些缺少的部分/依赖项。
如果这是一个 super 简单的网站,您也许可以只发送 html,然后添加 <base>
href 到重复项的头部?
如您所知,现在的网站更像是应用程序,您确实需要包含所有“移动部分”的整个网站
其他可能值得关注的事情:
- 使用PHP/.NET/Java/Ruby等的ftp功能来触发 template/css/img 目录移动到新位置。
- 也许看看 HTML 2 PDF/Canvas 工具,它们可以显示 将站点的当前状态直观地呈现给另一个站点 位置。
关于php - 如何下载包含所有依赖项的 HTML 页面?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10641684/