php - 如何将动态 (PHP) 网站存档为静态 HTML?

标签 php caching web-scraping render static-html

<分区>

我们正在关闭 The Conversations Network (包括 IT Conversations 播客)。计划是呈现我们网站的静态 HTML 版本以永久托管在 Internet Archive。 .

从目前由 PHP 动态生成的大约 5,000 个动态页面生成静态 HTML 的最简单方法是什么?

我知道我们可以调整代码以缓存 PHP 输出,将其写入文件,然后遍历站点地图以生成每个页面。但我想知道是否有任何我们应该考虑的选项。执行此操作并按原样抓取 HTML 的任何工具? (Acrobat Pro 以外的东西?)

不幸的是,我们还有相当多的 Ajax 调用,这将使这变得更加困难。我想我们必须先取消 Ajax。

最佳答案

这可能不是您要找的;但是HTTrack将浏览您的网站以获取链接并保存它的 HTML 版本。该镜像将包括所有链接的静态内容,例如图像、css 和 javascript。

我能想到的唯一问题是,如果您的 AJAX 脚本正在从服务器中提取重要数据,但也许 HTTrack 对此有一个设置。

关于php - 如何将动态 (PHP) 网站存档为静态 HTML?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12608622/

相关文章:

javascript - 如何让我的网站缓存 javascript 文件一段时间?

javascript - 阻止 Chrome 缓存特定字段

python - 在 python 中使用 beautifulsoup 解析表

python-2.7 - 使用scrapy产生多个项目

php - jQuery + php 如何在数据对象中返回多个值?

php - AWS : ses with attach files

ios - dataWithContentsOfURL 是否缓存?

python - 无法从网页收集所有店铺名称

javascript - Google Recaptcha(联系人仍然发送通过)

php - MySQL - 按日期选择行并传递给 php 数组