html - 在浏览器中呈现非常大的 HTML 文件?

标签 html browser

我正在尝试通过从事一个有趣的项目 - Facebook 消息分析器来学习 Python。我已经从 Facebook 下载了我的数据,其中包括一组 html 文件。其中之一 - messages.htm - 包含我的所有消息。我的目标是获取此 html 文件并将其解析出来以输出有趣的数据,例如最常用的单词、消息数等。

问题是我的 messages.htm 文件是 270MB。我可以在 vim 中检查它很好,但文件中有有趣的模式,我想将 html 代码与它在浏览器上的实际呈现方式进行比较,这样我就可以将代码与视觉效果进行比较,并更好地了解什么是继续。但是当我尝试在 Firefox 中打开此文件时,FF 崩溃了。我可以在 Chrome 中打开它,但它只是开始加载所有消息,并且在 10 分钟内甚至没有完全加载一个消息线程,无论滚动条变得多么小。所以这是不可行的。

是否有可能完全呈现如此大且长的 HTML 文件?

最佳答案

您可以使用 lynx这是一个基于文本的浏览器,用于查看大型 html 文件。我有一个 139M 的 html 文件,我可以使用 lynx 轻松查看它。 lynx 将整个文档分成页面,并且能够非常快速地加载任何给定的页面。它还支持超链接,因此在 html 文档(这是我的用例)中导航非常有效。

关于html - 在浏览器中呈现非常大的 HTML 文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31241582/

相关文章:

javascript - 使用单击事件超链接表行

html - 浏览器如何应用 CSS,重绘是否受其影响?

java - 最好的 Java/Swing 浏览器组件?

html - 使用 bootstrap 和 html 的 css 居中 div

html - 更改 wordpress 帖子页面的背景

javascript - <audio> 和 Mozilla Firefox 缓存问题

javascript - 获取元素内的选中复选框

Laravel项目在更改后自动刷新

javascript - Polymer Designer 在按钮单击时移动 "core-card"

html - 加载到 TWebBrowser 中的 html 文档的总高度