浏览器如何打开保存的 html 页面?它必须从硬盘运行 html 文件和其他文件。但是浏览器如何找到其他小文件的链接呢?浏览器是否将html页面的其他小文件的链接从url更改为硬盘位置?
它怎么能做到这一点?我想在我的应用程序中做同样的事情。但我无法弄清楚这个过程。
最佳答案
大多数浏览器将附加资源(样式表、图像、脚本等)存储在以保存的页面命名的单独文件夹中。
然后将所有对资源的引用转换为相对引用,如下所示:
<img src="name_of_saved_folder/image.jpg">
然后浏览器会在
name_of_saved_folder
中查找相对于保存的 HTML 文档的位置。如果将 HTML 文件移动到不同的位置,引用通常将不再有效。
Internet Explorer 引入了一个非常有趣的概念 archived HTML format在 1999 年将所有资源合并到一个文件中,但遗憾的是,这尚未在所有浏览器的全局、现实世界支持方面流行起来。
您可以与现有工具(如 wget)进行交互,而不是自己编写代码。这可以为您完成所有抓取工作。对于大多数编程语言,关于如何在本地最好地存储 HTML 页面及其资源的 Stack Overflow 上可能已经存在相关问题。
关于java - 浏览器如何打开保存的 html 页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4850744/