我如何用 Java 解析从 Google Chrome 和 Mozilla Firefox 导出的书签文件。是否有任何库可用于直接解析它们并获取其中的 URLS。
也欢迎使用 Java 解析它们的示例代码。
最佳答案
在大多数情况下,您实际上并不需要解析 HTML 文件。 Chrome 将其书签存储在一个 JSON 文件中。使用 JSON 解析器读取该文件要简单得多。
您感兴趣的文件位于(在 Linux 上,无论如何,谷歌其他操作系统):
/home/your_name/.config/google-chrome/Default/Bookmarks
JSON 解析很容易。 Google 周围或以 How to parse JSON in Java 开始.
如果您想在开始挖掘 JSON 数据之前可视化它,那么也可以看看 http://chris.photobooks.com/json/default.htm .
关于java - Java 中 Google Chrome 和 Mozilla 的导出书签 HTML 文件的解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15017163/