如果在我的情况下 Jsoup.parse 由于文件大小而崩溃,那么使用哪种小型、轻型解析器更好
我的代码在这里并不重要,但在这里:
Document doc = Jsoup.parse(html);
Element table = doc.getElementsByTag("table");
return table;
好吧,这确实有效,但是如果我在 PC(dalvik 虚拟机)或 Android 设备(为 Android 操作系统开发)上运行此代码,则会有所不同。我不确定到底是什么问题,但设备上的内存(堆大小)似乎更大,但到目前为止我还没有检查过 - 这只是一个假设。 关于 Jsoup,我能说的是 - 我认为它是最快、最小的库,适合我的情况,在 DOM 基础上解析和清理纯 HTML 代码。如果您需要根据标签(tr、table 等)提取 HTML 的某些部分,那么 Jsoup 是最好的开源 HTML 解析器。当在代码中应用它时,只需要两行,如上面的示例所示。获取 elemnet 或提取 HTML 的某些部分后得到的结果是一个简单的字符串,其中包含您使用 Jsoup 选择的标签。我确信它具有比这更多的功能,只是从未使用过更复杂的东西。
最佳答案
我猜你尝试解析 html 尝试 Jericho
关于java - 除了 Jsoup 还有其他解析器吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7062830/