是否有任何 HTML 解析器可以离线解析 HTML 文档,即存储在您的计算机上?如果是这样,谁能说出一些好的?
更新:哈,NVM,找到了答案,有人能在 html Jericho 中提供这样的示例吗?
更新 2:我以为我找到了答案,但我错了,将 InputStream 误认为是 FileInputStream :(
最佳答案
这里有一些你可以看看:
- 对于 Python:BeautifulSoup
- 对于 .NET:HTML Agility Pack
- 对于 Java:TagSoup
关于java - 离线解析 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2806489/