我需要用java解析一个HTML文件。与 XML 不同的是,它没有重复的标签。所以我需要一个可以解析html文件并到达所有节点的代码,它包括嵌套标签..等。HTML代码不固定。换句话说,给定任何 HTML 代码,我需要访问 HTML 中的所有标记。
最佳答案
试试这个 HTML 解析器 http://htmlparser.sourceforge.net/samples.html
关于java - 解析HTML并获取所有节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9679178/