<分区>
我只需要一个建议。我有一个采用有效 html 并将其保存到文件的程序,我需要一种方法来解析此 html 文件以检索该 html 文件中记录的每个图像。 (例如/foo/bar.jpg)。有没有我可以用来实现此目的的 html 解析库?
<分区>
我只需要一个建议。我有一个采用有效 html 并将其保存到文件的程序,我需要一种方法来解析此 html 文件以检索该 html 文件中记录的每个图像。 (例如/foo/bar.jpg)。有没有我可以用来实现此目的的 html 解析库?
最佳答案
如果您只需要提到的 .jpg 文件,则只需使用文件阅读器和正则表达式匹配器来查找 .jpg 文件名(如字符串),您应该会得到很好的结果(例如,很少有误报)。
即使你有一个完美的 HTML 解析器,你也不会得到所有的 .jpg 文件,因为一些文件名可能由你无法解释的 JavaScript 文本组合而成,所以不完美似乎并不完美就像很多损失一样。
关于C 的 HTML 解析器库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12064324/