java - 有没有好的方法可以解析 HTML 简历

标签 java parsing html-parsing

我们需要从HTML简历中获取一些信息(例如经历、地点等),因此我们使用Strip方法将HTML内容转换为文本内容而不是进行解析。我的问题是这是一个好方法,或者我可以做除此之外的任何可能的方法。

更多信息

My HTML contents are not having unique HTML tags it may differ.

哈里哈兰

最佳答案

最好在 Java 中使用 HTML 解析器。有一些易于使用的库,例如:

  1. http://jsoup.org/
  2. http://jtidy.sourceforge.net/

关于java - 有没有好的方法可以解析 HTML 简历,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13133559/

相关文章:

python - 使用 Python 解析 XML 并打印整个元素

java - Flying Saucer - ITextRenderer createPdf 速度极慢

java - 为什么纹理图像颜色与原点不同?

Java SE : Open Web Page and Click a Button

parsing - 可以使用 ANTLR 生成 CSP(通信顺序进程)解析器吗?

jquery - 使用 jQuery 服务器端清理 html 页面

python - 如何删除 lxml.html 中无关紧要的空格?

java - 在我的方法实例中找不到符号?

java - 字符串在 Java 哈希表中出现的次数

parsing - 使用属性语法装饰解析树