我有一个 html 行,其中标签内有标签,一个标签可以包含多个类。我需要提取具有单个类名的文本(我只知道标签中的一个类名,它也可能覆盖另一个类)
<p class="Body1"><span class="style3"></span><span class="style1">W</span><span class="AnyClass OverRiddenClass">extract this text </span><span class="OverRiddenClass">another text to extract </span></p>
我知道类名“OverRiddenClass”覆盖了“AnyClass”类我想在 java 中使用 Jsoup 从 html 行中提取文本“提取此文本”以及“要提取的另一个文本”。
最佳答案
也许我没捕获要点,但在我看来你只需要写:
Document = Jsoup.connect(yourUrl).get();
Elements elements = document.select(".OverRiddenClass");
for (Element element : elements) {
String text = element.text();
// further processing
}
关于java - 在 Java 中使用 Jsoup 从 HTML 行获取具有类名(覆盖)的元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24794887/