java - 提取名称,然后用逗号分隔

标签 java web-scraping jsoup

<td>
<span class="movie_info_actors">
<a href="/?actor_name=Billy Connolly">Billy Connolly</a>
<a href="/?actor_name=Craig Ferguson">Craig Ferguson</a>
<a href="/?actor_name=Emma Thompson">Emma Thompson</a>
<a href="/?actor_name=John Ratzenberger">John Ratzenberger</a>
<a href="/?actor_name=Julie Walters">Julie Walters</a>
<a href="/?actor_name=Kelly Macdonald">Kelly Macdonald</a>
<a href="/?actor_name=Kevin McKidd">Kevin McKidd</a>
<a href="/?actor_name=Patrick Doyle">Patrick Doyle</a>
<a href="/?actor_name=Robbie Coltrane">Robbie Coltrane</a>
<a href="/?actor_name=Sally Kinghorn">Sally Kinghorn</a>
</span>
</td>

我正在尝试提取 Actor 姓名,然后使用 JSoup 用逗号分隔名称。例如:比利·康诺利、克雷格·费 Gson 、艾玛·汤普森

这是我的代码:

String Actor = E.select("span.movie_info_actors").text();
System.out.println(Actor + ", " );

最佳答案

我觉得应该是

Elements actors = E.select("span.movie_info_actors > a");
StringBuffer sb = new StringBuffer();
for (Element actor : actors) {
    sb.append(actor.text());
}
System.out.println(sb.toString());

关于java - 提取名称,然后用逗号分隔,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11380541/

相关文章:

java - 如何在 Java 中获取数字的 'place'(例如十位、千位等)

python - 在 scrapy 中抓取 json 响应

python - 使用 selenium 单击元素时出现问题

Java Jsoup 输出的格式不符合我想要的格式

c# - 将 Java 转换为 C#

java - 从shell命令访问正在运行的java程序

java - 从 QueryDSL 中的自定义表中选择

python-2.7 - 抓取由javascript生成的链接

java - 使用 JSOUP Java 更改 CSS

java - 适用于 HTML 的 Java 最佳 DOM API