java - 读取网站列表,去掉 HTML 标签并将其全部写入 txt 文件

标签 java jsoup urlconnection

我正在尝试获取一次读取一次的网站列表并将其打印到单个文件中。我还希望提取 html 标签,我计划使用 jsoup 进行 HTML 解析。在将内容写入文件之前我该如何执行此操作?

最佳答案

异常是不言自明的。

没有 next 元素,因为引用 API :

if no more tokens are available

初始化 Scanner 后,将您的作业包装在 while (myScanner.hasNext()) 循环中。

关于java - 读取网站列表,去掉 HTML 标签并将其全部写入 txt 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27172444/

相关文章:

java - 数学技能较弱 : What is an 8-bit numerator and 8-bit denominator?

Java、C++、NIO、mmaped 缓冲区、同步

java - 使用 Jsoup 从 html 中提取注释

javascript - 无法通过 jsoup 从 html 中提取我想要的元素

java - 如何使用 Java 登录网站并保持登录状态?

java - URLConnection.setUseCaches() 在实践中是如何工作的?

java - JFreeChart 中的拖放功能

java - 将图像添加到 JOptionPane

ios - HTTP POST 请求在 Alamofire 中的响应与 Jsoup 中的响应不同

java - 使 REST 客户端调用更快的技巧