java - 如何从网页打印数据?不是页面的html代码。

标签 java printing html

在 java 中,我正在尝试阅读网页。我只想打印页面的数据。但是我的代码正在打印整个 html 代码。看起来很奇怪。我可以看到我想要的确切数据隐藏在 html 中。我怎样才能摆脱打印html代码? 这是我的代码:

URL url = new URL("http://www.rxbd.info/Controller/Controller?action=details&drug=zorubicin&group=generic");
URLConnection con = url.openConnection();
InputStream is =con.getInputStream();
BufferedReader br = new BufferedReader(new InputStreamReader(is));
String line = null;
while ((line = br.readLine()) != null ) {
    System.out.println(line);
}

最佳答案

看看Jericho . Renderer类可以将原始 HTML 渲染为文本,TextExtractor 类可以只提取文本。

关于java - 如何从网页打印数据?不是页面的html代码。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20687184/

相关文章:

java - 如何在java中定义KeyPairValue中的值

css - 如何将绝对定位的DIV放在SPAN或相对定位的DIV后面?

javascript - 提交输入不会在 IE 和 Firefox 中发布

macos - 如何在终端中使用 CUPS 将 PDF 打印到原始打印机文件

html - 在angularjs中使用ng-hide时如何解决总和问题?

java - 同步 vs ReentrantLock vs AtomicInteger 执行时间

java - JOptionPane,JTextArea,在JScrollPane中,显示输出

java - 如何在 Java 中实现时钟/定时器?

java - Java Web 应用程序上的打印服务

javascript - 如何使用 Node.js 将 docx 文件打印到打印机