java - 访问 URL 的特定部分

标签 java url httpurlconnection

我正在使用原始类型的 Java (1.1.2) 为 Lexmark 打印机编写 eSF 应用程序。从设备打印的问题是我需要将 URL 发送到打印服务,这使得打印字符串等细节变得困难。

对于我的项目,我正在尝试打印 XKCD 漫画的解释。这些解释是从explainXKCD.com 检索并格式化的。有什么方法可以只访问 URL 的特定部分,例如网页的说明部分?这样我就可以链接解释并将其打印出来,而不是链接整个网页并打印整个网页?我可以用来打印的另一种方法是从 URL 打印,如果我只能从原始 URL 的某些“子”URL 打印说明,则​​会容易得多。

我已经研究过 HTTPURLConnection 和 getSpecificHeader 但我不太确定它的作用。我还考虑过创建一个仅包含字符串和链接的临时 URL,但我不确定这有多困难,或者是否可能。

如果有人有任何想法,我只是在寻找正确方向的插入。

最佳答案

您的问题与 HttpURLConnection 无关。无论如何,您都必须获取整个页面,然后剪切该页面的 HTML 部分并打印它。

有一些库可以帮助解析甚至是糟糕的 HTML,但我想(我几乎可以肯定)它们不适用于 Java 1.1。其中大多数需要 Java 5 才能工作。

如果您可以确定源将来不会更改,您可以使用正则表达式魔法并剪切页面中有趣的部分。但谁会将 HTML 渲染为 PostScript 或 PCL 等内容呢?

关于java - 访问 URL 的特定部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23600386/

相关文章:

java - HashMap 仅显示最后一个条目

c# - MVC Url Helper 生成 &amp

python - 带有身份验证的 urllib.request.urlopen(url)

RHEL5.5 中的 Java 6 HTTPURLConnection 和 Project Server NTLM 身份验证

java - 为什么 HttpURLConnection API 中有流?

java - 按 block 加密文件

java - 导航回上一个 Activity 后更新 ListView

java - 如何处理 java.net.URL.openConnection() 抛出的 IOException?

java - 通过 @Context 在无状态 session Bean 中使用 http session

ios - 获取使用 WKWebView 点击的所有项目的 URL