java - 从 Apache Commons HTTP 请求获取页面内容

标签 java http apache-commons

所以我正在使用 Apache Commons HTTP 向网页发出请求。我一辈子都弄不明白如何从页面中获取实际内容,我只能获取其标题信息。如何从中获取实际内容?

这是我的示例代码:

HttpGet request = new HttpGet("http://URL_HERE/");

HttpClient httpClient = new DefaultHttpClient();
HttpResponse response = httpClient.execute(request);

System.out.println("Response: " + response.toString());

最佳答案

BalusC 的评论会很好用。 如果您使用的是 Apache HttpComponents 的版本 4 或更新版本,您还可以使用一种便捷的方法: EntityUtils.toString(HttpEntity);

这是您的代码中的样子:

HttpGet request = new HttpGet("http://URL_HERE/");
HttpClient httpClient = new DefaultHttpClient();
HttpResponse response = httpClient.execute(request);
HttpEntity entity = response.getEntity();
String entityContents = EntityUtils.toString(entity);

不确定这是不是因为版本不同,但我不得不这样重写:

HttpGet request = new HttpGet("http://URL_HERE/");
CloseableHttpClient httpClient = HttpClients.createDefault();
HttpResponse response = httpClient.execute(request);
HttpEntity entity = response.getEntity();
String entityContents = EntityUtils.toString(entity);

关于java - 从 Apache Commons HTTP 请求获取页面内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5240241/

相关文章:

java - apache DatabaseConfiguration 中的动态重新加载

http - RxJS Angular2 在 Observable.forkjoin 中处理 404

php - 我应该以哪种格式期望提交的文本区域中的换行符

java - 使用文件集合,获取与特定文件夹相关的 getPath()

JavaFX 2.2 字体渲染有问题

java - 是否有免费的 Eclipse 插件可以从 Java 类/包中创建 UML 图?

java - 反射 API 不会破坏数据封装的目的吗?

java - 如何强制 Commons HTTPClient 3.1 仅将 TLS 1.2 用于 HTTPS?

python - 谷歌 http 请求被阻止

java - Intellij + Apache Math 3.3 给出 NoClassDefFounderror