java - 从google搜索获取html源代码

标签 java jsoup

我想从此 Google 搜索中提取数据

https://www.google.com.ph/?gfe_rd=cr&ei=JQ7bVZjRDOSL8QeqibewAwgws_rd=ssl#q=scarlett+johansson+age

我想通过获取这个特定的 div 标签来获取艺术家的年龄

<div class="_eF">30 years (November 22, 1984)</div>

这是我到目前为止的代码

Document doc = Jsoup.connect("https://www.google.com.ph/?gfe_rd=cr&ei=eKfaVbWXBomM8QexmIOACw&gws_rd=ssl#q=scarlett+johansson+age").get();
Elements age = doc.getElementsByClass("#_eF");
String urlSource = age.html();

但我得到的只是 javascript 代码,而不是实际的 html 源代码

最佳答案

你做错了。通过执行 doc.getElementsByClass,您可以获得多个结果(或者 Jsoup 处理这些结果)。

你想做的是:

Document doc = Jsoup.connect("https://www.google.com.ph/?gfe_rd=cr&ei=eKfaVbWXBomM8QexmIOACw&gws_rd=ssl#q=scarlett+johansson+age").get();
Elements age = doc.select("div._eF");
String urlSource = age.html();

关于java - 从google搜索获取html源代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32182653/

相关文章:

java - 在匿名对象上调用父类(super class)方法 AsyncTask.execute() new HttpRequestTask<...> extends AsyncTask<...>

Java:一个函数有多种返回类型...可以使用泛型吗?

android - 使用 Jsoup 从 php 中提取文本结果是一个空的 textView

java - 如何使用 JSOUP 解析图像 src?我的

java - 使用 Java Regex 从 html 文件中删除二进制数据

java - Spring restTemplate execute() POST 大文件并获得响应

java - 如何创建一个包含 int[] 数组中所有元素的新 ArrayList?

java - 在 jsoup 中搜索包含特定文本的图像类

android - AsyncTask 不会进入 onPostExecute()

java - 如何在 Guava 中表示 SQL 表和 SELECT 查询?