java - 在 java jsoup 的 html 页面中搜索和查找变量值

标签 java javascript parsing extract jsoup

在 html 页面中有一个如下所示的 javascript,我想提取 var 编号的值。

<script type="text/javascript">
 var number= 4443;
</script>

我正在使用 jsoup 来使用此命令解析 html 页面。

org.jsoup.nodes.Document doc3 = Jsoup.connect("http://htmlpage.com").get();

我该怎么做?提前谢谢大家。

最佳答案

Jsoup 是一个 HTML 解析器,而不是 JS 解析器。使用 Jsoup 可以获得的最好的是获取 HTML <script>元素。

Elements scripts = doc3.select("script");

然后 Element#text() 将其内容提取为文本并由能够解析 JS 代码的不同库进一步解析,例如 Mozilla Rhino。您当然也可以执行琐碎的 String 使用 indexOf() 进行解析, substring()等方法,甚至可能使用一些好的正则表达式。

关于java - 在 java jsoup 的 html 页面中搜索和查找变量值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13584914/

相关文章:

java - MongoDB MongoCollection : Cannot update field

java - created_by 字段上的 DuplicateMappingException

java - PKIX 路径构建失败 - 在有效的让我们加密证书

java - 将数据填充到 RecyclerView 中

python - docopt + 模式验证

c# - 为什么我们需要 OOP 语言中方法的 void 返回类型?

javascript - React.js - 检测在没有 ref 的情况下调用函数的元素

javascript - 使用 firebug 调试 jquery 或 javascript

javascript - 为什么 jQuery 在 ('load' , function(){}); 上执行如果图像在加载绑定(bind)之前加载,则不会触发? IE 和本地主机

parsing - 使用从右到左的解析器绕过左递归