在 html 页面中有一个如下所示的 javascript,我想提取 var 编号的值。
<script type="text/javascript">
var number= 4443;
</script>
我正在使用 jsoup 来使用此命令解析 html 页面。
org.jsoup.nodes.Document doc3 = Jsoup.connect("http://htmlpage.com").get();
我该怎么做?提前谢谢大家。
最佳答案
Jsoup 是一个 HTML 解析器,而不是 JS 解析器。使用 Jsoup 可以获得的最好的是获取 HTML <script>
元素。
Elements scripts = doc3.select("script");
然后 Element#text()
将其内容提取为文本并由能够解析 JS 代码的不同库进一步解析,例如 Mozilla Rhino。您当然也可以执行琐碎的 String
使用 indexOf()
进行解析, substring()
等方法,甚至可能使用一些好的正则表达式。
关于java - 在 java jsoup 的 html 页面中搜索和查找变量值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13584914/