所以我需要从 html 网页中提取一个变量如果有人可以帮助我的话。
这是网页包含的内容
<script>
var id = "5010";
</script>
我几乎只需要从 py.txt 中的网页中提取该值即可。 如果有人可以提供帮助,那就太好了,抱歉,如果这很难理解,我很愚蠢。
最佳答案
您可以使用 urllib 和正则表达式搜索来完成此操作。
import urllib.request
import re
url = "https://stackoverflow.com/questions/53111019/python-get-data-value-from-inside-script-html-tag"
response = urllib.request.urlopen(url)
html = response.read().decode('utf-8')
#print(html)
between_script_tags = re.search('<script>(.*)</script>', html)
print(between_script_tags)
URlLib 从页面中提取 HTML,然后“re.search()”查找 HTML 中“”和“”之间的任何文本
但是,这只能以纯文本形式提供给您。例如。在你的情况下,它将返回一个字符串“var id = "5010";
"`
您可以进一步拆分它:
output = between_script_tags.split(“ ”)
这将使输出包含三个内容的列表:['var', 'id', '=', '"5010";']
从这里提取您想要的数据非常简单。
关于javascript - Python从<script> html标签内获取数据值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53111019/