python - 从下拉选项值 Python BeautifulSoup 中抓取

标签 python python-3.x web-scraping beautifulsoup

我尝试使用 BeautifulSoup 的输入下拉列表从网络上抓取数据

这是下拉值

<selected name="try">
<option value="G1">1</option>
<option value="G2">2</option>
</selected>

我会这样尝试

soup = BeautifulSoup(url, 'html.parser')
soup['selected'] = 'G1'
data = soup.findAll("table", {"style": "font-size:14px"})
print(data)

它将通过<table> 获取数据标记每个提交下拉列表

但它只出现<table>对于主页,如何从每个下拉列表中获取数据?

最佳答案

你仍然继续使用 findAll()find() 来完成你的工作。

from bs4 import BeautifulSoup

html = """
<table style="font-size:14px">
<selected name="try">
<option value="G1">1</option>
<option value="G2">2</option>
</selected>
</table>
"""

soup = BeautifulSoup(html,"lxml")

option = soup.find("selected",{"name":"try"}).findAll("option")
option_ = soup.find("table", {"style": "font-size:14px"}).findAll("option")
print(option)
print(option_)
#[<option value="G1">1</option>, <option value="G2">2</option>]
#[<option value="G1">1</option>, <option value="G2">2</option>]

关于python - 从下拉选项值 Python BeautifulSoup 中抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53459163/

相关文章:

python - numpy .dot 使用列表和数组,有什么区别

python - PyQt5下方Qlabel空间宽度

Python Trueskill (ELO) 分数下降

python - for循环中的for循环没有正确执行

python - focus 和 focus_set 方法有什么区别?

python-3.x - 如果使用 python 计算,JWT hs512 签名与 jwt.io 略有不同

xpath - scrapy xpath 按类名选择元素

python - pool.map_async 的打印进度

python - PyPDF2 无法读取非英文字符,在 extractText() 上返回空字符串

web-scraping - html5lib: TypeError: __init__() 得到一个意外的关键字参数 'encoding'