python - 如何抓取来自下拉列表的数据?

标签 python beautifulsoup

网站源码显示:

<div class="content">

    <h2 class="branded">Fixtures</h2>

<div class="mobile-select gameweek-selector-div clearfix">
    <select class="gameweek-selector" >
        <option value="-1">All Season</option>

             <option value="1">Matchweek 1</option>

             <option value="2">Matchweek 2</option>

             <option value="3">Matchweek 3</option>

    </select>
</div>

我想在选择这些选项值之一时抓取数据 问题是网站 url 没有改变它只是加载内容

最佳答案

尝试使用浏览器的网络分析器。

当我访问该网站并选择不同的比赛周时,每次都会发送一个 GET 请求。

例如,这是第 1 周的请求 URL:

http://m.premierleague.com/pa-services/api/football/mobile/competition/fandr/api/gameweek/1.json

...第 2 周:

http://m.premierleague.com/pa-services/api/football/mobile/competition/fandr/api/gameweek/2.json

请注意末尾的数字已全部更改。您可以轻松地遍历周范围,在每次迭代时发出 GET 请求。

这是解决方案的粗略草图:

import json
import urllib

number_of_weeks = 20
base_url = 'http://m.premierleague.com/pa-services/api/football/mobile/competition/fandr/api/gameweek/'

for i in range(1, number_of_weeks+1):
    page = urllib.urlopen(baseurl+str(i)).read()
    json_content = json.loads(page)
    ## now you can do something with the data

关于python - 如何抓取来自下拉列表的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33100541/

相关文章:

python - Python 中 Numpy 和 MpMath 之间的互操作性

python - 对象的字符串替换(非字典)

python - 使用 Python 抓取 Ajax

python - 从下拉菜单python中的每个选项中抓取表格

python - 从 python spawn 子进程接收连续输出不起作用

python - 移动脊柱后有效缓存和恢复 matplotlib 轴参数

python - 按一列分组并找到编号。另一列中的唯一值

python - 使用 BeautifulSoup 和 Python 抓取 Javascript 网页

python - 使用 Beautiful Soup 查找下一个出现的标签及其包含的文本

Python美丽汤餐 table 刮花