Python:如何抓取 ESPN 的比赛比赛信息

对编程相当陌生，抱歉，问题很广泛。

import requests
from bs4 import BeautifulSoup

def data():
    League = ['nba', 'nfl', 'mlb']
    url = f"http://www.espn.com/{League[0]}/schedule"
    response = requests.get(url)
    soup = BeautifulSoup(response.content, "html.parser")
    date = soup.find('h2',{'class':'table-caption'})
    return date.string

这是我到目前为止所拥有的，但我希望能够做的是抓取今天的比赛，所以结果是:

>>> 'Los Angeles Lakers at Charlotte Bobcats 7:00PM'
>>> 'Boston Celtics at Detroit Pistons 7:00PM'

我看到所有信息都在那里，但我不知道如何迭代行，以及如何在数据不是专门作为字符串时提取数据。我知道这很广泛，而且有很多要求。提前抱歉!

最佳答案

我认为 SO 社区有时对初学者来说太苛刻了。

以下是您查找表格结果并提取主客队名称的方法:

for row in soup.select("table.schedule tbody tr"):
    home_team, away_team = row.select(".team-name")

    print(home_team.get_text(), away_team.get_text())

这里的想法是使用 CSS selector要定位表行，请迭代每一行并获取带有 team-name 类的两个元素。

<小时/>

总的来说，提出这样的事情的过程相对简单: