我不知道它之前是否发布过,但我在 Stackoverflow 和网络的其他地方都找不到它
我正在开展一个项目,我们需要实时数据集,以便我们可以每天更新数据库。我发现a GitHub repository其中 csv 文件每天都会更新,我需要在运行代码时将其下载到本地。我该怎么做?
我们正在使用 Python 和 PostgreSQL
最佳答案
找到所需 csv 的路径(原始格式
):
csv_url = 'https://raw.githubusercontent.com/owid/covid-19-data/master/public/data/latest/owid-covid-latest.csv'
然后用 python 读取它:
df = pd.read_csv(csv_url, error_bad_lines=False)
print(df)
您现在可以使用以下方法更新您的 sql 数据库:
df.to_sql('my_SQL_table', con=my_engine, if_exists='replace')
关于python - 如何使用 Python 从 GitHub 下载文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69392838/