python - 使用 python 从 Github 库中提取 CSV 文件

标签 python csv github export extract

我希望从 github 存储库中提取特定文件并加载到 python 中的字典中,然后将该文件写回 github 存储库中的特定文件夹。

假设,我的文件夹结构是:

Github 存储库 > 文件 > rawfiles > test.txt

Github 存储库 > 文件 > 输出 > output.txt

如何从 Github 中提取一个文件,然后将其写回到 Github?下面是我创建的内容,但输出似乎包含所有 HTML 标签。

import csv
import urllib
url = 'GithubRepo/rawfiles/test.txt'
webpage = urllib.urlopen(url)
data = []
datareader = csv.reader(webpage)
    for row in datareader:
    data.append(row)

打印数据

最佳答案

您应该尝试 .read() url 打开请求。

假设您要解析https://github.com/codeforamerica/ohana-api/blob/master/data/sample-csv/addresses.csv

因此您将附录更改为https://raw.githubusercontent.com

并编写以下代码

import urllib.request as request
import csv
r = request.urlopen('https://raw.githubusercontent.com/codeforamerica/ohana-api/master/data/sample-csv/addresses.csv').read().decode('utf8').split("\n")
reader = csv.reader(r)
for line in reader:
    print(line)

关于python - 使用 python 从 Github 库中提取 CSV 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51351804/

相关文章:

python - 如何在预装 python 但没有 root 权限的 linux 上安装 Tkinter?

python - 如何作为命令的结果从另一个程序执行代码

python - 如何判断卫星是否进行了机动?

r - 在第二行的 R WITH 标题中导入大型 .CSV 的延迟时间很长

github - Jenkins Multibranch 管道不会触发来自 Github 的 PR 构建

python - Pandas 多层次分组

php - 如何以最快的方式导入数据进行分析

python - 另存为 csv 会损坏数据帧

symfony - 未加载自定义供应商包命名空间

regex - Git 网址结构