github - 大查询 : When is GHTorrent refreshed and how to get up to date information?

标签 github google-bigquery

ghtorrent-bq数据非常适合拥有 GitHub 的快照,但是,尚不清楚何时更新以及如何获取更多最新数据

最佳答案

理论上,每次发布新的 GHTorrent MySQL 转储时都会更新它。实际上,仍然需要对生成的 CSV 进行手动调整,因为 CSV 解析器无法处理的用户位置等字段中有很多奇怪的文本。

http://ghtorrent.org/gcloud.html

关于github - 大查询 : When is GHTorrent refreshed and how to get up to date information?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42935607/

相关文章:

git - 为什么忽略的文件没有被忽略?

json - 大查询表在本地计算机中提取为 JSON

url - GitHub 如何使用 URL 中没有 "www"的 SSL?

Git Config 只为一个分支排除文件

hadoop - Spark BigQuery 连接器,设置欧盟位置

google-bigquery - 从 Google BigQuery 标准 SQL 中的数组生成随机值

c#-4.0 - 在 C# 中将 CSV 上传到 BigQuery

python - 如何将BigQuery SQL查询结果转换为Spark DataFrame?

ios - 三位开发者如何使用Xcode8和Github进行项目协作?

git - 如何为您 fork 的项目做出贡献?