github - github搜索限制结果

标签 github github-api

我需要在Github上进行非常大的搜索以获取论文中的统计数据。

例如,我需要在GitHub上探索大量Android项目,但该站点将搜索结果限制为1000(例如https://github.com/search?l=java&q=onCreate&ref=searchresults&type=Code&utf8=%E2%9C%93)。同样使用Java GitHub API,我尝试使用方法GitHubClient.searchRepositories()尝试库org.eclipse.egit.github.core.client.GitHubClient,但即使如此,结果的数量也受到限制。

有人知道如何获得所有结果吗?

最佳答案

Search API每次查询(包括分页)最多可返回1000个结果,如此处所述:

https://developer.github.com/v3/search/#about-the-search-api

但是,执行存储库搜索时,您可以使用一个巧妙的技巧来获取1000多个结果。您可以按创建存储库的日期将搜索分为多个部分。例如,您可以首先搜索在2013年10月的第一周,第二周,九月等创建的存储库。

因为您将搜索限制在一个狭窄的时期内,所以您可能会获得少于1000个结果,因此能够获得所有结果。如果您发现某个时期内返回了1000多个结果,则您必须进一步缩小该时期,以便收集所有结果。

https://help.github.com/articles/searching-repositories/#search-based-on-when-a-repository-was-created-or-last-updated

您应该能够通过API自动执行此操作。

关于github - github搜索限制结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37602893/

相关文章:

php - 在 Github repo 上显示 "build"按钮

git - 在保留问题、wiki 等的同时替换 GitHub 存储库

github - 如果删除 fork 的 Gist 会发生什么?

docker - 使用Github Action部署Docker镜像

github-api - GitHub API - 如何添加管理员协作者?

github - 如何在查看或评论TeamCity时阻止其生成拉取请求?

github - 如果在 Github 上被提及,则获得一个 slack 通知

python - 如何将 GitHub Actions 工作流程验证为 GitHub 应用程序,以便它可以触发其他工作流程?

node.js - 使用返回的token访问github api

node.js - 如何识别授予授权权限的用户?