database - Freebase:我公司的整个数据库都基于它值得吗?

标签 database startup freebase

我在一家公司工作,该公司正在为现场音乐建立 field /艺术家数据库,最近遇到了 Freebase。它看起来非常引人注目,即使没有新的、崭露头角的乐队的数据。对于那些使用过 Freebase 的人,我有几个问题:

  1. 将所有数据输入与 Freebase 集成是否有缺点?我们不打算出售或私有(private)化这些信息。

  2. Freebase 在可用性方面的弱点是什么?

最佳答案

披露:我在 Google 的 Freebase 工作。

Freebase 中的音乐数据是我们最强大的领域之一,并且随着我们继续加载更多数据集,它将继续变得更广泛和更丰富。例如,我们从 MusicBrainz 导入数据,对其进行清理并将主题与 Freebase 中的现有主题进行匹配以避免重复。

  1. 就缺点而言,您应该准备好处理大量数据。例如,Freebase 目前有 4 musical artists named "John Smith"这可能对您的应用程序有用,也可能没有用,但您仍然需要弄清楚哪些映射到您的用户感兴趣的 John Smith。我们称之为“协调”,它是必要的,以便您的应用程序知道准确查询 API 的主题。

    既然你提到了音乐场所,我还应该指出,虽然 Freebase 有很多关于地点的数据,但我们还没有地理搜索 API,所以如果你需要的话,你需要自己动手。

    既然任何人都可以编辑 Freebase,你也应该考虑使用 as_of_time以保护您的网站免受破坏。

  2. Freebase 非常适合开发人员,因为您可以轻松进入并清理不良数据或添加缺失的主题。然而,一直存在挑战的一个领域是从 Google 外部加载大量数据。我们已经构建了 OpenRefine它允许人们上传数据集,但这些数据集必须通过需要一些时间才能完成的 QA 过程。有必要进行这些 QA 流程以保持 Freebase 的质量水平,但它确实会减慢加载大型数据集的过程。

我真的希望您选择使用 Freebase 音乐数据来建立您的公司。我知道已经有许多音乐初创公司乐于使用我们的数据。

关于database - Freebase:我公司的整个数据库都基于它值得吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11994634/

相关文章:

java - 如何将 Access 数据库共享到不同的 PC 上以用于 Java 桌面应用程序?

redis - 在 debian/ubuntu 启动时启动 redis-server

rdf - Freebase 最近是否发布了 RDF 转储?

freebase - Freebase 是否使用问答 (QA) 作为知识库?

api - 如何反转MQL查询(对于freebase)?

database - 在开发人员之间同步数据库模式

php - 我想从数据库中获取最后插入的数据

database - 为什么我们使用 laravel seed,如果有 migration 和 eloquent 扮演数据库概念的角色?

eclipse - 无法运行 Eclipse; JVM 终止。退出代码=13

hadoop - Hadoop CDH3错误。无法启动Hadoop DataNode守护程序