我在一家公司工作,该公司正在为现场音乐建立 field /艺术家数据库,最近遇到了 Freebase。它看起来非常引人注目,即使没有新的、崭露头角的乐队的数据。对于那些使用过 Freebase 的人,我有几个问题:
将所有数据输入与 Freebase 集成是否有缺点?我们不打算出售或私有(private)化这些信息。
Freebase 在可用性方面的弱点是什么?
最佳答案
披露:我在 Google 的 Freebase 工作。
Freebase 中的音乐数据是我们最强大的领域之一,并且随着我们继续加载更多数据集,它将继续变得更广泛和更丰富。例如,我们从 MusicBrainz 导入数据,对其进行清理并将主题与 Freebase 中的现有主题进行匹配以避免重复。
就缺点而言,您应该准备好处理大量数据。例如,Freebase 目前有 4 musical artists named "John Smith"这可能对您的应用程序有用,也可能没有用,但您仍然需要弄清楚哪些映射到您的用户感兴趣的 John Smith。我们称之为“协调”,它是必要的,以便您的应用程序知道准确查询 API 的主题。
既然你提到了音乐场所,我还应该指出,虽然 Freebase 有很多关于地点的数据,但我们还没有地理搜索 API,所以如果你需要的话,你需要自己动手。
既然任何人都可以编辑 Freebase,你也应该考虑使用 as_of_time以保护您的网站免受破坏。
Freebase 非常适合开发人员,因为您可以轻松进入并清理不良数据或添加缺失的主题。然而,一直存在挑战的一个领域是从 Google 外部加载大量数据。我们已经构建了 OpenRefine它允许人们上传数据集,但这些数据集必须通过需要一些时间才能完成的 QA 过程。有必要进行这些 QA 流程以保持 Freebase 的质量水平,但它确实会减慢加载大型数据集的过程。
我真的希望您选择使用 Freebase 音乐数据来建立您的公司。我知道已经有许多音乐初创公司乐于使用我们的数据。
关于database - Freebase:我公司的整个数据库都基于它值得吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11994634/