freebase - 使用 freebase 进行命名实体识别

标签 freebase dbpedia spotlight-dbpedia

我了解 DBPedia Spotlight 对给定文档进行命名实体识别。为此,它使用存储在文件系统中的下载的 DBPedia 文件。请参阅 URL:https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Run-from-a-JAR

我需要的是 Freebase 的等效 API,例如聚光灯。尽管我浏览过,但我找不到任何在 Freebase 三重存储上运行的此类工具/API。有人可以帮忙吗?

最佳答案

目前 Freebase 中没有用于命名实体识别的等效项目。然而,Freebase 在 sameAs.org 上有 DBpedia 的链接。因此您可以使用 DBpedia Spotlight,然后将 ID 解析回 Freebase(该数据也可以在 Freebase RDF dumps 中找到)。

如果您正在寻找该领域的编码项目,我认为应该可以调整 DBpedia Spotlight 代码,以便您可以使用 Freebase 数据训练其模型。这样做的主要好处是 Freebase 比 DBpedia 涵盖更广泛的实体,因此您可以更好地记忆。此外,您还可以利用 Freebase 中的其他数据(例如“值得注意的类型”)来获得更好的精度。

通过查看 Freebase 中的/type/object/name 和/common/topic/alias 属性,您应该能够获得实体的一组良好的“表面形式”。与 Wikipedia 页面对应的任何 Freebase 实体都将在/wikipedia/en 命名空间中具有一个或多个/type/object/key 值。这些对应于 Wikipedia 页面名称(和重定向),这将允许您解析 Wikipedia XML 转储并识别页面上的哪些链接对应于 Freebase 主题。 Freebase key 编码方案描述 here .

您可能还对 OpenCalais 感兴趣和 AlchemyAPI它们提供命名实体识别服务,并在其 API 响应中提供 Freebase ID。

关于freebase - 使用 freebase 进行命名实体识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20796266/

相关文章:

java - 在 Java 中使用 Freebase API

javascript - 循环遍历多层 json Jquery

javascript - 如何将我的curl 方法转换为在我的javascript 脚本中工作?

python - POST 响应长度非零,但读取为空

java - Dbpedia-spotlight 缺少资源

spotlight-dbpedia - Dbpedia 聚焦 API 限制

java - 解密 JSON 响应 googles topic api

python - Python根记录器在哪里存储日志?

sparql - SPARQL 查询中的过滤器

sparql - DBPedia SPARQL <LONG::IRI_RANK>