我正在基于 LinkedIMDB 的数据构建电影语义搜索引擎的小型原型(prototype)
我定义了一些查询类型作为用例的示例
- 按实体名称搜索 搜索方式
- 实体类型
- 搜索两个实体之间的共同特征...等
到目前为止,我已经开发了一个 SPARQL 引擎,它可以接受任何类型的查询并将查询发送到端点并预览结果。
这里的问题是我想为其制作一个自然语言或半自然语言界面,以便用户使用自然语言搜索查询调用这些句子。但我不知道从哪里开始。
我发现一些论文试图从文本中提取三元组,但我不认为这是解决方案的关键。
我还发现了一些 LSA 技术来解释自然语言搜索查询,但我觉得它不适用于语义搜索领域。
有什么想法或资源可以开始阅读吗? 除了自然语言界面之外还有最佳实践吗?
最佳答案
在自然语言-> SQL 转换领域已经做了很多工作。也许您应该以此为起点,看看如何修改 SPARQL 的可用示例。 (此外,设计受控自然语言可以使您的任务更轻松。)
另一条探索路径可以是这篇文章:支持领域专家构建概念本体:一种整体方法,发表在《网络语义杂志》,http://www.websemanticsjournal.org/index.php/ps/article/view/189尽管它是关于使用自然语言进行本体构建,但其中解释的方法(以及开源代码)可以变成一种富有成效的探索。
关于nlp - 自然语言到 Sparql,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8147751/