我对计算语言学和 NLP 的领域感兴趣。我读了很多关于语法框架(GF)的内容,它分为抽象语法和具体语法。我对 OWL、RDF 和 WordNet 略知一二。我对这两种技术之间的差异感到困惑。
最佳答案
语法框架的正式定义之一是:
Grammatical Framework (GF), grammaticalframework.org, is a multilingual grammar formalism based on the idea of a shared abstract syntax and mappings between the abstract syntax and concrete languages. GF has hundreds of users all over the world.
GF 连接语义网的方式是通过柠檬:
Lemon is a proposed model for modeling lexicon and machine-readable dictionaries and linked to the Semantic Web and the Linked Data cloud.It was designed to meet the following challenges:
- RDF-native form to enable leverage of existing Semantic Web technologies (SPARQL, OWL, RIF etc.).
- Linguistically sound structure based on LMF to enable conversion to existing offline formats.
- Separation of the lexicon and ontology layers, to ensure compatability with existing OWL models.
- Linking to data categories, in order to allow for arbitrarily complex linguistic description.
所以回答你的第一个问题,GF和OWL相辅相成。 GF 本质上是一套可以在语言之间映射的语法规则,但是根据手头的任务,您可以使用 GF 开发强大的语义 Web 工具。例如,GF 可用于表达本体,正如柠檬论文中所证明的那样。
对于第二个问题,是的。由于GF的中级是一组逻辑规则,因此您不再需要解析器。形态学和基本语法映射就足够了(同样,你的目标是什么?正如定义所说,GF 涵盖了基本语法。)
至于 WordNet:
WordNet® is a large lexical database of English. Nouns, verbs, adjectives and adverbs are grouped into sets of cognitive synonyms (synsets), each expressing a distinct concept. Synsets are interlinked by means of conceptual-semantic and lexical relations.
WordNet 可以被视为一个本体,但它不是。它甚至不能称为语言本体论。具有上位词和下位词关系不会使数据集成为本体。
柠檬或 ontolex 试图实现的是创建一个可用于语言目的的本体。这个目的可以是注释、语料库研究、建模词典等。然而,WordNet 的强大之处在于它的同义词集(来自同一词汇类别的大致同义词被分组为同义词集。);但 RDF/OWL 的力量在于推理。
关于nlp - 语法框架 GF 和 owl,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29954476/