nlp - Java/vb.net 中使用的语义角色标签器

标签 nlp

我想使用Semantic Role Labeler我的项目中使用了来自伊利诺伊州的工具。

我看过 SRL 工具的在线演示。要使用该工具,该网站建议下载 Curator。我已经下载了这个 Curator 文件。但是如何在 Java 代码或 VB.NET 代码中使用 Curator 文件呢?有人可以帮助我吗?

最佳答案

我还想提一下关于 Curator 的一些技巧。您需要 Curator 的原因是 SRL 包作为一个复杂的软件现在需要一些外部依赖项,例如伊利诺斯词性、浅层解析和当前的 Charniak 解析器。 Curator 是我们用来管理这些依赖项的工具。

但是,管理者还将安装 SRL 可能不需要的一些其他依赖项,例如命名实体标记器和 Wikiifier。这些组件往往会消耗大量 RAM(例如,此处列出的两个组件将需要 10GB),因此您可能希望通过注释掉 $CURATOR_HOME/dist/startServer.sh 中的行来将其关闭> 这应该是不言自明的。

一旦你启动并运行了 Curator,你就可以使用 curator-client 包从你的程序中调用它,在 JAVA 中执行此操作的最简单方法是使用 maven:

首先将 CCG maven 存储库添加到您的项目中:

<repositories>
    <repository>
        <id>CogcompSoftware</id>
        <name>CogcompSoftware</name>
        <url>http://cogcomp.cs.illinois.edu/m2repo/</url>
    </repository>
</repositories>

然后添加以下依赖项:

     <dependency>
        <groupId>edu.illinois.cs.cogcomp</groupId>
        <artifactId>curator-interfaces</artifactId>
        <version>0.7</version>
     </dependency> 
    <dependency>
        <groupId>org.apache.thrift</groupId>
        <artifactId>libthrift</artifactId>
        <version>0.8.0</version>
    </dependency>

由于 API 和数据结构是在 Thrift 中定义的,因此您可以通过 thrift 生成 curator 包来在其他语言中使用它们,(但是,正如 Daniel 指出的,Thrift 不支持 VB.NET :) )如果您有兴趣,请访问 CCG 网站,我们正在编写有关如何执行此操作的教程,该教程应该很快就会公开。

有了上述依赖关系后,您应该能够按照我们的演练进行操作 http://cogcomp.cs.illinois.edu/curator/CuratorDemo.html

如果您有任何问题,请告诉我。

关于nlp - Java/vb.net 中使用的语义角色标签器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23028657/

相关文章:

nlp - 添加 SpaCy Tokenizer 异常 : Do not split '>>'

nlp - Spacy的相似性

machine-learning - 多语言文本垃圾邮件检测

Python - 数据编码向量到Word

python - 如何加快 Spacy 的 nlp 调用?

machine-learning - 使用 ChatBot 订购电影票

machine-learning - 将保存的训练模型上传到 MLKIT

nlp - 如何解读 NLTK Brill 标注器规则

python - 查找并替换为以小写字母开头的正确句子案例句子。正则表达式或崇高

python - spacy 中的词向量示例问题