eclipse - UIMA 中的名称实体关系

标签 eclipse machine-learning nlp uima ruta

我是 UIMA 的新手,目前我陷入以下情况。

如何对从 UIMA 中的注释器获得的不同标记集进行分类和关联? 就像个人实体 token 集名称(如 {John,Smith})和 Assets 实体集(如 {car,home})一样。我想编写分类规则,如下所示的 xml。

<person>
  <name>john</name>
  <asset>car</asset> 
</person>
and
<person>
  <name>Smith</name>
  <asset>home</asset> 
</person>

提前感谢您的帮助..

最佳答案

您可能想看看 UIMA Ruta基于规则的方法。

根据先决条件和要求,UIMA Ruta 有多种方法可以解决此问题。

这是一个简单的示例,用于处理“约翰买了一辆车。史密斯在家。”之类的文档。

DECLARE Name, Asset, Sentence;
DECLARE Annotation Person (Name name, Asset asset);

// just to get some annotations
"john" -> Name;
"Smith" -> Name;
"car" -> Asset;
"home" -> Asset;

// span of relation
(# PERIOD){-> Sentence};
PERIOD (# PERIOD){-> Sentence};

// create relation
Sentence{-> CREATE(Person, "name" =  Name, "asset" = Asset)};

(我是 UIMA Ruta 的开发者)

关于eclipse - UIMA 中的名称实体关系,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23615639/

相关文章:

eclipse - 如何在 Eclipse 中运行系统 shell/终端?

python - 为什么在神经网络中将误差乘以 sigmoid 的导数?

text - 如何使用单词的向量表示(从 Word2Vec 等获得)作为分类器的特征?

c# - 使用 SharpNLP 识别英语句子中的时态

java - Eclipse Helios Mac OS X 10.6.5 有性能问题

java - Eclipse 控制台中出现 "Unable to parse type name from hyperlink"错误

javascript - 使用 JavaScript 修改 BIRT 中的查询输出

python - 如何将 tanh 添加到 keras 中的一个嵌入层

machine-learning - Weka 中的.names 和.data

python - scikit-learn,向矢量化文档集添加功能