java - 如何使用词性标记器标记字段特定名词?

标签 java nlp information-retrieval stanford-nlp opennlp

我想使用词性技术在句子中标记特定领域,例如技术和科学名词。

示例

考虑以下句子:

1) 计算机需要键盘、显示器、CPU 才能工作。
2)汽车使用齿轮和离合器。

现在我的目标是,例句必须标记为

  • 第 1 句话

Computer/technical
need/noun
keyboard/technical
CPU / technical
to /preposition
work /verb

  • 第二句

    Automobile / mechanical
    uses / verb
    gears / mechanical
    and / conjunction
    clutch / mechanical

我的需求
我想在java中实现上述目标,即通过其相关领域(例如技术,机械,电气等)来标记名词。

我以前的作品
我已经使用过Stanford NLP、Open NLP,但是它们都标记了POS,但不能满足需要。

请告诉我该怎么做?

最佳答案

有趣的问题,这里有一些想法。由于您需要词性,请使用词性标记器(例如 OpenNLP),这将为您提供所需的 POS 标记。第二部分有点棘手(对某些单词进行分类)。如果映射到某个类别的单词受到限制,您可以简单地使用查找列表,有时这是最简单且最准确的,使用 NER 模型会给您带来一些噪音。如果没有,那么您可以执行已经建议的操作,即训练 NER 模型。

关于java - 如何使用词性标记器标记字段特定名词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21520818/

相关文章:

indexing - 在大型数据库中搜索(非常)近似子串

java - 创建带有计算值的枚举

java - FileInputStream 和 FileOutputStream 逐行

java - 随机数组,不重复

python - 如何为 NLTK 中的歧义句子生成多个解析树?

python - 请查看 python 代码以提高其性能

mysql - 包含 IP 地址和网络信息的数据库设计

java - 只需要一点帮助调试我的代码

Python:找出列表中的某些单词是否是实际的英语单词或接近英语单词

python - 斯坦福手套 : Dimension anomaly in glove. twitter.27B.200d