我想使用词性技术在句子中标记特定领域,例如技术和科学名词。
示例
考虑以下句子:
1) 计算机需要键盘、显示器、CPU 才能工作。
2)汽车使用齿轮和离合器。
现在我的目标是,例句必须标记为
- 第 1 句话
Computer/technical
need/noun
keyboard/technical
CPU / technical
to /preposition
work /verb
- 第二句
Automobile / mechanical
uses / verb
gears / mechanical
and / conjunction
clutch / mechanical
我想在java中实现上述目标,即通过其相关领域(例如技术,机械,电气等)来标记名词。
我以前的作品
我已经使用过Stanford NLP、Open NLP,但是它们都标记了POS,但不能满足需要。
请告诉我该怎么做?
最佳答案
有趣的问题,这里有一些想法。由于您需要词性,请使用词性标记器(例如 OpenNLP),这将为您提供所需的 POS 标记。第二部分有点棘手(对某些单词进行分类)。如果映射到某个类别的单词受到限制,您可以简单地使用查找列表,有时这是最简单且最准确的,使用 NER 模型会给您带来一些噪音。如果没有,那么您可以执行已经建议的操作,即训练 NER 模型。
关于java - 如何使用词性标记器标记字段特定名词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21520818/