java - 如何在 OpenNLP 中通过 NER 识别印度名字?

标签 java opennlp named-entity-recognition

我正在使用 OpenNLP 模型进行名称实体识别,但问题是它只能识别基于美国和英国的名称(外国名称),因此我需要识别印度名称。

这怎么可能?

最佳答案

NER 解决方案往往是特定领域的,使用硬编码单词列表作为信号(特征)和/或命名实体的内部字母结构。

英国/美国名字彼此相似,也与其他欧洲名字相似,因为许多流行的美国名字和姓氏都来自非英语的欧洲移民。印度人的名字明显不同,常用的姓名/姓氏列表和训练数据语料库通常不包含太多或任何特定于印度人的数据。

要解决您的问题,您需要根据适合您特定领域的数据训练专门的 NER 模型。

关于java - 如何在 OpenNLP 中通过 NER 识别印度名字?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36027672/

相关文章:

java - 如何在 Opennlp 中训练 Chunker?

nlp - 命名实体日期提取

machine-learning - 根据数据库中的值作为训练集从电子邮件中提取字段

python - spaCy 共指解析 - 命名实体识别(NER)以返回唯一实体 ID?

java - 反射 : returning wrong fields

java - 我在 android 中的应用程序中的屏幕旋转问题?

java - 从消息头指定日志记录级别 - Spring Integration - Logging Channel Adapter

hadoop - 无法在 Hadoop map-reduce 作业中加载 OpenNLP 句子模型

java - 日志应该多深?

eclipse - mapreduce 代码在 eclipse 上工作但不在集群上工作