很抱歉这个奇怪的“问题标题”,但我想不出合适的标题。
我对 NLP 概念不熟悉,所以我使用了 NER 演示 ( http://cogcomp.cs.illinois.edu/demo/ner/results.php )。现在的问题是“如何以及以什么方式”我可以使用 NER 完成的这些标记。我的意思是,人们可以从这些已标记为某些组(位置、人员、组织等)的命名实体中得出哪些答案或推论。如果我有一个包含全新公司、地点等名称的数据,那么我该怎么办对这样的数据进行 NER 标记?
请不要投票或阻止我,我只需要指导/专家建议就是这样。阅读一个概念是另一回事,而能够知道何时何地应用它又是另一回事,这就是我寻求指导的地方。非常感谢!!!
演示中的片段:-
狗已经在 cargo 区域使用了一段时间,但最近才被引入 LOC 纽瓦克 和 LOC JFK 机场的乘客区。 LOC JFK 有一只狗,LOC Newark 有一只狗 PER Farbstein 说,少数。
最佳答案
通常 NER 是管道中的一个步骤。例如,一旦所有实体都被标记,如果您有很多句子,例如 [PER John Smith], CEO of [ORG IBM] said...
,那么您可以设置一个公司表,并首席执行官们。这是 knowledge base population 的一种形式.
不过,还有很多其他用途,具体取决于您已有的数据类型以及您想要完成的任务。
关于python - 命名实体识别: For new/latest entities,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26262222/