elasticsearch - ElasticSearch 中的实体标记

标签 elasticsearch nlp

我想标记 Elastic 中的特定实体。支持吗? 例如对于文本:

Hello my name is Johnny

将其标记到标记上 Hello my name is johnny < person

然后突出显示这些实体? 有谁知道这样的东西或插件或任何方向都会有帮助。

最佳答案

Elasticsearch 不进行命名实体识别。不过,您可以使用类似于此的摄取处理器 https://github.com/spinscale/elasticsearch-ingest-opennlp (尽管您可能必须根据您的具体用例修改它)。

但是,您最好在对文档建立索引之前进行命名实体识别。您可以尝试 openNLP 或 NLTK,或者如果它是非商业项目,则可以尝试斯坦福 NER。我认为您想自己添加“突出显示”标签,也在索引之前添加。我正在考虑这样的事情:

<ne type="person">Johnny</ne> is from <ne type="place">New York</ne>

您可以使用自定义分析器丢弃标签进行分析,或者简单地索引两个字段,其中一个字段没有标签。

关于elasticsearch - ElasticSearch 中的实体标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45820366/

相关文章:

elasticsearch - 如何在Elastic Search集群中加载Json?

elasticsearch - 如何在elasticsearch中获得除一个术语外的所有术语的数量?

grails - 运行 Elasticsearch 插件 grails 2.4.4/2.5.0

elasticsearch - ELASTICSEARCH-自动包含日期,而没有预定义的日期字段

python - 确定一个句子的时态Python

python - 使用 Python 自然语言工具包阅读孟加拉语

elasticsearch - 无法在Kibana中的Logstash索引上执行SQL搜索

python - 如何将字符串转换为缩写

python - 使用 keras 进行文档分类 - 数字的分层序列

image - Bing/Google/Flickr API:您将如何查找包含15万个日语句子的图像?