我想标记 Elastic 中的特定实体。支持吗? 例如对于文本:
Hello my name is Johnny
将其标记到标记上
Hello
my
name
is
johnny < person
然后突出显示这些实体? 有谁知道这样的东西或插件或任何方向都会有帮助。
最佳答案
Elasticsearch 不进行命名实体识别。不过,您可以使用类似于此的摄取处理器 https://github.com/spinscale/elasticsearch-ingest-opennlp (尽管您可能必须根据您的具体用例修改它)。
但是,您最好在对文档建立索引之前进行命名实体识别。您可以尝试 openNLP 或 NLTK,或者如果它是非商业项目,则可以尝试斯坦福 NER。我认为您想自己添加“突出显示”标签,也在索引之前添加。我正在考虑这样的事情:
<ne type="person">Johnny</ne> is from <ne type="place">New York</ne>
您可以使用自定义分析器丢弃标签进行分析,或者简单地索引两个字段,其中一个字段没有标签。
关于elasticsearch - ElasticSearch 中的实体标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45820366/