elasticsearch - Elasticsearch:同一领域具有多种语言的文档的映射?

标签 elasticsearch

我有一个文档类型,其中有一个名为title的数据项。这是一些情况:

  • 单个文档的标题可以有多种语言。一份文件
    可能只有英文标题。另一个文档可能有两个(例如
    英文或西类牙文)或更多语言作为标题。目前,那里
    有四种语言(英语,西类牙语,法语和中文)
    文档,但是随着系统的发展,将来会有更多的语言。
  • 标题用于搜索。对于同时具有英文标题和
    西类牙语标题,如果英语搜索字词为
    在英文标题中找到或在西类牙文搜索词中找到
    西类牙语标题。
  • 如果出现以下情况,
  • Elasticsearch应该在搜索结果中返回一个文档
    在同一语言的不同语言标题中找到了搜索词
    文件。
  • 某些文档可能有许多更新。示例更新包括删除文档,更改一个语言标题并保持其他语言标题不变,删除一个语言标题并保持其他语言标题不变。

  • 考虑到文档索引,更改,删除,搜索和系统增长,此文档类型的正确映射是什么?

    任何意见深表感谢!

    问候。

    最佳答案

    标题的映射应与object类型一起使用,其属性包括几个语言字段,并且每个字段可以根据其语言应用不同的分析器。
    在搜索过程中,您可以将字段指定为title.en来快速查找英文​​标题,或者将title.*指定为查询所有标题字段,具体取决于您的需求。

    关于elasticsearch - Elasticsearch:同一领域具有多种语言的文档的映射?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24678608/

    相关文章:

    amazon-web-services - 将索引模板上传到 aws elasticsearch 服务

    mongodb - ElasticSearch 和 Mongo

    elasticsearch - JHipster Elasticsearch无法在Kubernetes上启动

    elasticsearch - 有没有办法我可以解析特定字段以在kibana中进行可视化

    elasticsearch - ElasticSearch-模式中的字段类型不匹配

    amazon-web-services - ec2 上的 elasticsearch 节点的不可靠发现

    sorting - 在 Elasticsearch 中使用文档值从因子对象获取特定键

    elasticsearch - Elasticsearch 中的子聚合

    elasticsearch - query_string 的模糊性被忽略

    spring-boot - 在ElasticSearch中不使用脚本即可追加字符串