javascript - 为什么 lunr 不会索引 JSON 数组中的多个单词字符串?

标签 javascript json lunrjs

Lunr 在查找大多数结果方面做得很好,但我不明白为什么它不会返回 JSON 数组中包含的多单词字符串。

下面是一个示例 JSON 文件,可让您了解我的数据的结构:

[{
    "title": "Rolling Loud",
    "date": "May 5–7",
    "location": "Miami, FL, USA",
    "rock-artists": [],
    "hh-artists": ["Kendrick Lamar", "Future"],
    "electronic-artists": [],
    "other-artists": []
}]

当我搜索“迈阿密”和“ future ”时,lunr 返回节日。但是,当搜索“Kendrick”或“Kendrick Lamar”时,lunr 不会返回节日。

相关代码:

// initialize lunr
var idx = lunr(function () {
    this.field('id');
    this.field('title', { boost: 3 });
    this.field('date');
    this.field('location');
    this.field('rockArtists', { boost: 3 });
    this.field('hhArtists', { boost: 3 });
    this.field('electronicArtists', { boost: 3 });
    this.field('otherArtists', { boost: 3 });

    // add festivals to lunr
    for (var key in data) {
        this.add({
           'id': key,
           'title': data[key].title,
           'date': data[key].date,
           'location': data[key].location,
           'rockArtists': data[key]['rock-artists'],
           'hhArtists': data[key]['hh-artists'],
           'electronicArtists': data[key]['electronic-artists'],
           'otherArtists': data[key]['other-artists']
        });
    }
});

谢谢!

最佳答案

Lunr 正在索引 hh-artists 字段,您应该能够通过查找索引中的值之一来确认这一点:

idx.invertedIndex['Kendrick Lamar']

当文档字段是数组时,lunr 假定数组的元素已拆分为用于索引的标记。因此,“Kendrick Lamar”不是作为单独的标记添加到索引中,而是作为单个标记添加。

这会在尝试搜索时导致问题,因为搜索“Kendrick Lamar”实际上是搜索“Kendrick”或“Lamar”,因为搜索字符串在空格上分割以获取标记。 “Kendrick”和“Lamar”都不在索引中,因此没有结果。

要获得您希望的结果,您可以将数组转换为字符串,并让 lunr 处理将其拆分为标记:

this.add({
  'hhArtists': data[key]['hh-artists'].join(' ')
})

关于javascript - 为什么 lunr 不会索引 JSON 数组中的多个单词字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43530478/

相关文章:

json - Jekyll 搜索 Lunr JS,不工作

node.js - Gatsby Lunr 插件与 Ghost 源

javascript - 切换复选框在 Angular js 中不起作用,它总是显示

javascript - JQuery 选择器未选择 EmberJS View 中的列表项

javascript - NodeJS, Angular 2 |接下来在 Observable 上执行方法

javascript - ECMAScript 2017 : Why does EscapeSequence include NonEscapeCharacter?

javascript - 在现有 package.json 中安装新的依赖项

javascript - this.myObj = myObj 会存储引用或副本/快照吗?

json - Data.Aeson 编码可选键