c# - Lucene 搜索日文字符

标签 c# asp.net lucene.net

我已经为我的应用程序实现了 lucene,它工作得很好,除非你引入了类似日文字符的东西。

问题是,如果我有日文字符串 こんニちは、このバイネイテす 并且我使用第一个字符 こ 进行搜索,那么它运行良好,而如果我在搜索 token 中使用多个日文字符(こんニち),则搜索失败并且没有找到文件。

lucene 是否支持日文字符?要使其正常工作需要进行哪些设置?

最佳答案

lucene内置分析器不支持日文。

您需要安装一些分析器,例如 sen , 这是 mecab 的 java 端口,相当流行的日本分析仪,而且速度很快。

有2个子类型叫做

  1. CJKAnalyzer,也支持中文和韩文,并使用二元词法
  2. JapaneseAnalyzer,它只支持日语,使用形态分析器并且应该非常快。

关于c# - Lucene 搜索日文字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2643348/

相关文章:

c# - 如何使用 C#/ASP.Net 在 responseText 中传回错误

c# - Wcf 非常小的数据包大小

lucene.net - 如何充分利用 Lucene.net

c# - 如何读取 Azure Function 应用程序内的配置 json 文件

c# - 如何使用 https 打开 RadWindow

c# - 使用 quartz 作业调用应用程序

c# - 'Enums' 类中不允许代码优先枚举? (英孚 5)

ASP.NET 使用response.redirect传递参数而不显示在url中

c# - 在类似 eBay 的系统中使用的最佳搜索引擎 (.NET)

lucene.net - Lucene 中的查询类型