java - Apache Solr 6.6.1 乌尔都语语言的数字映射

标签 java apache solr lucene tokenize

我已配置 Apache Solr 6.6.2 以便稍后索引和搜索文档。我面临一些问题。如果文档中有一个数字,如 1234,我希望它应该映射(复制)到相应的乌尔都语数字,如 1234。如果用户输入 1234 或 1234,最终将有助于检索文档。 Solr 中是否有任何内置解决方案或者我如何进入此功能?

最佳答案

如果您使用 Java/SolrJ 客户端进行索引...

将 junidecode 依赖项添加到您的项目

对于 gradle

compile group: 'junidecode', name: 'junidecode', version: '0.1.1'

对于行家:

<dependency>
    <groupId>junidecode</groupId>
    <artifactId>junidecode</artifactId>
    <version>0.1.1</version>
</dependency>

索引时...索引附加字段...

import net.sf.junidecode.Junidecode;
String converted = Junidecode.unidecode("۱۲۳۴") 
// converted == 1234

关于java - Apache Solr 6.6.1 乌尔都语语言的数字映射,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49004784/

相关文章:

java - Stream.map(...) 和 Collectors.mapping(...) 有什么区别?

java - 在 Java 中使用另一个构造函数

java - apache james邮件服务器发送电子邮件

apache - Apache2 中的 401 自定义错误页面

solr - 我们可以一起使用 WhitespaceTokenizerFactory 和 StandardToken 来只接受几个特定的​​符号吗?

Java Swing - PaintComponent() 不绘制我的线程

java - 飞行路线迁移: NamedParameterJdbcTemplate

javascript - 获取 HTML 或 JavaScript 中的服务器计算机名称

solr - 为什么在为 Sitecore 7 重新索引我的 Solr 搜索索引时会收到 "unable to write data to the transport connection"错误?

linux - Java销售过程中令人困惑的内存报告