linux - sphinxsearch 2.2.4 wordforms 字典中的重复项仅包含一行

标签 linux dictionary configuration 64-bit sphinx

我的新编译 2.2.4 sphinx 安装有问题。

二进制文件是用参数构建的:

$ ./configure --without-pgsql --with-mysql --enable-id64 --prefix=/usr/local/sphinxsearch/2.2.4 --with-mysql-libs=/usr/bin

为了测试,我创建了只有一行的词形字典。我删除了旧索引,并尝试使用命令创建新索引:

 /usr/bin/indexer --rotate --config /etc/sphinxsearch/sphinx.conf indexname

这给了我结果:

Sphinx 2.2.4-id64-release (r4806)
Copyright (c) 2001-2014, Andrew Aksyonoff
Copyright (c) 2008-2014, Sphinx Technologies Inc (http://sphinxsearch.com)

using config file '/etc/sphinxsearch/sphinx.conf'...
indexing index 'indexname'...
WARNING: index 'indexname': duplicate wordform found ( 'yes > now' ). Fix your wordforms   file '/var/lib/sphinxsearch/wordforms.txt'.

我的配置:

index indexname
{
source              = indexsource
path                = /var/lib/sphinxsearch/data/index
dict = keywords
docinfo             = extern
min_word_len        = 2 
wordforms    =  /var/lib/sphinxsearch/wordforms.txt 
}

所以我的问题是:如何使用 wordforms 正确配置 sphinx。 2.1.9版本没有这个问题

附加信息:

今天我尝试构建 2.2.3-beta 版本,你猜怎么着?问题不存在。所以新的稳定版 2.2.4 肯定有问题:(

最佳答案

我可以确认我在 2.2.4 中也遇到了这个问题。我今天早上升级到 2.2.6,警告消失了,我的配置没有任何更改。

关于linux - sphinxsearch 2.2.4 wordforms 字典中的重复项仅包含一行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25940717/

相关文章:

linux - oprofile 还活着吗?

linux - SSH 连接到本地网络上的远程

linux - UDP广播和单播通过同一个套接字?

java - J2EE 配置期间出现错误

linux - 如何直接覆盖 'unexpand'(空格到制表符的转换)?

python - 逐一打开文件夹中的所有 csv 并将它们附加到字典或 pandas 数据框中

c# - 将值分配到键类型为 <Tuple<int,int> C# 的字典中

javascript - mapbox.js 上的自动完成输入

performance - Selenium UI 在 Firefox 上的 Jenkins 上测试速度太慢(使用 xvfb)

java - Log4J2 AsyncLogger 正在以高并发填满 LMAX disruptor 的环形缓冲区