elasticsearch - Elasticsearch停用词的相对路径

标签 elasticsearch config stop-words

有人可以通过配置目录的相对路径告诉我elasticsearch documentation是什么意思吗?我在ES安装中看不到任何内容。我需要找到在es索引中定义的停用词文件,例如"stopwords_path": "stopwords/slovak.txt",但找不到任何使用此名称的文件。可能是Win 10无法找到它,因为它的搜索引擎确实很差。非常感谢。

最佳答案

如文档中所述,您应根据以下语法创建文件slovak.txt:

A path (either relative to config location, or absolute) to a stopwords file configuration. Each stop word should be in its own "line" (separated by a line break). The file must be UTF-8 encoded.



因此,您应该创建一个slowak.txt文件,如下所示:
a
aby
aj
ak
aká
akáže
aké
akého
akéhože
akej
akejže
akému
akémuže
akéže
ako
akom
akomže
akou
akouže
akože
akú
akúže
aký
akých
akýchže
akým
akými
akýmiže
akýmže
akýže
ale
alebo
ani
áno
asi
avšak
až
ba
bez
bezo
bol
bola
boli
bolo
buď
bude
budem
budeme
budeš
budete
budú
by
byť
cez
cezo
čej
či
čí
čia
čie
čieho
čiemu
čím
čími
čiu
čo
čoho
čom
čomu
čou
čože
ďalší
ďalšia
ďalšie
ďalšieho
ďalšiemu
ďalších
ďalším
ďalšími
ďalšiu
ďalšom
ďalšou
dnes
do
ešte
ho
hoci
i
iba
ich
im
iná
iné
iného
inej
inému
iní
inom
inú
iný
iných
iným
inými
ja
je
jeho
jej
jemu
ju
k
ká
kam
kamže
každá
každé
každého
každému
každí
každou
každú
každý
každých
každým
každými
káže
kde
ké
keď
keďže
kej
kejže
kéže
kie
kieho
kiehože
kiemu
kiemuže
kieže
koho
kom
komu
kou
kouže
kto
ktorá
ktoré
ktorej
ktorí
ktorou
ktorú
ktorý
ktorých
ktorým
ktorými
ku
kú
kúže
ký
kýho
kýhože
kým
kýmu
kýmuže
kýže
lebo
leda
ledaže
len
ma
má
majú
mal
mala
mali
mám
máme
máš
mať
máte
medzi
mi
mňa
mne
mnou
moja
moje
mojej
mojich
mojim
mojimi
mojou
moju
možno
môcť
môj
môjho
môže
môžem
môžeme
môžeš
môžete
môžu
mu
musí
musia
musieť
musím
musíme
musíš
musíte
my
na
nad
nado
najmä
nám
nami
nás
náš
naša
naše
našej
nášho
naši
našich
našim
našimi
našou
ne
neho
nech
nej
nejaká
nejaké
nejakého
nejakej
nejakému
nejakom
nejakou
nejakú
nejaký
nejakých
nejakým
nejakými
nemu
než
nič
ničím
ničoho
ničom
ničomu
nie
niečo
niektorá
niektoré
niektorého
niektorej
niektorému
niektorom
niektorou
niektorú
niektorý
niektorých
niektorým
niektorými
nielen
nich
nim
ním
nimi
no
ňom
ňou
ňu
o
od
odo
on
oň
ona
oňho
oni
ono
ony
po
pod
podľa
podo
pokiaľ
popod
popri
potom
poza
práve
pre
prečo
pred
predo
preto
pretože
pri
s
sa
seba
sebe
sebou
sem
si
sme
so
som
ste
sú
svoj
svoja
svoje
svojho
svojich
svojim
svojím
svojimi
svojou
svoju
ta
tá
tak
taká
takáto
také
takéto
takej
takejto
takého
takéhoto
takému
takémuto
takí
taký
takýto
takú
takúto
takže
tam
táto
teba
tebe
tebou
teda
tej
tejto
ten
tento
ti
tí
tie
tieto
tiež
títo
to
toho
tohto
tohoto
tom
tomto
tomu
tomuto
toto
tou
touto
tu
tú
túto
tvoj
tvoja
tvoje
tvojej
tvojho
tvoji
tvojich
tvojim
tvojím
tvojimi
ty
tých
tým
tými
týmto
u
už
v
vám
vami
vás
váš
vaša
vaše
vašej
vášho
vaši
vašich
vašim
vaším
veď
viac
vo
však
všetci
všetka
všetko
všetky
všetok
vy
z
za
začo
začože
zo
že

该文件必须在ES_PATH_CONF内部,因此在linux中是/etc/elasticsearch/,在Windows中是C:\ProgramData\Elastic\Elasticsearch\config然后,您遵循相对路径表示法。因此,如果它是C:\ProgramData\Elastic\Elasticsearch\config\slowak.txt,则应该以这种方式设置路径:
"stopwords_path":"slowak.txt"

如果您将其放在C:\ProgramData\Elastic\Elasticsearch\config\synonym\slowak.txt中,则进行设置:
"stopwords_path":"synonym\slowak.txt"

关于elasticsearch - Elasticsearch停用词的相对路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61318689/

相关文章:

elasticsearch - 如何过滤应查询的嵌套对象?

python - 使用 .conf 文件配置 celery

navigation - 如何在 zf2 中设置 2 个导航?

Webpack BannerPlugin 创建单独的许可文件

r - 是否可以向 RTextTools 包提供自定义停用词列表?

vectorization - 用户警告 : Your stop_words may be inconsistent with your preprocessing

spring-boot - 在将使用ES的应用程序从Spring Boot 1.5.x迁移到2.x时,如何实现零停机时间

java - 立即将 Spark 中的 Json 字符串索引到 Elasticsearch

elasticsearch - 如何使用 Elastic 对嵌套对象进行子聚合?

regex - 我可以在Elasticsearch中的停止分析器的停用词中指定regexp吗?