感谢您阅读此问题。
我正在尝试在 Lucene 中索引 RTF 文件。看起来方法很少,但似乎都只是提取正文并将其交给Lucene。我认为这会破坏田地。如果我想索引文件路径(用于显示)和正文文本(用于查询),那么我该如何解决这个问题?
谢谢:)
最佳答案
您只需为您想要的每个附加字段(在您的情况下为路径)添加具有给定值的文字参数以及文件即可。
参见here for doc 。在你的情况下,它将是
curl "http://localhost:8983/solr/update/extract?literal.path=\path\to\tutorial&commit=true" -F "myfile=@tutorial.html"
如果需要对\进行编码,则为%5C
关于java - 在 Lucene 中索引 RTF 文件且字段完好无损,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11900436/