java - 在 Lucene 中索引 RTF 文件且字段完好无损

标签 java file lucene rtf

感谢您阅读此问题。

我正在尝试在 Lucene 中索引 RTF 文件。看起来方法很少,但似乎都只是提取正文并将其交给Lucene。我认为这会破坏田地。如果我想索引文件路径(用于显示)和正文文本(用于查询),那么我该如何解决这个问题?

谢谢:)

最佳答案

您只需为您想要的每个附加字段(在您的情况下为路径)添加具有给定值的文字参数以及文件即可。

参见here for doc 。在你的情况下,它将是

curl "http://localhost:8983/solr/update/extract?literal.path=\path\to\tutorial&commit=true" -F "myfile=@tutorial.html"

如果需要对\进行编码,则为%5C

关于java - 在 Lucene 中索引 RTF 文件且字段完好无损,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11900436/

相关文章:

java - 将自定义属性或元数据添加到文件 java

merge - 为什么 Lucene 合并索引?

java - Elasticsearch : How to get score for each word matched in a match query

Java 从 XML 文件中删除子项

iOS iPod API - 获取实际的歌曲文件

java - 由 : java. 引起 lang.NoClassDefFoundError: [Lorg/hibernate/engine/FilterDefinition;

perl - 为什么调用这个函数会改变我的数组?

sharepoint - 我可以在不使用 Lucene 连接器框架的情况下将 Solr 与 Sharepoint 集成吗

java - 对于没有 PK 的表,使用 JPA 组合键

java - 微调器简单项目模板获得不同的大小