solr - ExtractingRequestHandler - 你如何发布多值文字字段?

标签 solr apache-tika solr-cell

我正在尝试发布一个文本多值字段以及一个 PDF 摘录。似乎只有一个字段值被添加到索引中。这是否需要以不同的方式传递?

当前发送相当于(通过 POST 值):

http://localhost:8080/solr/update/extract?literal.keyword_txt=keyword1&literal.keyword_txt=keyword2&literal.keyword_txt=keyword3...etc

最佳答案

根据ExtractingRequestHandler关于输入参数的维基页面,它支持多值文字。

literal.= - Create a field with the specified value. May be multivalued if the Field is multivalued.



我认为您应该将多值 liertal 作为逗号分隔值传递。因此,也许尝试以下操作:
http://localhost:8080/solr/update/extract?
      literal.keyword_txt=keyword,keyword2,keyword3

关于solr - ExtractingRequestHandler - 你如何发布多值文字字段?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8523904/

相关文章:

solr - 何时在Sitecore 7版本中绝对在Lucene上使用SOLR?

java - Solr,如何在 schema.xml 中定义嵌套文档

java - 有没有办法找出一天中更新/写入的文档到 solr 索引

ruby-on-rails - 如何将最新版本的 Sunspot gem 与 Solar Cell 一起使用?

pdf - 索引 pdf 文档

java - 预期的 mime 类型 application/xml 但得到了 text/html

java - 解析二进制文件时出错... (moSTLy PDF)

java - 如何解决我的 Apache Tika 代码中的以下 "NoClassDefFoundError"问题?

tesseract - 从 tika-server 获取 hocr 输出

python - 文本索引器(适用于 Python),内置对 doc、docx 和 pdf 文件的支持