java - 将 pdf 转换为缩略图并将该数据也保存到 solr 中吗?

标签 java solr lucene apache-pig apache-tika

我正在尝试将 pdf 转换为缩略图并将该数据保存到 Solr 中,如果可能的话请帮助我们?

最佳答案

但是为什么要使用 MapReduce。 您需要先使用 tika 提取 pdf,请参阅下面的链接

http://www.tutorialspoint.com/tika/tika_extracting_pdf.htm

获取元数据名称及其值并创建 JSON。类似的东西

pdftitle:两种状态

作者:Chetan Bhagat

{ "pdftitle":"两种状态", “作者”:“Chetan Bhagat” }

关于java - 将 pdf 转换为缩略图并将该数据也保存到 solr 中吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36737803/

相关文章:

java - Jmeter 从 View 结果树监听器将请求详细信息写入 CSV/XML

ElasticSearch:preserve_position_increments 不工作

java - 在查询中指定 Solr 请求处理程序

java - 卢塞恩 : why the highlighting does an extra word splitting ?

java - 我如何结合两个 Set Inside HashMap java 的值

java - javafx 中问卷面板的结构

java - 如何转换继承的封装属性以公开子类的方法 - Java

java - 在 avro 中存储模式有什么好处?

java - Solr WhitespaceTokenizerFactory -\r\n 不被视为空格?

solr - 是否有一种简单的方法可以让 Solr 根据随请求提交的一组凭据引用不同的索引?