我正在尝试将 pdf 转换为缩略图并将该数据保存到 Solr 中,如果可能的话请帮助我们?
最佳答案
但是为什么要使用 MapReduce。 您需要先使用 tika 提取 pdf,请参阅下面的链接
获取元数据名称及其值并创建 JSON。类似的东西
pdftitle:两种状态
作者:Chetan Bhagat
到
{ "pdftitle":"两种状态", “作者”:“Chetan Bhagat” }
关于java - 将 pdf 转换为缩略图并将该数据也保存到 solr 中吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36737803/