java - 如何将 pdf/images 存储到 HBase 表

标签 java hadoop pdf hbase blob

我是 HBase 的新手。以下是我想要实现的目标: 1.如何将.pdf或.png转成hbase可读格式? 2、如何将这些文件导入到hbase表中? (将元数据存储在一个 cf 中,将对象存储在另一个 cf 中)

任何人都可以分享这方面的例子吗?任何其他建议都有帮助。

最佳答案

图片见我的 answer .对于 PDF 这也将起作用,因为我们正在尝试以最原始的方式存储字节数组。建议您使用Serialization Utils对于 pdf,如我在答案中的示例中所述。

使用 Apache Commons IO org.apache.commons.io.FileUtils.readFileToByteArray(File file) 返回 byte[] 类型的数据。

同时检查 this

关于java - 如何将 pdf/images 存储到 HBase 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42688759/

相关文章:

java - 如何在Spring中使用@Transactional实现真正的事务

java - 在 netbeans 7.1 中填充 jcombobox

java - Oozie 抛出 java.lang.ClassNotFoundException

swift - 无法通过 PDFKit 在 iOS 13 和 iPhones 11、XR 等上绘制图像注释

php - 链接到 html 中的 PDF,该文件没有扩展名,但我知道它是 pdf 如何正确打开它

linux - 如何使用免费的 Linux 命令行工具将字体嵌入到 PDF 中?

java - 如何设置服务器上显示上下文参数的优先顺序?

java - 在计数器模式下使用 AES 生成一次性 key

sql - 如何从 Hive 中的组中的当前行中减去上一行?

hadoop - 集群的映射器估计