c++ - 来自 iostream 或内存缓冲区的 Apache Arrow 表

标签 c++ amazon-s3 iostream parquet apache-arrow

我有一些代码可以使用 AWS API 从 AWS S3 检索 Parquet 文件。结果是一个标准的 iostream:

   std::basic_iostream< char, std::char_traits<char>> 

据此,我想创建一个 Apache 箭头表,而无需将 iostream 保存到本地文件然后加载。但是,我在 API 中看不到任何帮助。 Arrow 只提供从文件加载 parquet 的接口(interface)。

最佳答案

对直接 S3 支持的初步支持已添加到 master .您应该能够生成一个文件,该文件可以使用新 API 传入以供 Parquet 读取。我的理解是,这也是建立在官方 S3 客户端之上的,因此您也可以根据您的用例调整代码。

关于c++ - 来自 iostream 或内存缓冲区的 Apache Arrow 表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58093061/

相关文章:

c++ - 为什么多态类型的原始数组是危险的

ios - 找到要上传到的最快的 S3 存储桶

amazon-web-services - Aerospike 可以用作 S3 的替代品吗?

c++ - 适用于 unsigned char 的自定义 std::hex 操纵器

C++ : elegantly iterate a set of numbers

c++ - 删除一个模板函数,除了它的一个特化

node.js - 我应该在哪里存储我的 Node.js 应用程序的 key ?

c++ - 为什么 std::ios_base::ignore() 设置 EOF 位?

c++ - 使用流读取复杂结构

c++ - 在 const 函数中使用 boost::mutex::scoped_lock