java - 使用java将Parquet文件从Lambda保存到S3

标签 java amazon-s3 aws-lambda parquet

我有一个用例,需要将 parquet 文件从 Lambda 保存到 S3。 我需要以追加模式存储 Lambda 函数中触发的事件。

我尝试使用 Avro,但它不允许将数据以附加模式存储在同一个 Parquet 文件中。

到目前为止,我发现只有 Spark 允许以追加模式将数据存储在 parquet 文件中...然后,我可以使用 Lambda 提交存储数据的 Spark 作业。 您对这个可能的解决方案有何看法?

但是,真的不存在不使用 Spark 的解决方案吗? 提前致谢

最佳答案

无论格式如何,您都无法将数据附加到存储在 S3 中的任何文件。对不起。这只是 S3 和文件系统之间的差异之一。

关于java - 使用java将Parquet文件从Lambda保存到S3,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43700531/

相关文章:

java - 如何让 Eclipse 在打开搜索结果时打开整个文件?

ruby-on-rails - rails : Uploading Images to Amazon S3 via Carrierwave only works on "Edit"

powershell - 使用 AWS Powershell 部署到 AWS elastic beanstalk

amazon-s3 - Amazon Alexa Skill S3 限制

amazon-web-services - 亚马逊网络服务 : NoCredentialsError: Unable to locate credentials

java - final 关键字并在 java 中将连接对象声明为 final

java - SonarQube CLI 扫描仪无法保留堆

java - Jspx 文件和条件注释

amazon-web-services - 用于设置 S3 存储桶默认加密的 CloudFormation 模板

asp.net-core - 我们可以在 template.serverless 文件中声明阶段名称吗?