上下文:
我正在尝试读取 AWS s3 上的 csv 文件,计算其数据并将结果写入同一 s3 存储桶中的另一个 csv 上。
我尝试使用以下代码创建一个可以读取我的 Main
的类,并将参数存储在名为 lambdaCmd.txt
的文本文件中。每次修改lambdaCmd.txt
时,都会触发lambda函数,并将lambdaCmd.txt
的内容通过s3event
传递给下面的类参数:
public class LambdaCmd implements RequestHandler<S3Event, Void>{
static final Logger LOGGER = LogManager.getLogger(LambdaCmd.class);
@Override
public Void handleRequest(S3Event s3event, Context context) {
//Getting my txt file's path
S3EventNotification.S3EventNotificationRecord record = s3event.getRecords().get(0);
String bkt = record.getS3().getBucket().getName();
String key = record.getS3().getObject().getKey().replace('+', ' ');
try {
key = URLDecoder.decode(key, "UTF-8");
} catch (UnsupportedEncodingException ex) {
LOGGER.error(ex);
}
AmazonS3 s3Client = AmazonS3ClientBuilder.standard().build();
try {
//Getting my text file as a String Stream
InputStreamReader cmdStream =
new InputStreamReader(s3Client.getObject(bkt, key).getObjectContent());
BufferedReader br = new BufferedReader(cmdStream);
//Parsing the command in cmdStream
//...
//The command is now "String[] cmdArray" to be passed to my main
MyMain.main(cmdArray);
//The main function reads and write from s3 with a similar use of s3Client
br.close();
} catch (IOException | IllegalArgumentException | NullPointerException ex) {
LOGGER.error(ex);
}
return null;
}
}
问题:
在这段代码中记录一些调试消息后,我发现 lambda 函数在这一行停止:
AmazonS3 s3Client = AmazonS3ClientBuilder.standard().build();
这是 CloudWatch 日志(我使用 ##########
隐藏个人信息):
START RequestId: ########## Version: $LATEST
16:12:11.596 [main] DEBUG path.to.mylambdaclass.LambdaCmd - LambdaCmd started
16:12:11.616 [main] DEBUG path.to.mylambdaclass.LambdaCmd - Just before creating s3Client
END RequestId: ##########
REPORT RequestId: ########## Duration: 12398.45 ms Billed Duration: 12400 ms Memory Size: 128 MB Max Memory Used: 67 MB
我在创建s3Client
后也有一条日志消息,但它没有打印在日志中。
问题:
为什么我的 lambda 提前结束?我是否滥用了某些对象?
最佳答案
添加以下 try/catch 后,将所有代码包装在 handleRequest
方法中(我没有捕获错误,这就是我没有看到它的原因):
try {
//My code above
} catch (Error | Exception e) {
LOGGER.error(e);
}
我遇到了java.lang.OutOfMemoryError
。我已将 lambda 内存设置为 128MB,因为我在本地的代码使用的内存小于该内存。但似乎从 s3 读取需要多一点,现在 512MB 就可以正常工作了。
关于java - 使用 Java lambda 读取 aws s3 上的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53783800/