pandas - 如何将数据从 S3 存储桶加载到 Sagemaker jupyter 笔记本来训练模型?

标签 pandas amazon-web-services amazon-s3 amazon-sagemaker

我在 S3 存储桶中有 csv 文件,我想用它们在 sagemaker 中训练模型。

使用此代码但出现错误(找不到文件)

import boto3
import pandas as pd
region = boto3.Session().region_name
train_data_location = 's3://taggingu-{}/train.csv'.format(region)
df=pd.read_csv(train_data_location, header = None)
print df.head

有什么办法可以解决这个问题吗?

最佳答案

不确定,但是这个 stackoverflow 可以回答这个问题吗? Load S3 Data into AWS SageMaker Notebook

引用@Chhoser:

import boto3
import pandas as pd
from sagemaker import get_execution_role

role = get_execution_role()
bucket='my-bucket'
data_key = 'train.csv'
data_location = 's3://{}/{}'.format(bucket, data_key)

pd.read_csv(data_location)

关于pandas - 如何将数据从 S3 存储桶加载到 Sagemaker jupyter 笔记本来训练模型?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53495968/

相关文章:

python - 按子字符串条件过滤 pandas DataFrame

python - 从坐标标签计算 xarray 数据数组

ruby-on-rails - CarrierWave Fog 凭证,拒绝访问

javascript - AWS Lambda 和 Node : Write data while streaming - ends prematurely and data is missing

node.js - 从 s3 获取签名的 url 以使用 SSE-C 解密上传的对象

node.js - s3.getObject()。promise()从不返回任何内容

python - 使用另一列的值获取某一列的值

python - 在 try/except block 中连接数据帧

amazon-web-services - 将预先存在的静态(弹性)IP 分配给 EC2 实例

amazon-web-services - cloudformation更新堆栈不是幂等的