python - 来自 csv 文件路径和标签的 Pytorch 数据加载器

标签 python pytorch

我有一个用于训练和测试数据集的 csv 文件,其中包含文件位置和标签。该数据框的头部是:

df.head()
Out[46]: 
             file_path  label
0  \\images\\29771.png      0
1  \\images\\55201.png      0
2  \\images\\00715.png      1
3  \\images\\33214.png      0
4  \\images\\99841.png      1

我有多个文件路径位置,但空间有限,因此无法将它们复制到\0 和\1 文件夹位置。如何使用此数据框创建 pytorch 数据加载器和/或数据集对象?

最佳答案

只需为您的数据集编写一个自定义 __getitem__ 方法即可。

class MyData(Dataset):
    def __init__(self, df):
        self.df = df

    def __len__(self):
        return self.df.shape[0]

    def __getitem__(self, index):
        image = load_image(self.df.file_path[index])
        label = self.df.label[index]

        return image, label

其中 load_image 是将文件名读取为您需要的任何格式的函数。

关于python - 来自 csv 文件路径和标签的 Pytorch 数据加载器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62271194/

相关文章:

python - 在 Python 中从文本文件导入数据和变量名称

python - pandas 合并如何保持顺序?

python - 如何向 tqdm pandas 添加描述?

python - 使用重复索引按索引 reshape Pandas 数据帧

python - Pytorch 嵌入 RuntimeError : Expected object of type torch. LongTensor 但发现参数类型 torch.cuda.LongTensor #3 'index'

Google Colab上的PyTorch Geometric CUDA安装问题

python - 所有 cuda、pytorch、cuda 工具包都匹配,但 `torch.cuda.is_available()` 仍然为 False

python - 无法使用 pytorch 进行预测 [MNIST]

python - 忽略查找和替换算法中引号中的字符

python - 运行时错误 : cuda runtime error (30) : unknown error at torch/csrc/cuda/Module. cpp:32