python - PyTorch:从多个数据集进行批处理

标签 python pytorch torch

我想在训练中使用多个数据集。我希望每个批处理都来自一个数据集,但有来自(可能)每个时期的所有数据集的批处理。

将数据集合并到一个简单的 Dataset 对象并使用默认的 Dataloader 可以在一批中获得来自不同数据集的样本。

我自己的猜测是为每个数据集都有一个单独的Dataset对象并覆盖Dataloader或采样器,但我不知道该怎么做。

最佳答案

我认为解决您的问题的最佳方法是使用单个数据加载器创建一个合并数据集,但有一个自定义 BatchSampler根据合并数据集中的不同数据集生成索引。

关于python - PyTorch:从多个数据集进行批处理,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62637515/

相关文章:

python - 如何用PRAW读取私信?

python - 欧拉问题 #4

Python:第三维中的 Numpy 平铺

python - 在哪里可以找到 PyTorch 的 Tensor.unfold() 用于获取图像补丁的直观解释?

python - BertTokenizer - 当编码和解码序列时出现额外的空格

python - 使用 python 抓取 ajax 页面

pytorch - 简单的 MultiGPU 在推理过程中使用 huggingface

AzureML 实验管道未将 CUDA 与 PyTorch 结合使用

c - 这个 C 代码(来自 lua 库,Torch)是如何编译/工作的?

c++ - CMakeLists.txt :10 (find_package) in C++ 处的 Torch CMake 错误