python - 为 caffe 创建多标签 HDF5 文件

我使用以下Python脚本创建了HDF5数据并放置了HDF5数据层。然而，当我尝试使用这些数据训练 caffe 时，它一直在提示

Check failed: num_spatial_axes_ == 2 (0 vs. 2) kernel_h & kernel_w can only be used for 2D convolution

这是我的数据的样子:

数据 (1x3253)、标签 (1x128) 二进制。我将 128 切成 16 个字节，并将其转换为 dec 以将其用作多标签。因此，典型的 key 看起来像 (20, 38, 123, 345,...) 1x16。我有 1,000,000 个数据，如 (1)。现在我只使用第一个字节，因此我将有一个整数作为标签。

    DIR ="/x/"
    h5_fn= os.path.join('/x/h5Data_train.h5')
    from numpy import genfromtxt  

    dim=64000 
    InputData=np.arange(3253)
    data=np.arange(dim*3253)
    data.shape=(dim,3253)

    fileList=[os.path.join(i) for folder, subdir,files in os.walk(DIR) for i in files]
    for i in range(0,len(fileList)):
         InputData=np.genfromtxt(DIR+fileList[i], delimiter=',',skip_header=24)
         data[i]=InputData

    label=np.arange(dim)
    labelData=np.genfromtxt(DIR+'label_file',comments='\t',dtype=None)

    for i in range(0,dim):
        label[i]=int(labelData[i][0:2],16)

    print "Creating HDF5..."

    with h5py.File(h5_fn,'w') as f:
       f['InputData']=data
       f['label']=label

    text_fn=os.path.join('/x/hdf5.txt')
    with open(text_fn,'w') as f:
       f.write('h5_fn')

此脚本创建 HDF5，但我怀疑 caffe 中的错误与我创建 HDF5 文件的方式有关。有人可以告诉我我创建 HDF5 的方式是否有任何问题吗？另外，有没有人可以检查创建的 HDF5 文件是否符合您的要求？谢谢!

最佳答案

问题:

默认情况下，Caffe 期望其数据为 4D:batch_size -by-channel -by-height -by- width。
在你的model您假设每个样本的形状为 1×1×3253，即:您的数据是一维的，仅具有非单一宽度维度。这是一个重要的细节，因为您沿着宽度维度应用卷积。
另一方面，您的 HDF5 数据只是 2D，caffe 将其解释为宽度和高度为 1 的 3253 个 channel 的 dim 示例。
现在您可以理解收到的错误消息:您有一个带有 kernel_width 和 kernel_height 参数的卷积层，但数据(就 caffe 理解而言)具有宽度和高度共 1 个。

解决方案:

您只需 reshape 您的数据:

data.shape=(dim,1,1,3253)

现在 data 每个样本有 1 个 channel ，高度为 1，宽度为 3253。

<小时/>

附注，
您正在向 '/x/hdf5.txt' 写入实际的字符串 'h5_fn'，而不是变量 中存储的字符串h5_fn...

关于python - 为 caffe 创建多标签 HDF5 文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39903197/

python - 为 caffe 创建多标签 HDF5 文件

问题:

解决方案:

上一篇：python - R 中具有自定义距离函数的 knn

下一篇：python-2.7 - 在 Python 上使用 Mxnet 库运行深度学习图像分类示例时出错