我有一个包含 3d 数组和标签(0 或 1)的 2d 列表(Data_set),我想制作包含两个数据集的 h5py 文件,一个用于 3d 数组,另一个用于标签,这是我的代码为此: `
data = []
label = []
for i in range(len(Data_set)):
data.append(Data_set[i][0])# 3d array
label.append(Data_set[i][1])#label
data = np.array(data)
label = np.array(label)
dt = np.dtype('int16')
with h5py.File(output_path+'dataset.h5', 'w') as hf:
hf.create_dataset('data',dtype=dt ,data=data, compression='lzf')
hf.create_dataset('label', dtype=dt, data=label, compression='lzf')
最佳答案
你的标签不是整数,它们是字符串,这是 HDF5 的问题。您的错误消息与由长度为 1 的字符串组成的数组相关。请参阅 Strings in HDF5了解更多详情。
您可以在构造 NumPy 数组之前或之后转换为整数,以下是几个示例:
label = np.array(label).astype(int)
# or, label = np.array(list(map(int, label)))
或者,由于您的值为 0
或 1
,因此选择 bool
可能会更有效:
label = np.array(label).astype(int).astype(bool)
另外,考虑将元数据保存为 attributes .
关于python - 没有 dtype ('<U1' 的转换路径)问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51578212/