我想编写一个函数,根据提供的 bin 概率 从训练集中随机挑选元素。我将集合索引分成 11 个 bin,然后为它们创建自定义概率。
bin_probs = [0.5, 0.3, 0.15, 0.04, 0.0025, 0.0025, 0.001, 0.001, 0.001, 0.001, 0.001]
X_train = list(range(2000000))
train_probs = bin_probs * int(len(X_train) / len(bin_probs)) # extend probabilities across bin elements
train_probs.extend([0.001]*(len(X_train) - len(train_probs))) # a small fix to match number of elements
train_probs = train_probs/np.sum(train_probs) # normalize
indices = np.random.choice(range(len(X_train)), replace=False, size=50000, p=train_probs)
out_images = X_train[indices.astype(int)] # this is where I get the error
我收到以下错误:
TypeError: only integer scalar arrays can be converted to a scalar index with 1D numpy indices array
我觉得这很奇怪,因为我已经检查了我创建的索引数组。它是一维,是整数,并且是标量。
我错过了什么?
注意:我试图通过 astype(int)
传递 indices
。同样的错误。
最佳答案
也许错误消息有些误导,但要点是 X_train
是一个列表,而不是一个 numpy 数组。您不能对其使用数组索引。先做一个数组:
out_images = np.array(X_train)[indices.astype(int)]
关于python - 类型错误 : only integer scalar arrays can be converted to a scalar index with 1D numpy indices array,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50997928/