python - 有没有keras方法来拆分数据?

标签 python machine-learning scikit-learn keras

我认为标题是不言自明的,但要详细询问,有 sklearn 的方法 train_test_split() 其工作方式如下:X_train, X_test, Y_train, Y_test = train_test_split(X, Y , test_size = 0.3, stratify = Y) 这意味着:该方法将以 0.3 : 0.7 的比例拆分数据,并尝试使两个数据中的标签百分比相等。有与此等效的 keras 吗?

最佳答案

现在正在使用 keras 数据集类。我正在运行 keras-2.2.4-tf 以及新的 tensorflow 版本。

基本上,使用类似tf.data.Dataset.from_tensor_slices 的方式将所有数据加载到数据集中。然后将数据拆分为新的数据集以进行训练和验证。例如,打乱数据集中的所有记录。然后使用除前 400 个以外的所有作为训练,使用前 400 个作为验证。

ds = ds_in.shuffle(buffer_size=rec_count)
ds_train = ds.skip(400)
ds_validate = ds.take(400)

Dataset 类的实例是为 Keras 模型传递的天然容器。我从 tensorflow 或 keras 训练示例中复制了这个概念,但似乎无法再次找到它。

使用 load_data 方法创建的固定数据集创建了 numpy.ndarray 类,因此它们有点不同,但可以轻松转换为 keras 数据集。我怀疑这还没有完成,因为太多现有代码会被破坏。

关于python - 有没有keras方法来拆分数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48566821/

相关文章:

python - 有效地将numpy数组写入二进制文件

python - 在多列数据上拟合 MultinomialNB

python - 计算包含两个较小圆的最小圆的圆心和半径

Python:ValueError: 形状 (3,) 和 (118,1) 未对齐:3 (dim 0) != 118 (dim 0)

machine-learning - 网页推荐系统

python - 我的二元分类模型的准确性似乎卡住了 : Where did i go wrong?

python - 如何在预测后取消缩放数据?

python-3.x - Python-ML :confusion_matrix from sklrearn

python - 如何将 python 代码与 SWAT 分水岭模型结合起来

python - 使用 Python 生成 k-NN 中二元分类的数据集