machine-learning - 使用 sklearn 的 cross_validate 方法的复合估计器, "fit_time"参数包含什么?

标签 machine-learning scikit-learn deep-learning cross-validation

使用 sklearn make_pipeline 实用程序,您可以创建一个复合估计器,就像我在下面所做的那样(clf)。每次调用 cross_validate 方法时,它首先在不用于验证的 kfold 上拟合 minmax 缩放器,然后转换最终的折叠,然后才是模型拟合。

cross_validate 方法返回一个名为“fit_time”的值。此拟合时间是否考虑了最小最大缩放,或者仅训练“模型”(make_pipeline 的第二个参数)。

谢谢。

#The following clf uses minmax scaling
clf = make_pipeline(preprocessing.MinMaxScaler(), model)

results = cross_validate(clf, Data, labels, cv=kfold,return_train_score=True)

最佳答案

基于docs :

fit_time

The time for fitting the estimator on the train set for each cv split.

我想说它只计算估计器,它应该是模型而不是缩放。

但是您可以测试它,如果您在一次测试运行中排除缩放并查看时间是否不同。

关于machine-learning - 使用 sklearn 的 cross_validate 方法的复合估计器, "fit_time"参数包含什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59604642/

相关文章:

machine-learning - scipy.optimize.minimize 如何取损失函数的导数?

apache-spark - K-Means 聚类偏向于一个中心

python - 逻辑回归 - ValueError : classification metrics can't handle a mix of continuous-multi output and binary targets

python - 使用(常量)参数保存/加载 Keras 模型

android - 哈萨克语移动语音识别

machine-learning - 带嵌入层的 DNN 返回正弦波成本/精度

deep-learning - Keras 中的迁移学习 : ValueError: Error when checking target: expected dense_26 to have shape (None, 3) 但得到了形状为 (3000, 1) 的数组

machine-learning - Caffe中的 `lr_policy`是什么?

python - 在 scikit-learn 中的数据集上绘制决策树

python - 如何从 Sklearn 分类报告中返回准确率、召回率和 F1 分数的平均分数?