python - sklearn SelectKBest()中如何给score函数设置参数

标签 python class machine-learning syntax scikit-learn

我在 sklearn 中使用 SelectKBest() 类进行特征选择。 SelectKBest() 可以将可调用的评分函数作为输入。在这种情况下,我想使用 mutual_info_regression 作为评分函数。 mutual_info_regression 可以采用一些我想自己设置的参数。例如,我想设置 random_state = 0。问题是我不确定如何将参数传递给评分函数,因为评分函数本身就是 SelectKBest() 中的一个参数。显然像 SelectKBest(score_func = mutual_info_classif(random_state=0)) 是行不通的,因为 mutal_info_classif 函数会被直接调用。我觉得这可能是关于 python 类的一个非常基本的问题,但我似乎找不到任何解决我正在寻找的问题。在此先感谢您的时间!

最佳答案

您可以创建另一个调用 mutual_info_regression 的函数并将其传递给它:

def my_score(X, y):
    return mutual_info_regression(X, y, random_state=0)

SelectKBest(score_func=my_score)

Python 标准库为创建此类函数提供了一个有用的帮助程序 - 它称为 functools.partial .它允许创建带有一些预设参数的函数;您可以编写代替“手动” my_score 定义

from functools import partial
my_score = partial(mutual_info_regression, random_state=0)
SelectKBest(score_func=my_score)

当然,你也可以直接传递partial,这让你非常接近你的例子:

from functools import partial
SelectKBest(score_func=partial(mutual_info_classif, random_state=0))

关于python - sklearn SelectKBest()中如何给score函数设置参数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44347683/

相关文章:

python - 操作 pandas 中的直方图

python - 将 pandas DataFrame 从函数中提取到全局变量

python初学者: can't init an object from zero

java - 调用 Class.forName() 两次

java - 从对象转换为原始类

python - Tensorflow 中的 Dice/Jaccard 系数优化

python - 对 Pandas 中一行中的每个链接发出 HTTP 请求

python - 如何从谷歌云存储在Python上加载.pickle文件

python - 情感分析/线性回归(Django)

matlab - MATLAB 中的 GMM 对于同一文件给出不同的结果