python - 将 Pandas 数据集转换为数组,以便在 Scikit-Learn 中建模

标签 python pandas scikit-learn

我们能否在 Pandas DataFrames 上运行 scikit-learn 模型,或者我们是否需要将 DataFrames 转换为 NumPy 数组?

最佳答案

您可以将 pandas.DataFramesklearn 一起使用,例如:

import pandas as pd
from sklearn.cluster import KMeans

data = [(0.2, 10),
        (0.3, 12),
        (0.24, 14),
        (0.8, 30),
        (0.9, 32),
        (0.85, 33.3),
        (0.91, 31),
        (0.1, 15),
        (-0.23, 45)]

p_df = pd.DataFrame(data)
kmeans = KMeans(init='k-means++', n_clusters=3, n_init=10)
kmeans.fit(p_df)

结果:

>>> kmeans.labels_
array([0, 0, 0, 2, 2, 2, 2, 0, 1], dtype=int32)

关于python - 将 Pandas 数据集转换为数组,以便在 Scikit-Learn 中建模,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22562540/

相关文章:

python - pymssql - 获取格式化的 sql 而不是执行

python - 值错误 : Input 0 is incompatible with layer lstm_14: expected ndim=3, 发现 ndim=2

python - JSON 到 Python 数据框

python - 如何使用 Python 中的 RDFLIB 库从 pandas 数据帧创建知识图

python - n_jobs=-1 的 sklearn Logistic 回归实际上并不并行化

python - 使用 matplotlib 方向错误的 FITS 文件绘制的图像

python - 重命名文件夹中的文件名 - Python

python - 绘制多类的 ROC 但出现错误 'too many indices'

python - 使用 pandas,计算 Cramér 的系数矩阵

python - 如何使用管道和 FeatureUnion 添加功能