python - 使用 reshape 时，“numpy.ndarray”对象没有属性 'values'

标签 python numpy logistic-regression

我正在尝试将数据 reshape 为二维数据结构，以便我可以在 Sklear 中使用它，但我不断收到错误“numpy.ndarray”对象没有属性“值” 当我尝试从 Xtrain.values.reshape(-1, 1) 中删除值时，我收到另一个错误:如果您的数据具有单个特征或数组，请使用 array.reshape(-1, 1) reshape 您的数据。如果包含单个样本，则 reshape(1, -1)。

import pandas as pd 
    import matplotlib.pyplot as plt
    import numpy as np 
    data = pd.read_csv('loan_defaults.csv')
    data = pd.get_dummies(data, drop_first=True)

    data.groupby('default').mean()
    data.corr()

    defaultN = data.query('default == 0')
    defaultY= data.query('default == 1')


    from sklearn.model_selection import train_test_split
    Xtrain, Xtest, ytrain, ytest = train_test_split(data.balance, data.default, random_state = 0)

    Xtrain = Xtrain.values.reshape(-1, 1)
    Xtest  = Xtest.values.reshape(-1, 1)

from sklearn.linear_model import LogisticRegression 
log_reg = LogisticRegression(class_weight="balanced")

log_reg.fit(Xtrain, ytrain)

log_reg.intercept_
log_reg.coef_

log_reg.predict_proba(100)
log_reg.predict(100)

最佳答案

执行train_test_split后不需要添加值，因为输出本身就是一个数组。只需尝试:

Xtrain = Xtrain.reshape(-1,1)
Xtest = Xtest.reshape(-1,1)

关于python - 使用 reshape 时，“numpy.ndarray”对象没有属性 'values'，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58868430/

上一篇：python - Pandas 根据 Id 组合 2 个数据帧

下一篇：python - 使用参数激活(源)python virtualenv 的 Bash 脚本

相关文章：

python - 我可以使用列表来寻址 numpy 数组吗？

python - Sklearn SVM系数属性-如何获取类名？

r - 我如何知道 R 中此逻辑回归输出的优势比的分子使用了哪个概率？

python - 如何使用sklearn的AdaBoostClassifier获取模型的系数(以Logistic回归作为基本估计器)

python - 在 MVC 模式框架中，屏幕抓取模块位于何处？

python - ImageField/FileField Django 表单目前无法修剪文件名的路径

python - 复制并替换 numpy 数组中的值。nans 将为 nan，但其他值将为零

r - GLMER 模型对相同数据为 Fitted.values() 和 Predict() 生成不同的值

python - 按顺序寻找图案

python - python中的 pretty-print json(pythonic方式)