python线性回归实现

标签 python numpy machine-learning linear-regression

我一直在尝试自己实现一个简单的线性回归算法,但我在梯度下降方面遇到了一些麻烦。

这是我的编码方式:

def gradientDescentVector(data, alpha, iterations):
    a = 0.0
    b = 0.0
    X = data[:,0]
    y = data[:,1]
    m = data.shape[0]
    it = np.ones(shape=(m,2))
    for i in range(iterations):
        predictions = X.dot(a).flatten() + b

        errors_b = (predictions - y)
        errors_a = (predictions - y) * X

        a = a - alpha * (1.0 / m) * errors_a.sum()
        b = b - alpha * (1.0 / m) * errors_b.sum()
    return a, b

现在,我知道这不会很好地扩展更多变量,但我只是先尝试​​使用简单版本,然后从那里跟进。

我正在学习 coursera 机器学习类(class)中的梯度下降算法:

enter image description here

但在大约 90 次迭代后(在特定数据集上)我得到了无穷大的值,到目前为止我还没有完全理解这一点。

在了解 numpy 的广播并获得相同结果之前,我尝试迭代每个值。

如果有人能阐明这里可能存在的问题,那就太好了。

最佳答案

很明显,参数偏离了最佳参数。一个可能的原因可能是您使用了太大的学习率值(“alpha”)。尝试降低学习率。这是一个经验法则。总是从一个小值开始,比如 0.001。然后尝试通过采用比以前高三倍的学习率来提高学习率。如果它给出的 MSE 错误较少(或您使用的任何错误函数),那么它很好。如果不是,请尝试取 0.001 到 0.003 之间的值。接下来,如果后者成立,则递归尝试此操作,直到达到令人满意的 MSE。

关于python线性回归实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39478437/

相关文章:

python - 将 CSV 文件作为数据表导入 numpy,导致形状不正确

python - 在 Python 中从头开始计算雅可比矩阵

python numpy 变异选择

machine-learning - 如何从 tsv 文件训练斯坦福 CRF NER

python - 仅当远程文件比本地副本更新时,如何使用 boto 从 S3 下载文件?

python - Vim:如何安装 UltiSnips 插件?

Python 贝叶斯信念网络分类器

python - 如何使用TRAINS python自动神奇实验管理器手动注册sci-kit模型?

python - 在 RPyC 中如何获取连接到服务器的客户端列表?

python - 使用 SKLearn 中的 GridSearchCV 时出现 JobLibValueError