【原理】岭回归(Ridge)-基本原理

作者 : 老饼发表日期 : 2026-01-07 08:14:16 更新日期 : 2026-05-21 21:59:22

老饼讲解-简单易懂，干货满满，爽过嗦螺！

岭回归属于线性回归模型的改进，它在线性回归的MSE损失函数中加入了L2正则项，本文展示岭回归的模型公式与损失函数，以及它的求解公式的详细推导过程，通过本文，可以了解岭回归模型是什么，它与线性回归的区别，以及模型的求解公式。

一、岭回归-模型介绍

岭回归模型(Ridge Regression)是线性回归的一种改进，主要是线性回归求得的系数可能会过大，因此，岭回归在线性回归模型的MSE损失函数中加入二范正则项，以惩罚过大的系数。

岭回归模型表达式的矩阵形式如下：

岭回归损失函数的矩阵形式如下：

其中 是正则项的惩罚系数，代表参数W的惩罚力度。

值得注意的是，原始的岭回归模型是没有阈值的，这是因为阈值b并不需要惩罚。

岭回归可采用数据中心化的方法，来拓展为带阈值的线性模型，它先将数中心移到原点，此时，中心化后的数据适用于无阈值模型，即可先算出中心化数据的无阈值岭回归模型的W，再反推出未中心化时的数据的阈值b。

具体如下：

1. 先将数据作中心化转换：

此时，都是以(0,0)为中心的数据

2. 用训练岭回归模型，得到

3. 训练后再计算阈值b：

即可得到

公式推导详细可参考：《岭回归-阈值公式》

下面再来看看岭回归模型的求解公式和推导过程。

岭回归的模型求解公式如下：

它与线性回归的求解公式相似，只是部分需要在对角元素上加上

只要令岭回归的损失函数L对W的各个偏导数为0，然后对其求解就可求得令L最小化的W，岭回归求解公式推导过程如下：

一、将L(W) 对 W求导

二、令导为0 ，即可解得 W

我们不妨看下sklearn中岭回归求解的核心实现代码：

sklearn岭回归求解的核心源码

从源码可以看到，W的求解就是计算公式

岭回归模型的关键内容可以总结为4点：

【1】它就是一个线性模型。

【2】它的损失函数加入了L2正则项。

【3】它原始模型是不带阈值的，需要先中心化，再反推出阈值。

【4】它的求解只需要用公式就能得到。

好了，以上就是岭回归模型的基本原理与求解方法了~

上一篇: 【附件】最小二乘法-公式与推导

下一篇: 【流程】岭回归(Ridge)-算法流程

添加评论