目录
老饼讲解:一步一步上手学习

【入门】机器学习-入门例子解说

作者 : 老饼 发表日期 : 2025-11-15 15:20:50 更新日期 : 2026-05-21 13:40:09
老饼讲解-简单易懂,干货满满,爽过嗦螺!


开门见山!这节我们通过一个简单的例子,来尽可能简单、又尽可能核心地了解,机器学习是个什么东西,大概是怎么一回事,闲话少说,空谈误国,让我们赶紧开始吧!

一、机器学习-入门例子

机器学习嘛,它的主要任务是就是进行预测,例如我们有一组年龄与身高的数据,我们希望通过年龄预测身高:

 样本数据          

好了,下面我们就围绕这个简单的问题,来看看机器学习是怎么样去解决这个问题的。

step-1:数据探索

在机器学习建立模型之前,首先要了解一下数据的特性,也被称为数据探索(EDA,Exploratory Data Analysis),那么,对于上面的数据,我们只需把x,y画出来就可以非常清晰数据大概是什么样的啦,如下:

 数据在二维平面上的展示

从图中我们就可以发现,身高和年龄有着非常强烈的线性关系。所以呢,数据探索,可以帮我们了解数据的特性,让我们知道手中的数据大概是些什么数据。

上面的问题非常简单,我们直接画个图就一目了然啦,都不需要那么多胡里花哨,但在实际问题中,数据的变量个数、样本个数都非常多,那就没这么简单啦,这时一般会借助自己对数据本身的了解,然后再对数据进行一些统计之类等等,来了解数据,直到知道手上的数据是些什么。

EDA说复杂也复杂,说简单也简单,例如,我自己亲手做实验采集得来的一些数据,难道我自己还不知道它们是些什么东西吗?这时可能就不做EDA啦,别问为什么不做,问就是懒。

step-2:选择模型

好了,上面我们已经知道身高与年龄有强烈的线性关系,那就好办啦,这时我们可以假设它们的关系是线性关系,也就是之间的关系是,所以呢,我们就选择线性模型进行建模,如下:

通过一条直线拟合数据点

如图所示,线性模型,也就是代表用一条直线(或平面、超平面)来拟合样本数据点。

所以对数据的理解就非常重要呀,你知道得越多,就越容易选择更适当的模型,当然,在一无所知的情况,也仍然是会有办法的,不用担心,慢慢混下去就知道了,一切总有解决办法的。

Step-3:模型损失

上面我们已经选择了模型了,但模型中还有些参数还需要进一步确定。例如我们上面的模型是,而其中的参数呢,还需要进一步确定。那么怎么确定要取什么值呢,很简单,我们就是希望能令模型预测的结果与实际结果越接近越好。

什么叫做越接近越好呢,用所有预测样本的均方误差(MSE)来作为误差的衡量指标就可以啦,也就是:

这个用于引导我们求解的函数E,就是我们模型的损失函数。为什么称为损失函数,而不是误差函数呢,因为并不是所有模型的目的都是误差最小化,所以统一称为损失函数,而不是误差函数。

Step-4:模型求解

好了,通过求取令E最小时的[w,b],就能确定最适合我们用来拟合数据点的直线,实际就是求w,b取何值时,能令E 最小的数学问题。如下,令E的偏导数(即分别对w,b求导,多元函数称为偏导,用   符号表示)都为0,即可联立解得令E最小的w,b:

两个线性方程 ,两个未知数,联立求解就可以得到w,b了。

在这个例子里,可以直接就能求到最优解了,但是对于大部分模型,并不能通过数学来求到最优解,而是只能依靠一些优化算法来求解,这个"用优化算法来求解"的过程就称为训练。

好了,到了这里,我们的模型就构建成功了,也就是用一个最佳地去拟合了我们的样本点,当来了新的x时,我们就用这个模型去预测就可以了。

Step-5:模型评估

在求出模型中的参数w,b后,也就是得到了最终的模型之后,我们还需要评估模型的效果,

机器学习中,一般用模型评估指标(函数)来评估模型的效果,模型评估函数用于衡量模型投入使用时的价值(或者损失),这个机器学习例子中,我们可以仍然可以使用误差平方和来作为我们最终对模型质量的评估:

模型评估指标与损失函数的异同:

模型评估指标与损失函数都一样用于评估模型的质量,但损失函数是面向求解的,而模型评估指标则面向最后的评估,初听可能觉得两者一样,其实不一样,因为损失函数是面向求解的,要求虑到求解的难度等问题,而模型评估指标则可以更灵活,只需考虑如何评估模型在业务中的效果更为合理就可以。


二、机器学习-入门总结

好了,上面说了这么多,下面我们打铁趁热,赶紧来总结的梳理一下。

 机器学习是怎么一回事       

首先呢,就是要探索一下数据,这就称为EDA,在了解数据之后,就要选择一个合适的模型,有各种各样的模型,了解越多模型,自然可以选择的模型也就越多,然后模型里带有参数,这就需要一个损失函数来指出我们希望得到一个什么样的参数,一般损失函数跟模型是配套的,每个模型都有自己固定的损失函数,之后再根据损失函数训练模型里的参数就可以了,模型训练好后,再根据实际情况设定一个指标去评估模型的效果就可以了。

好了,恭喜我们获得一些名词:EDA,模型,损失函数,模型训练,评估指标。

总结

这节我们简单地通过一个例子看了一下机器学习到底是怎么回事,其实就是用模型来做预测,而为什么叫机器学习呢,其实可以感受到,就是用数据来训练模型,让模型调整参数来学习数据里的规则,所以就叫机器学习了,就这样随便理解一下吧,哈哈哈。



图标 评论
添加评论