目录
老饼讲解:一步一步上手学习

【初识】机器学习-是个什么东西

作者 : 老饼 发表日期 : 2025-11-14 22:19:27 更新日期 : 2026-05-18 13:41:05
老饼讲解-简单易懂,干货满满,爽过嗦螺!


学机器学习啦,学机器学习啦~!欢迎大家来学习机器学习!在正式学习机器学习之前,我们先来随便聊聊机器学习是什么,好让上手之前有个初步的印象,知道它大概是个什么东东,好了,让我们开始吧!

一、机器学习是什么

其实机器学习呢,可以简单地认为,就是有一些输入x,然后我们用一个数学模型,来预测x对应的y。

机器学习是什么

这样说可能有些抽象,那么实际点,就是输入天气相关的变量,例如湿度啦、温度啦之类的,然后输出今天的风级。那么机器学习要怎么干呢,就是选用一个模型(对,一般不是构造一个模型,而是选用一些知名、已有的模型),然后去采集一些数据回来,进一步训练模型中的参数,使得在模型中输入x的时候,尽量准确的输出y:

 机器学习的模型

而搞机器学习呢,就要学会一些常用的模型,然后训练前把数据处理好,再丢到模型中训练,最后验证模型的效果,在确定模型训练好之后,就可以把它投到实际中去使用了。

  • 机器学习杂七杂八的问题

虽然机器学习看起来很纯粹,但当它应用到各个领域中去,内容就变得庞大了,例如训练时不需要y,那就称为"无监督学习",需要y,就称为"有监督学习",如果数据是时间序列,那就是"时序模型",等等等等,刚开始把机器学习理解为"从数据中学习规则、进行新的预测"就好了,而其余衍生的问题与内容,很零零散散,例如还会解决聚类问题啦、降维问题啦,等等等等,刚开始时知道核心问题,在慢慢的接触中,就会了解它整个生态了。

二、现在的机器学习是什么

机器学习是什么?每个时期都有不同的看法,下面我们就随便地、不严谨地唠一唠。

  • 机器学习的崛起

数学模型当然是历史以来就有的东西,但比较特殊的是,在有了计算机后,大家就开始想着往人工智能发展了,仿生模型、算法就开始发展了,但是搞来搞去,智能算法没有太大成果,所以退而求其次,就不管“是不是仿生”了,只要能解决问题就行了,这时就退化成"机器学习"了,也就是不要求"生物原理",只要能解决"预测"一类的局部问题就行了,当成"机器"来使用就行了,就这样,机器学习就横行起来了,但是呢,始终是这波人在玩、同时也继承了许多前期搞智能算法的成果,所以大家看到的一些机器学习老书籍,往往是把历史以来的数学模型+前期的智能算法+机器学习算法混在一起,都圈到机器学习领域中来了。

从1990-2010年这段时间,机器学习逐渐横行,所以在这段时间里,只要是模型、算法之类,都可以圈到机器学习中来,即使"神经网络"一类的算法严格意义来说并不算机器学习,但在这个时期,在大家的认知中它就属于机器学习。

所以,如果是2010年前接触机器学习,整体的感觉是,AI发展不足,后来被机器学习逐步鲸吞天下了。
  • 机器学习的转折

好了,上面说到机器学习横行,在名义上似乎要把一切算法都揽到它的旗下。

然而,转折来了,2012年卷积神经网络的提出,在图像识别上取得了极大效果,自此以它为起点的一系列算法举起"深度学习"的名号,自成一帜,就不再认它属于机器学习了,接下来Alpha Go在围棋的成就,也不肯认它属于机器学习,其实Alpha Go并不仿生,本质更应属于机器学习,但毕竟打着AI的噱头更具吸引力,自然不愿将自己归属到机器学习。此外,处理文本的(NLP)、自动驾驶的这些专业领域,虽然干着算法的事、但也自成一方小天地。

现在的机器学习

可以想象,优秀出彩的,都划分出去自成一家啦,那渐渐的剩下给机器学习的就越来越少了。我们现在也不必过分泾渭分明的去区分哪些是机器学习的内容,实际一点,那就是剔除了所有专有领域(NLP、深度学习、神经网络等等)之外、剩下的内容,就当成是机器学习好了。

所以,如果是2010年开始接触机器学习,那整体的感觉就是:机器学习是祖宗,但诞生了许多独立分枝。
  • 现在的机器学习

最后,我们站在现在的角度再来看看机器学习。

现在的机器学习,往往是指一些机器学习中的传统老方法,和一些还没自成一体的新技术。而它们解决的问题,往往面向的数据都是“变量一个一个的、数据一条一条",被戏称为"表格数据":

什么是表格数据

所以,如果是现在接触机器学习,按通俗理解,它就是一些解决"表格数据"问题的模型,再加上一些历史遗留的算法和方法。而像文本、图片这些非表格结构的数据,就交给NLP、深度学习等等了。
  • 现在的机器学习-要学什么

如果现在接触机器学习,那么它基本就充当着两个角色:一个是解决表格数据问题,另一方面则可以当成其它算法领域的基础。现在学习基础,就奔着这两个目的来选择性学习内容就好了,不太建议把一些已经独立出去的内容再揉在机器学习里一起学,而是需要学时再专业、系统地去学。

如果现在找一本2015年前的机器学习书籍去学,就会发现里面又讲神经网络、又讲NLP、又讲机器学习,那时的算法内容少,这样学是没问题的,现在各个领域的内容经过长期发展,都已经很庞大、很专业了,再这样就不太可行了,现在每个领域都比较专业,浅学不如不学,学了也还是门外汉中的门外汉。

结束语

在这里就胡言乱语的跟大家扯一下,只是想给新同学一些关于机器学习的初步印象,事实上在我自己学习时,已经很疲惫和厌倦那种"严谨定义式"的空洞介绍类型的教材方式了,所以在这里我也就不严谨地跟大家乱扯一下,图个轻松和乐子、各人有各人的印象和理解就好,说错了大家不要跟我较真就行。



图标 评论
添加评论