老饼讲解:一步一步上手学习
相信大家都非常想知道,如果要学机器学习,要学哪些内容,这里就列举一些需要学的内容,并跟大家讲讲这些内容分别是些什么,以及哪些是重点。
机器学习发展了许多年,现在的机器学习,已经不能像以前一些老书中所说的那样去学了,以前的模型差不多是有限的,努力一点就能把知名模型给学完了,但现在的模型已经多到像海一样,已经不是一个人努力一下下就能学完的,所以现在只能选择性进行学习,知道需要学什么就非常重要了。
在这里,我们先来看看有什么内容,然后再给出我的建议,大家再根据自己的情况来选择性学习。
在说机器学习的内容时,我们先来简单看看机器学习这一领域是如何发展的。

首先,自古以来就有数学模型了(例如最经典的线性回归模型,就由来已久了)。然后,1960-1990这段时间,计算机又带来了一波仿生算法潮(例如神经网络一类的模型)。接下来,1990-2010这段时间,就是面向数据、面向效果而诞生的相关机器学习算法了,并从中衍生出NLP、推荐系统等专业领域。最后,就是现在的新生AI领域了,它先有深度学习,然后进一步演化出了大模型(例如Chat GPT)。
现在,机器学习(machine learning)、深度学习(Deep learning)、大模型(LLM),就是三大巨头了。
首先,大家要知道,如果要学完机器学习所有的内容,那是不可能的,所以我们所说的,要学的内容,指的是"一般搞机器学习的人"都会哪些内容。机器学习的核心内容,就是算法与模型,围绕算法与模型来展开学习就可以了。常见的模型和算法如下:
回归模型:线性回归、岭回归、Lasso回归等等。
分类模型:逻辑回归、决策树、SVM、集成算法(随机森林、Adaboost、GBDT、Xgboost)等等。
降维算法:PCA主成份分析、线性判别LDA、因子分析FA、独立成份分析ICA等等。
神经网络:感知机、BP神经网络、RBF神经网络、LVQ神经网络、SOM神经网络等等。
其它算法:KNN、K-means、朴素贝叶斯、隐马可夫链HMM、Apriori算法等等。
训练算法:梯度下降、牛顿法、拟牛顿法、动量下降法、随机梯度下降法等等。
当然,这只是常见的内容,更进一步地,随着历史的发展,许多算法现在渐渐划分出去了。例如,在机器学习刚崛起时,就喜欢把神经网络圈进来,在NLP、推荐系统还不够专业时,就喜欢把HMM算法、Apriori算法等等圈进来,而现在其实已经可以把这些剔出去了,此外,大家可能还听到许多CNN、RNN、DBN什么之类的模型,这些模型从诞生开始,基本就很快划分到深度学习中去了,这里就不再列到机器学习中去了。
好了,除了模型和算法,还有一些是理论和实践中的通用概念和常识,例如模型的评估、数据的清洗等等。
一些常见的概念常识:过拟合、正则化、数据清洗、AUC、KS等等。
这里也不列那么多概念了,因为这些概念一般并不需要特地系统地去学,在实践过程中自然慢慢就会积累了。
事实上,我们上面虽然列了许多的内容,但学习时也是有轻重之分的,越是基础的模型,我们可以理解更深入一些,像线性回归、逻辑回归、决策树、K-means、PCA、梯度下降这些,基本都是要掌握的。而其它的模型,可以先简单了解,在我们真正进入一个行业后,再在实践中深入,因为在特定行业中,往往都只用两、三个模型就差不多够了,所以并不需要每个模型在一开始都学得非常深入。
评论