老饼讲解:一步一步上手深度学习
终于来到RNN循环神经网络了呀!,在学RNN前,我们先来随便的聊一聊吧,就真的随便聊一聊。
我们都知道,RNN和CNN就是深度学习的两把领头刷子,但是,RNN的内容其实要比CNN相对要少很多,而真正让RNN发迹的、其实是Transfomer,但这块内容我们独立划分为一块了,所以经典的RNN内容并没有多少。
较常见的RNN模型只有几个:基础RNN、LSTM、GRU、BiRNN、DRNN,只需要一口气把它们学完就行了。

好了,下面我们就来简单地来看看这些经典的RNN模型分别是什么。
基础RNN是由Elman提出的,最初称为Elman神经网络,但是后来大家都以它为基础进行拓展,所以一般都直接称它为RNN。
LSTM呢,则是解决基础RNN中,无法长期记忆、只有短期记忆的问题,所以它把基础RNN的神经元,改成了细胞,使它也能记得长期内容,因此就称为长短期记忆循环神经网络。至于什么是长期、短期记忆,学到的时候就知道了。
LSTM呢,虽然能够长短期记忆,但是相对比较复杂一些,所以后来又有了GRU神经网络,它引入门控单元来实现长短期记忆功能,也就是说它解决的问题与LSTM是一样的,但由于GRU相对更简洁一些,所以往往大家更偏向使用GRU了。
BiRNN其实就是把普通RNN弄成正反向同时预测,使得在对t时刻的输出进行预测时,既能通过正向RNN获得t时刻之前的信息,也能通过反向RNN获得t时刻之后的信息,也就是可以同时利用所有时刻的信息。
顾名思议,DRNN就是深层RNN,它只是把普通RNN中的单隐层变成多隐层,就叫DRNN了,很简单,看一眼就知道了,实现时也只是在其它的RNN上多设一个参数而已,非常简单。
好了,除了学RNN的模型,还需要学习RNN相关的应用,例如面对不同问题时,分别采用不同的1vn,nv1,nvm结构形式,以及一些具体问题的策略,例如倒序预测、延迟输出策略等等,这些与其说是知识内容,不如说是RNN在实践应用时的一些经验与常识,只需要了解、并在实践中熟悉就可以了。
总的来说,RNN并没有多少内容,但它又是必学的,它是学习Transfomer的前提,而Transfomer又是LLM的前提,所以简单快速的过完RNN的内容就可以了,把它作为一种过渡内容来对待就好了,不建议投入太多的时间,当然,如果是要用LSTM这些经典RNN模型来做项目的,那又另当别论了。
评论