【前言】RNN循环神经网络-学习内容

作者 : 老饼发表日期 : 2025-10-05 22:39:05 更新日期 : 2026-05-19 16:06:05

老饼讲解-简单易懂，干货满满，爽过嗦螺！

终于来到RNN循环神经网络了呀！，在学RNN前，我们先来随便的聊一聊吧，就真的随便聊一聊。

一、RNN要学什么

我们都知道，RNN和CNN就是深度学习的两把领头刷子，但是，RNN的内容其实要比CNN相对要少很多，而真正让RNN发迹的、其实是Transfomer，但这块内容我们独立划分为一块了，所以经典的RNN内容并没有多少。

较常见的RNN模型只有几个：基础RNN、LSTM、GRU、BiRNN、DRNN，只需要一口气把它们学完就行了。

RNN-经典模型

好了，下面我们就来简单地来看看这些经典的RNN模型分别是什么。

基础RNN是由Elman提出的，最初称为Elman神经网络，但是后来大家都以它为基础进行拓展，所以一般都直接称它为RNN。

LSTM呢，则是解决基础RNN中，无法长期记忆、只有短期记忆的问题，所以它把基础RNN的神经元，改成了细胞，使它也能记得长期内容，因此就称为长短期记忆循环神经网络。至于什么是长期、短期记忆，学到的时候就知道了。

LSTM呢，虽然能够长短期记忆，但是相对比较复杂一些，所以后来又有了GRU神经网络，它引入门控单元来实现长短期记忆功能，也就是说它解决的问题与LSTM是一样的，但由于GRU相对更简洁一些，所以往往大家更偏向使用GRU了。

BiRNN其实就是把普通RNN弄成正反向同时预测，使得在对t时刻的输出进行预测时，既能通过正向RNN获得t时刻之前的信息，也能通过反向RNN获得t时刻之后的信息，也就是可以同时利用所有时刻的信息。

顾名思议，DRNN就是深层RNN，它只是把普通RNN中的单隐层变成多隐层，就叫DRNN了，很简单，看一眼就知道了，实现时也只是在其它的RNN上多设一个参数而已，非常简单。

好了，除了学RNN的模型，还需要学习RNN相关的应用，例如面对不同问题时，分别采用不同的1vn，nv1,nvm结构形式，以及一些具体问题的策略，例如倒序预测、延迟输出策略等等，这些与其说是知识内容，不如说是RNN在实践应用时的一些经验与常识，只需要了解、并在实践中熟悉就可以了。

总的来说，RNN并没有多少内容，但它又是必学的，它是学习Transfomer的前提，而Transfomer又是LLM的前提，所以简单快速的过完RNN的内容就可以了，把它作为一种过渡内容来对待就好了，不建议投入太多的时间，当然，如果是要用LSTM这些经典RNN模型来做项目的，那又另当别论了。

下一篇: 【模型】RNN循环神经网络-快速上手

添加评论