有些任务可以通过MLP多层感知器的神经网络,CNN卷积神经网络解决,因为那些任务内部的每一个前后无关联,无顺序,如MNIST手写数字子集,CIFAR子集等. 但是在自然语言处理中,每个字的前后有语义联系,或者在视频图像处理,或者在气象观测数据,股票交易数据方面,有前后的关联性,那么使用RNN网络,或者LSTM模型. RNN模型的原理: 神经元的输出接入输入,使网络具有记忆功能.Xt输入,Ht输出,三条箭头的参数U,V,W是神经网络的参数,A是隐藏状态,代表记忆功能. 在时间上将该模型展开后如下:…