人工智能编程:循环神经网络RNN和长短时记忆模型LSTM的分析

2021/12/18 13:19:29

本文主要是介绍人工智能编程:循环神经网络RNN和长短时记忆模型LSTM的分析,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

人工智能编程:循环神经网络RNN和长短时记忆模型LSTM的分析

ht=tαnh(WihXt+bih+whhht-1+bhh)

在pytorch中我们使用nn.RNN()就可以创建出RNN神经网络,它有如下参数:

input_size表示输入xt的特征维度

hidden_size表示输出ht的特征维度,或者理解为隐藏层的神经元数

num_layers表示RNN网络的层数,默认是1层

nonlinearity表示非线性激活函数的选择,默认tanh,当然也可以选择relu

bias表示是否使用偏置,默认是Ture,使用batch_first这个参数是决定网络输入的维度顺序,默认是(seq,batch,feature)输入,seq表示序列长度,batch表示批量,feature表示特征维度,我们也可以将其修改为(batch,seq,feature),只用将这个参数设置为True dropout个参数接受一个0~1的数值,这个dropout层会在除了最后一层之外的其他输出层加上bidirectional默认的False,如果我们要是使用双向循环网络的话,那么我们就可以设置这个参数是True



这篇关于人工智能编程:循环神经网络RNN和长短时记忆模型LSTM的分析的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程