深度学习-序列模型1

2021/10/9 23:43:00

编程Tag： 深度模型长度序列 many 神经网络表示 RNN

本文主要是介绍深度学习-序列模型1，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

RNN的符号表示，序列样本，序列内部表示，生成y表示，Tx表示输入长度，Ty表示输出长度。

用到的one-hot编码

RNN的动机来源：
1、原始的神经网络，输入输出都是一个固定长度，但是序列是不定长度的，所以有了水平的时间方向的RNN

2、原始的神经网络没有体现出句子中位置的关系

如下图，左边是简单的RNN表示，　右边是常用的论文中的RNN简洁表示

如图，RNN的前向传播模型

简化，Wａ矩阵直接拼接两个W矩阵，并且［ａ，ｘ］是表示纵向拼接，这块以前看论文总是弄不懂。

依据前向传播，画出反向传播的大体方向，以及用到的损失函数和成本函数

RNN的常用框架类型：
1、one-to-one 一般不用

2、one-to-many 音乐生成

3、many-to-many 异步，编码器，解码器，机器翻译

many-to-many 同步，命名实体师表

4、many-to-one 情感分类，影视评价。

EOS表示结束，UNK表示不存在这个词

概率模型看待RNN的序列生成。

这篇关于深度学习-序列模型1的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！