深度学习-序列模型1
2021/10/9 23:43:00
本文主要是介绍深度学习-序列模型1,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
RNN的符号表示,序列样本,序列内部表示,生成y表示,Tx表示输入长度,Ty表示输出长度。
用到的one-hot编码
RNN的动机来源:
1、原始的神经网络,输入输出都是一个固定长度,但是序列是不定长度的,所以有了水平的时间方向的RNN
2、原始的神经网络没有体现出句子中位置的关系
如下图,左边是简单的RNN表示, 右边是常用的论文中的RNN简洁表示
如图,RNN的前向传播模型
简化,Wa矩阵直接拼接两个W矩阵,并且[a,x]是表示纵向拼接,这块以前看论文总是弄不懂。
依据前向传播,画出反向传播的大体方向,以及用到的损失函数和成本函数
RNN的常用框架类型:
1、one-to-one 一般不用
2、one-to-many 音乐生成
3、many-to-many 异步,编码器,解码器,机器翻译
many-to-many 同步,命名实体师表
4、many-to-one 情感分类,影视评价。
EOS表示结束,UNK表示不存在这个词
概率模型看待RNN的序列生成。
这篇关于深度学习-序列模型1的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-27MQ底层原理资料详解:新手入门教程
- 2024-11-27MQ项目开发资料入门教程
- 2024-11-27RocketMQ源码资料详解:新手入门教程
- 2024-11-27本地多文件上传简易教程
- 2024-11-26消息中间件源码剖析教程
- 2024-11-26JAVA语音识别项目资料的收集与应用
- 2024-11-26Java语音识别项目资料:入门级教程与实战指南
- 2024-11-26SpringAI:Java 开发的智能新利器
- 2024-11-26Java云原生资料:新手入门教程与实战指南
- 2024-11-26JAVA云原生资料入门教程