Transformer

2021/10/13 6:16:19

本文主要是介绍Transformer,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

在这里插入图片描述
seq2seq的模型很多,输入一排向量,输出一排向量,可以使用self-attention,rnn,cnn,而transformer使用的就是self-attention

transformer结构

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

  1. residual
  2. norm (Layer Norm)


这篇关于Transformer的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程