淘宝逛逛,融合淘宝商品序列 - 逛逛场景内容序列的办法
2022/2/4 23:49:24
本文主要是介绍淘宝逛逛,融合淘宝商品序列 - 逛逛场景内容序列的办法,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
一、难点一
右侧的公式是从底往上看
两个mean-pooling很简单,假设形成64维的向量 Ec1 Ei1,相乘得到Ef1,也是64维向量,这里的vanilla-attention(推荐搜索的冷启动问题_1066196847的博客-CSDN博客)
vanilla-attention的重点是,Query由decoder输出,也就相当于这里的Ef1,K V由encoder输入,从Ec2 Ei2公式中看都是C或者都是I,用C来举例,那么就都是content sequence的每个item,先和Ef1来计算attention-score再作用到自身(相乘)得到加权向量(多半也是64维向量)
最后Ec2 Ei2相乘,再和Ef1相加,得到输出
这篇关于淘宝逛逛,融合淘宝商品序列 - 逛逛场景内容序列的办法的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-06-15matplotlib作图不显示3D图,怎么办?
- 2024-06-1503-Loki 日志监控
- 2024-06-1504-让LLM理解知识 -Prompt
- 2024-06-05做软件测试需要懂代码吗?
- 2024-06-0514-ShardingSphere的分布式主键实现
- 2024-06-03为什么以及如何要进行架构设计权衡?
- 2024-05-31全网首发第二弹!软考2024年5月《软件设计师》真题+解析+答案!(11-20题)
- 2024-05-31全网首发!软考2024年5月《软件设计师》真题+解析+答案!(21-30题)
- 2024-05-30【Java】百万数据excel导出功能如何实现
- 2024-05-30我们小公司,哪像华为一样,用得上IPD(集成产品开发)?