MMOE 论文阅读
2021/8/31 6:08:08
本文主要是介绍MMOE 论文阅读,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
MMOE 简介
MMOE 是一个 multitask 模型
multitask 主要有以下有点:
1. 把几个任务合为一个模型,相比于每个任务各训练一个模型来说,可以节省资源
2. 由于几个任务共享了数据,对于相关性比较大的任务来说,可以使数据学的更充分
multitask 也存在以下几个问题:
1. 对于几个任务共享的参数,不同任务在训练时可能会有冲突,导致参数学不好
2. 模型的迭代变得更复杂了
MMOE 模型和另外两个 MultiTask 模型对比
图 a
图a中的模型是最常用也是最基础的模型,这个模型不同任务共享底层的tower,然后每个任务各自学习一个上层的tower
优缺点分析:
由于多个任务共享底层的tower,可以使底层的信息学习的非常充分,同样的,如歌不同任务间相关性不强,在学习过程中可以发生参数冲突(即同个特征在不同任务中可能是相反的作用)
图 b
为了底层的共享网络对不同任务也能做到个性化,图 b 中的共享网络由多个专家网络组成,并用了一个gate模型去学习不同专家网络的权重,最后每个任务是不同专家网络的加权和
优缺点分析:
优点就是底层共享网络由多个专家网络组成,增加了底层网络的个性化,可以减少参数参数冲突
图 c
图 C 中的网络就是论文提出的 MMOE 网络,和图b中的网络对比,每个任务学了单独的gate
优缺点分析:
优点就是对共享的底部网络增加了个性化,对于相关性比较差的任务也能表现的很好
缺点就是增加了模型的复杂度,而且每个任务都学了一个gate网络,最优解非常多,难以学好
这篇关于MMOE 论文阅读的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2025-01-12百万架构师第十五课:源码分析:Spring 源码分析:SpringMVC核心原理及源码分析|JavaGuide
- 2025-01-11有哪些好用的家政团队管理工具?
- 2025-01-11营销人必看的GTM五个指标
- 2025-01-11办公软件在直播电商前期筹划中的应用与推荐
- 2025-01-11提升组织效率:上级管理者如何优化跨部门任务分配
- 2025-01-11酒店精细化运营背后的协同工具支持
- 2025-01-11跨境电商选品全攻略:工具使用、市场数据与选品策略
- 2025-01-11数据驱动酒店管理:在线工具的核心价值解析
- 2025-01-11cursor试用出现:Too many free trial accounts used on this machine 的解决方法
- 2025-01-11百万架构师第十四课:源码分析:Spring 源码分析:深入分析IOC那些鲜为人知的细节|JavaGuide