热门标签
更多>
Java
(39556)
python
(32336)
mysql
(18517)
int
(18371)
android
(12233)
linux
(11908)
public
(10045)
javascript
(9605)
--
(8450)
C++
(8056)
Redis
(7974)
数据库
(7876)
string
(7726)
算法
(7099)
安装
(6804)
js
(6730)
文件
(6610)
name
(6609)
jQuery
(6507)
php
(6479)
SQL
(6385)
源码
(5933)
new
(5620)
system
(5620)
函数
(5604)
线程
(5432)
print
(5290)
return
(5272)
id
(5083)
spring
(4787)
vue
(4743)
数据
(4565)
前端
(4468)
import
(4409)
root
(4321)
学习
(4284)
数组
(4177)
nginx
(4149)
out
(4101)
c#
(4027)
方法
(3966)
字符串
(3937)
对象
(3873)
https
(3802)
10
(3694)
data
(3678)
println
(3678)
com
(3610)
编程
(3556)
select
(3516)
oracle
(3442)
面试
(3415)
windows
(3408)
docker
(3341)
内存
(3284)
key
(3212)
ios
(3133)
服务器
(3132)
笔记
(3111)
list
(3105)
node
(3104)
代码
(3076)
节点
(3059)
查询
(3056)
元素
(2995)
void
(2835)
变量
(2831)
null
(2817)
include
(2816)
__
(2807)
log
(2713)
server
(2678)
var
(2625)
命令
(2599)
语句
(2564)
html
(2534)
class
(2529)
vue.js
(2481)
程序员
(2469)
索引
(2466)
搜索结果
查询Tags标签: TRL,共有 1条记录-
使用 DDPO 在 TRL 中微调 Stable Diffusion 模型
引言 扩散模型 (如 DALL-E 2、Stable Diffusion) 是一类文生图模型,在生成图像 (尤其是有照片级真实感的图像) 方面取得了广泛成功。然而,这些模型生成的图像可能并不总是符合人类偏好或人类意图。因此出现了对齐问题,即如何确保模型的输出与人类偏好 (如“质感”) 一致…
2023/10/24 1:02:28 人评论 次浏览