多模态 RL 归一套

2026/6/17 · 19:49

图集

量子位报道,腾讯混元开源的新 RL 框架试图打通多个模态:图像扩散、视频生成、VLM 与 LLM 不再各自维护一套训练流程;文章将其概括为庞天宇团队的新作。1
一句话笔记:AIGC 的强化学习正在从碎片化管线,走向更统一的训练底座。

评论