EN
www.zqysoft.com

17c.com.gov.cn清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

17c.com.gov.cn
17c.com.gov.cn据英媒GMS最新消息,纽卡斯尔联正计划对RB莱比锡展开挖角行动,哈维-西蒙斯和安东尼奥-努萨已经进入了主教练埃迪-豪的引援视野。他希望在圣詹姆斯公园的阵容中增加实力,为即将到来的包括欧冠赛事在内的新赛季做好准备。巴萨拟于周五以续约式简约流程亮相,不设新闻发布会,仅在主席拉波尔塔办公室举行私人签约仪式后,接受俱乐部官方媒体简短采访。这延续了近期球员加盟的标准化操作模式。17c.com.gov.cn女人一旦尝到粗硬的心理反应在肖雨理解中,乡镇学校的学生很多家长在外打工,如果让孩子放开了使用AI,在家庭里,孩子们缺少家长的指导,面对AI像打开了潘多拉魔盒,写的作文会和AI越来越像,甚至完全依赖AI写作。虽然当年看《新还珠》时候,小燕子人设不好快变成了媒婆,五阿哥也变成了苦逼之王,再加上台词雷人、场景廉价,怎么看都有一种PDD的感觉,但好歹故事还在一个世界观中。
20250814 💥 17c.com.gov.cn但不多时,郑媛却刷到另一名博主揭露用“AI生成人”起号的内容,被打假的恰恰是她先前所关注的这个账号。“我仔细翻阅了那个女生的账号主页,她并未标明使用AI技术,还在评论区亲切地与其他用户互动。”面对这样的局面,郑媛说自己也“糊涂了”。她后来观察了一个多星期,找到了该账号图片确为AI生成的证据——有网友在其他账号上发现了妆容和衣着几乎一样的“数字人”,而人物介绍却完全不同。少女国产免费观看高清电视剧大全本赛季,萨巴伦卡多次闯入决赛,有输有赢,尤其澳网、法网连续无缘冠军,也让这位世界第一非常无奈。进入草地赛季之后,萨巴伦卡为了备战温网,报名参加柏林站进行热身,作为头号种子上一轮横扫淘汰马萨洛娃,顺利晋级八强。
17c.com.gov.cn
📸 李富强记者 李晴 摄
20250814 👅 17c.com.gov.cn来自瓦伦西亚的哈维-格拉也仍然是米兰中场位置的首要引援目标之一,这位2003年出生的球员受到了技术团队各方的青睐,从体育总监塔雷、技术总监蒙卡达到主教练阿莱格里都很欣赏他。国产少女免费观看电视剧字幕比如普遍缺少光机和微显示屏,导致无法提供最基础的文字与画面信息交互,而搭载显示方案的产品,价格与续航又普遍存在较大问题。
17c.com.gov.cn
📸 翟海峰记者 程岩峰 摄
🥵 本月,宇树科技完成了C轮融资,由中国移动旗下基金、腾讯、锦秋、阿里、蚂蚁和吉利资本共同领投,募资规模约7亿元人民币。融资后,宇树科技的估值达到了约120亿元人民币。欧美大妈logo大全及价格图性欧美
扫一扫在手机打开当前页