文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式
免费高清在线观看人数在哪“我对他们的主教练(多梅内克-图伦)不太了解,但我知道他的声誉。我非常尊重所有的教练,任何球队走到这一步都不容易,他们有很多有实力的球员,他们赢得了很多比赛,他们也会尽最大努力。”店主吴某在此前媒体采访中呼吁顾客理性消费,不用特意赶过来,还回应称“转让告知已经贴过好几次了,这个时候再搞营销意义何在 ”。免费高清在线观看人数在哪男生的困困到女生困困里视频免费据此前报道,杨瀚森一共单独试训了14支球队,分别是:开拓者、爵士、太阳、雄鹿、魔术、步行者、篮网、凯尔特人、老鹰、森林狼、猛龙、勇士、雷霆、快船。5、6月6日深夜,海航控股发布29条公告,涉及一单重大资产收购。公告显示,海航控股拟以支付现金方式购买海南空港开发产业集团有限公司持有的海南天羽飞行训练有限公司100%股权,交易金额为7.99亿元。公司称本次交易构成重大资产重组,但其不认为构成关联交易。
20250813 🌸 免费高清在线观看人数在哪根据一些谍照和爆料,新的 iX3 将舍弃现款 X3 那种巨大个性的垂直「双肾」格栅,恢复到了类似上世纪 BMW 2000 轿车的小格栅设计,其车身侧面则将和现款 X3 相似,拥有较大倾斜度的挡风玻璃、齐平门把手以及标志性的「霍夫迈斯特弯角」。女人一旦尝到粗硬的心理反应李现扮演的小湖北,是给丈夫大块头放贷的人, 詹周氏在小湖北担保下与他假扮夫妻进入纱厂打工,还遭到了小湖北性骚扰。小湖北 在警察逼问下说自己跟 詹周氏发生过一次关系——这里其实非常恐怖,也就是说 詹周氏遭遇家暴,丈夫沉迷赌博债台高筑,她想自己工作还钱,还被债主强奸一次。
📸 刘泽敏记者 赖小洪 摄
20250813 🔞 免费高清在线观看人数在哪米兰什么时候在一个夏天更换过这么多主力呢?2017年肯定算一次:安德烈亚-孔蒂、博努奇、穆萨基奥、里卡多-罗德里格斯、比格利亚、凯西、恰尔汗奥卢、卡利尼奇、安德烈-席尔瓦,再加上博里尼、何塞-毛里、安东尼奥-多纳鲁马:九名潜在的新主力。2002年夏天也很惊人:内斯塔、西多夫、里瓦尔多、托马森、达里奥-西米奇都来了。由此可见,没有什么是有保障的:一次情况很糟,另一次却非常好,好到甚至夺得了欧冠冠军。那么,让我们展望未来,逐个位置看看候选球员吧。女人被男人进入后的心理变化央视记者 刘旭:在我身后的城市中心的广场上,今天(14日)大概有超过千人在这里举行集会,很多人举着不同的标语。他们对于特朗普政府在过去四个多月来,无论是在经济、关税政策以及边境移民政策等方面都表达了强烈的不满和反对的情绪。
📸 张宁记者 陈晓洁 摄
❤️ 根据京东方面公布的佣金减免政策说明可知,0佣金结算方式包括:京东先按照正常标准收取佣金,月度后返,即每月20日前京东将上一个自然月内享受0佣金政策的订单对应的佣金后返至商家钱包账户。鲁鲁影院免费观看电视剧电影窝窝