EN
www.zqysoft.com

成都私人情侣免费看电视剧的软件清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

成都私人情侣免费看电视剧的软件
成都私人情侣免费看电视剧的软件“大家好,我是来自埃斯顿酷卓科技的人形机器人CODROID 02,很高兴能与大家见面。”大会现场,一个身高170cm、体重70kg的人形机器人走上台,担任新品首发环节的主持人。从配置来看,新车提供了包括卡其棕和青城绿在内的五种车漆选择,并在高配车型上加入黑光包装饰,满足不同个性需求。数字大灯的动态光效支持多种切换,每一次解锁都将上演小型光影秀;而OLED尾灯的交互警示功能,则能在安全方面为出行增添一层护航。超长轴距带来的宽敞后排空间,加之可放倒的座椅组合,让日常出行与短途载物都处于舒适状态。成都私人情侣免费看电视剧的软件成都私人情侣免费看电视剧的软件进入20世纪,现代科学的星光在莫大闪耀。萨哈罗夫17岁进入物理系,早早展现理论物理的才华。1948年起,他参与氢弹研发,提出“千层饼”设计,成为苏联氢弹成功的关键。谢苗诺夫曾任化学动力学教研室主任,他提出的“链式分支反应”理论,有力解释了燃烧与爆炸的差异。1956年,他成为苏联首位诺贝尔化学奖得主。诺维科夫1955年考入数学力学系,专攻代数拓扑。1970年,他被授予数学界最高荣誉菲尔兹奖,是第一位获得此奖的苏联数学家。我们几乎总是用荷兰语交流,自然而然就说起来了。他是一名出色的中后卫……而且身材也很高大(笑)!得适应和他一起踢球。第一场比赛进展得还不错,但所有这些磨合的过程都需要时间。他是个聪明的小伙子,他会表现得很好的。
20250812 🖤 成都私人情侣免费看电视剧的软件美丽的富春江畔,郁达夫故居静静矗立,而那位曾在这里眺望江景的文人,早已献身民族解放事业。一介书生,以笔为戈,最终血染南洋,他用生命书写了中国文人的铮铮铁骨。国产少女免费观看电视剧字幕Apple Notes/OneNote:生态绑定的云同步。Apple Notes作为苹果生态的一部分,笔记通过iCloud在Apple设备间同步,在非苹果设备上使用非常困难。虽然苹果宣称注重隐私,iCloud对笔记采用了加密存储,但用户仍需要信任苹果的云服务。而OneNote依赖微软OneDrive云端保存笔记,免费版提供一定容量,专业版可扩展。但本质上OneNote也是一个云同步优先的工具(尽管可以缓存本地供离线暂时使用)。总体来说,Notion、Evernote、OneNote、Apple Notes这些主流应用走的都是云端路线,将数据托管在线上服务器;相较之下,Obsidian坚持本地优先,更符合那些强调数据自主权用户的需求。
成都私人情侣免费看电视剧的软件
📸 匡延青记者 石永兰 摄
20250812 🔞 成都私人情侣免费看电视剧的软件新车首次搭载源自 F1 赛车的高性能电池,其四元电池的阳极含有硅元素,能量密度高达 300 Wh/kg,具备更长寿命。电池采用圆柱形电芯,外壳为激光焊接铝材,兼具轻量化与散热效率。冷却系统则使用先进液体冷媒,能够围绕每一颗电芯流动,确保运行温度稳定。红桃17·c18起草刘靖康仍然是影石的实际控制人,按照IPO前发布的数据,刘靖康通过北京岚峰等员工持股平台,可支配公司34.0043%的表决权,间接持有公司29.8891%的股份,持股市值接近200亿元。
成都私人情侣免费看电视剧的软件
📸 朱品光记者 仲大伟 摄
🔞 据悉,特雷-杨依然会是老鹰的门面,并且据一位消息人士透露,特雷-杨非常有动力将老鹰重新带回东部季后赛的竞争行列,使球队成为真正的威胁。免费观看已满十八岁播放电视剧
扫一扫在手机打开当前页