【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新性地提出了一种「拖拽式大语言模型」(DnD),它可以基于提示词快速生成模型参数,无需微调就能适应任务。不仅效率最高提升12000倍,而且具备出色的零样本泛化能力。 刚刚,包括尤洋教授在内的来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员,提出了一种全新的「拖拽式大语言模型」——Drag-and-Drop LLMs! 通过一个轻量级文本编码器与一个级联超卷积解码器的组合,DnD能在数秒内,仅根据无标签的任务提示词,生成针对该任务的LoRA权重矩阵。 通过观察,研究人员发现,LoRA适配器无非是其训练数据的一个函数:梯度下降会将基础权重「拖拽」至一个特定任务的最优状态。 为了赋予模型「拖拽」的能力,团队将这些数据集的提示词与收集到的LoRA权重进行随机配对,构成DnD模型的训练数据——即「提示词-参数」对。 在推理阶段,团队只需将来自全新数据集(训练中未见过)的提示词输入DnD,仅需一次前向传播,即可获得为该任务量身定制的参数。 实验结果表明,在零样本测试集上,团队的方法相较于训练所用的LoRA模型的平均性能,取得了惊人的提升,并且能够很好地泛化到多种真实世界任务和不同尺寸的LLM。 此前,他在中国科学技术大学获得人工智能学士学位。并曾在北卡罗来纳大学教堂山分校Huaxiu Yao教授的指导下进行实习,以及在中国科学技术大学数据科学实验室跟着导师Xiang Wang度过了两年的时光。 Zhangyang Wang目前是德克萨斯大学奥斯汀分校钱德拉家族电气与计算机工程系的终身副教授,并荣膺坦普尔顿基金会第7号捐赠教席。 他于2016年获伊利诺伊大学厄巴纳-香槟分校电气与计算机工程博士学位,师从计算机视觉泰斗黄煦涛(Thomas S.Huang)教授;并于2012年获中国科学技术大学电子工程与信息科学学士学位。 核心目标是创建结构化、模块化的模型表示:1)在过参数化模型空间中实现高效、鲁棒的学习;2)与符号知识及推理进行无缝连接。 此前,他在新加坡国立大学获得数据科学与机器学习博士学位,在中国科学院深圳先进技术研究院获得计算机技术硕士学位,在北京师范大学珠海校区获得学士学位。
17c.com.gov.cn过去,数不清有多少车企尝试翻越Model Y这座大山。2024年,国内新能源市场曾经掀起“围攻Model Y”的运动,短短一周左右,乐道 L60、极氪 7X、智界 R7等 6 款车型,一同打着对标 Model Y 的旗帜上市。但等尘埃落定,大家发现特斯拉仍稳坐“光明顶”,年销量大幅领先。此外,韶关还专门出台了《韶关市促进数据标注基地建设若干措施(试行)》等政策,为入驻企业提供办公租金“三免两减半”、企业员工每人每月100元的租金补贴、最高500万元的创业担保贷款支持、最高500万元的技术研发奖励及最高1000万元的企业成长奖励。17c.com.gov.cny31成色好的y31防守端他承担重任——通常主防西亚卡姆,这意味着他必须在攻防两端保持同样的能量。第4节他成功限制了西亚卡姆,让这位步行者前锋无法摆脱防守。媒体拍摄到徐艺洋的妈妈怀中抱着一个婴儿从保姆车上走出来,媒体称这个婴儿与黄子韬和徐艺洋在美国产检的时间吻合。
20250815 😏 17c.com.gov.cn直播吧6月14日讯 据《奥莱报》报道,迈阿密国际队主帅马斯切拉诺,在接受采访时谈到了皇马最近从河床队签下的阿根廷新星马斯坦托诺。床上108种插杆方式理想情况下,巴黎圣日耳曼希望能在对阵博塔弗戈的比赛中,让扎巴尔尼与球队一同亮相,迎来他在世俱杯上的第二场比赛。然而,在转会市场上,理想往往与现实相去甚远。巴黎圣日耳曼确实在6月1日至10日的首个转会窗口期间,尝试签下这位中后卫。负责谈判的路易斯-坎波斯和批准所有决策的纳赛尔甚至向伯恩茅斯提供了超过5000万欧元的报价。然而,英格兰俱乐部坚决拒绝,坚持要价约7000万欧元。
📸 胡秀平记者 杨强国 摄
20250815 😏 17c.com.gov.cn这个事情过后,大衣哥下地收割,都不再像之前一样被疯狂围观,人气还是有着明显的下滑的,不知道大衣哥是否会后悔昔日的举动?www97caogovcn“应用推广示范工程”旨在通过推动仪器共享平台建设与服务,开展科学仪器测试、验证和评价工作,推动建立用户委员会等方式,加速高端科学仪器迭代更新。
📸 张海燕记者 王佐军 摄
🌸 大连市公安局甘井子分局刑侦大队民警马剑平表示,经过摸排,王某的户籍是真的,但这个人是假的,他就是犯罪嫌疑人李某。1994年李某作案后,就潜逃到内蒙古自治区一个非常偏僻的地方,在这里隐藏了起来。《特殊的房产销售2》