尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
《和部长一起去出差旅》中文老师一听,心里“咯噔”一下,脸上露出为难的神情,他礼貌而又无奈地解释道:“家长,你看我只是这个七年级班级的任课老师,并不是班主任。这种事情我可能处理起来不太方便,要不你去找班主任沟通一下?”男家长一听,脸色更加阴沉,眉头拧成了一个疙瘩,嘴里嘟囔着:“怎么这么麻烦,你们老师还分这么多事!”但还是一脸不爽地带着儿子,朝着班主任的办公室走去。直播吧6月18日讯 据《世界体育报》报道,由于巴萨保留了科拉多20%的转会分成权利,因此贝蒂斯前锋加盟卡塔尔北部区体育的200万欧元转会费可以让红蓝军团入账40万欧元。《和部长一起去出差旅》中文女人一旦尝到粗硬的心理罗甫祥还说:警方从开始就介入了罗帅宇死亡一事,但从始至今,都没有介入从儿子电脑里整理出来的湘雅二院涉案相关材料。他们在2024年8月28日就将相关举报材料递交给警方,但至今没有得到任何回应。曼联高层认为其场上价值值得延续。这位9岁就加入曼联青训的北爱尔兰人,在2007年9月弗格森爵士麾下完成首秀,首次效力期间随队赢得3次英超、2次联赛杯、1次欧冠和1次世俱杯。2015年转会西布朗后辗转莱斯特城,去年以短期合同回归时甚至接受最低薪资。
20250814 🈲 《和部长一起去出差旅》中文哈利伯顿:“我们很好地混合使用了防守策略,内姆哈德、谢泼德和内史密斯在防守端表现出色。我们努力让SGA的进攻变得艰难,但需要减少犯规——这是我们主要的失误来源。尽管如此,他还是拿下35分,毕竟他很难被限制。我们需要继续集体施压,做好篮板和快攻。”鲁大师在线观看在线播放八戒“翻译中国文学作品是我一生的事业。这项事业给我带来快乐,也让我的人生变得更有意义。”来华参加第三十一届北京国际图书博览会的俄罗斯汉学家、俄罗斯圣彼得堡大学东方系常务副主任阿列克谢·罗季奥诺夫说。
📸 张建涛记者 单玉刚 摄
20250814 💫 《和部长一起去出差旅》中文中国航空工业集团巴黎航展代表团副团长 朱谦:很荣幸,我曾经参与过歼-10飞机的研发,为它奋斗了18年。它是我们国家自行研制的全天候单座单发四代半战斗机。这个飞机具有非常优秀的机动性能,非常先进的航电火控雷达,以及配套的武器装备。它不仅具有自主闭环的超视距攻击能力,也具有优秀的电子对抗和体系协同作战能力。我们跟巴黎航展也是很有缘分,歼-10的第一次也是在巴黎航展。我们在2019年就在这里首次亮相。之后,也频繁亮相于世界各大航空航天的防务展。所以说我们这次来,就是跟世界航空业携手合作,携手并进,共创价值。轮流和两个男人一起很容易染病吗若以此标准,毛剑卿暂时还没有资格代表泰州参加苏超。至于未来他是否有资格,泰州市体育局工作人员表示,这要看组委会的规定,“我们只能根据组委会的规则和要求,看下一阶段可不可以进行换人或增补。”
📸 洪瑛汉记者 宋煜 摄
👄 本次图博会的主宾国为马来西亚,图博会期间,与主宾国马来西亚主要出版机构的版权签约、版权推荐会、嘉宾讲座以及新书发布等活动将密集举行。“汪洋中的一条船——我的马华文学”“马来西亚汉文化中心与北京出版集团版权签约仪式暨马来西亚国民小学中文学习教材项目启动”“版权合作签约仪式暨《中国画的艺术》马来文版新书发布会”等活动将促进中马对话,推动两国在出版、学术等领域的合作。学校教室里可以插自己电脑吗