尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
日剧《疯狂上司》完整版据央视新闻,当地时间6月13日晚间,以色列总理内塔尼亚胡通过其社交媒体账号发表视频声明,称以军已摧毁大量伊朗导弹库存和多个核设施,强调以军的行动并非针对伊朗人民。内塔尼亚胡在声明中还表示,以色列军方当天针对伊朗采取的行动是“历史上规模最大的行动之一”。由于维金斯与八村垒的薪资无法直接匹配,交易需加入克莱贝尔或文森特的合同。消息源称,热火可能索要克内克特——因湖人在解决中锋空缺前,不愿交易2031年或2032年的首轮签。热火也可能试图送走李凯尔及其剩余两年1880万美元的合同。日剧《疯狂上司》完整版女性一晚上3次纵欲导致不孕今年,我们团队走访了上海重点高校,校园内蓬勃的创新热情和成熟的科技成果令人印象深刻。我深信这些人才必将从MWC上海这一国际平台获益良多,无论是前沿科技的集中展示,还是行业议题的深度探讨,都将为他们带来收获。网友推测可能是大量数据上传意外触发系统预警(如版权保护机制),但微软迄今未回应具体原因。专家建议用户遵循 3-2-1 备份原则(即 3 份副本、2 种介质、1 份异地存储)。
20250813 💃 日剧《疯狂上司》完整版《罗马体育报》表示,最终决定权在鲁加尼手中,这位中卫实际上已收到多份报价,其中一些来自英超联赛,他可能会选择前往英超延续职业生涯。九·幺.9.1有趣的是,人工智能的监管与数字货币类似,并不是各地区、各个机构都有相同的监管目标——一部分人想要真正推动前沿创新,并愿意接受一定程度的失败;另一部分人希望谨慎对待金融风险,会采取不一样的监管方式。
📸 田静慧记者 何肖风 摄
20250813 🖤 日剧《疯狂上司》完整版鲁本·阿莫林还希望再买一名新中锋,但目前曼联找不到理想的人选。阿莫林在葡萄牙体育的爱将哲凯赖什只把红魔当作备胎和抬价工具,他的首选是阿森纳。据《罗马体育报》报道,27岁的瑞典中锋已经拒绝了尤文图斯的1300万欧元(1100万英镑)年薪的合同,他想到英超为枪手踢球。女性一晚上3次纵欲导致不孕IT之家 6 月 24 日消息,The Information 昨日报道称,谷歌已削减 Google TV 项目 10% 预算,总额约 5 亿美元(IT之家注:现汇率约合 35.91 亿元人民币),并裁撤该团队约 75 名员工(约占 25%)。
📸 郑玉顺记者 刘新忠 摄
🍑 Chiplet(芯粒)技术是任正非战略思想在工程实践中的生动体现。该技术借助架构革新和系统级优化,成功弥补了单芯片制程上的代际差距,实现了整体性能的实用化突破。轮流和两个男人一起很容易染病吗