尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
列车上的轮杆完整版如今就业市场竞争激烈,很多大学生毕业后都面临着就业难的问题。像林宇这样能够找到一份稳定的工作,并且有着不错的收入和福利待遇,已经算是比较幸运的了。而且,每个人对于“有出息”的定义都不同,林宇认为,能够在工作中获得满足感,生活过得安稳,就是一种成功。他也理解父母的良苦用心,但他更希望按照自己的节奏去规划未来的生活。尤其是这一次付航呼声很高,花絮中他出场拍了4次,结果在预告片中只看他像猴子一样抓耳挠腮,真的坐实了本尊猴哥的外号了。列车上的轮杆完整版免费观看已满十八岁电视剧下载安装在新疆霍尔果斯公路口岸,高云(右)在等待出关时与另一名“摆渡人”交流(5月29日摄)。在新疆霍尔果斯一家汽车贸易公司,“摆渡人”高云在取车后检查车况(6月10日摄)。高云在执行运车任务前,在新疆霍尔果斯家中把护照装入背包中(6月9日摄)。高云(左)在新疆霍尔果斯家中同儿子告别(6月9日摄)。这次运车出国的任务在晚上,她当天无法回家陪伴儿子。在新疆霍尔果斯公路口岸,高云(前)在等待验放时冲泡方便面(5月29日摄)。霍尔果斯出入境边防检查站在等待区域设置公共卫生间与开水间,为商品车“摆渡人”提供保障。我坚定地认为,我们的库存周转天数,可以优化到20天到25天。对于我们京东来讲,优化一天,就是100亿的现金,5天就可以出来500亿的现金,真金白银。
20250812 💣 列车上的轮杆完整版布伦特福德周五拒绝了曼联的6250万英镑第二次报价,这来自权威的BBC英国广播公司和「竞技网」,因此是确凿无疑之事。据称,曼联报价5500万英镑固定费用,外加750万英镑浮动条款,总价值与夏窗首签库尼亚相同。轮流和两个男人一起很容易染病吗雷克萨斯ES(参数丨图片)是一款知名度较高的车型,消费者和经销商经常有矛盾,起因就是排队购买雷克萨斯ES加价的问题。你没听错,之前的雷克萨斯ES太火,消费者买不到,只能加价购买。如今时代改变了,雷克萨斯ES也在转型的路上,未来会推出纯电版本。
📸 丁元记者 兰金和 摄
20250812 🔞 列车上的轮杆完整版消费者习惯了越来越快、越来越便捷的消费体验。但对于商家而言,如何实现从“送餐”到“送万物”,让消费者从“等快递”到“即时达”?成都私人情侣免费看电视剧的软件巴尔韦德:“那是赫伊森的一次精彩传球,维尼修斯跑出了绝佳的线路,而且他很有耐心地回传,正好找到了我。少一人作战时会有更多空间,因为对手可能会放松警惕,而我们成功利用了这一点,”
📸 肖丽记者 张建亭 摄
💣 对于伊朗对以色列的报复,彭博社援引中东问题专家、前澳大利亚军官罗杰·沙纳汉的话表示,如果伊朗像以色列那样,对以军事基地、核设施以及参与核计划的人员和高级军官进行报复,那么相关行动就是可控的。如果是无差别攻击,那么就会陷入死亡螺旋。欧洲新闻电视台称,对抗的爆发将意味着其范围扩大到多条战线,地区平衡将遭到广泛破坏,中东地区的重大利益将遭受沉重打击。免费观看已满十八岁播放电视剧