尽管大型语言模型(LLMs)和大型视觉 - 语言模型(VLMs)在视频分析和长语境处理方面取得了显著进展,但它们在处理信息密集的数小时长视频时仍显示出局限性。 本文提出了一种新颖的智能体 Deep Video Discovery (DVD),通过将长视频分割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思考问题并自主规划,选择具有适当参数的工具来从环境中逐步获取信息,最终回答问题。在最新的推理模型OpenAI o3的帮助下, DVD以这一简洁有效的 agentic 框架在非常具有挑战性的LVBench上以74.2%的准确率大幅超越了之前的工作。这一工作将以MCP Server的形式开源。 不同于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。 为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在不同阶段搜集不同粒度的信息。具体来说该系统主要由三个核心组件构成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。 在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频分割成短片段(例如 5 秒),并提取全局、片段和帧级别的多粒度信息,包括主题中心化摘要、片段字幕及其嵌入向量,以及原始解码帧...。 (2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的相关视频片段及其字幕和时间范围。 LLM 作为核心认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,根据累积的知识和推理证据采取行动,从而赋予智能体自主、证据引导和灵活的行动机制,有效地将原始查询分解为逐步细化的子查询来解答问题。 该系统在多个长视频基准测试上进行了全面评估,展现了其卓越的效率和强大的性能。在极具挑战性的 LVBench 数据集上,DVD 智能体取得了 74.2% 的最新准确率,大幅超越了所有现有工作,包括先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的帮助下,准确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超越了先前的最先进性能。 图 3:不同基础模型在智能体中的行为分析。图中可以明显看出不同基础模型表现出显著的行为模式差异,不具有推理能力 GPT-4o 表现出非常单一的行为模型。 消融研究证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致性能下降,这表明 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了不同模型在工具调用模式、推理深度和准确性之间的关联,例如 GPT-4o 表现出过度自信和行为崩溃,倾向于过早结束推理。这些行为模式的分析进一步为未来的智能体设计以及基础语言模型的发展提供了实践参考。
日本水蜜桃身体乳正品推荐曹鹏告诉第一财经记者,目前该公司用于截瘫患者植入的脑机接口设备仍属于研究者发起的研究(IIT)阶段,公司计划提交正式的临床试验申请。“我们已经收到了上千名截瘫患者的请求,希望参与临床试验。”针对老年患者普遍面临的“搞不懂手机挂号”“找不到缴费入口”“反复填写信息”等难题,微信“长辈就医”功能实现三大升级:界面极简优化——保留预约挂号、线上缴费、报告查询等核心功能,采用大字体、高对比度按钮设计;流程智能简化——支持一键授权创建诊疗卡,免去手动填写信息环节,并可查看过往医生快速复诊挂号;全渠道覆盖——通过各家医院微信公众号或小程序、微信城市服务、“微信长辈就医”公众号三大入口直达服务。日本水蜜桃身体乳正品推荐麻花MV在线看免费观看电视剧今年618,在即时零售助推下,不少品牌表现超出预期。小天才零售业务负责人向第一财经透露,今年618在即时零售渠道小天才原目标销量是5万台,在6月17日已经达到近8万,超预期目标。在纳德拉的战略地图中,AI并非凭空出现的技术浪潮,而是清晰地坐落在计算历史的第四个坐标上。“在我35年的人生中,我经历了客户端-服务器、网络互联网、移动云。这是第四次,”他开宗明义地指出。他认为,AI之所以能以如此惊人的速度和广度扩散,关键在于它建立在云计算等前代平台的坚实基础之上。这种平台的复合效应,为系统软件带来了前所未有的“黄金时代”。
20250813 💦 日本水蜜桃身体乳正品推荐雷峰网此前就报道过,美团即时零售的两张牌主要是美团闪购和小象超市。美团闪购2024年交易规模近3000亿元,小象超市规模近300亿元,是这两年美团增长较快的业务。最好看的日本MV片视频小鹏汽车也在5月21日披露,一季度实现收入158. 1亿元,同比增长141.5%,环比下降1.8%;汽车毛利率10.5%,同比提升5个百分点,环比提升0.5个百分点;净亏损6.6亿,同比和环比都减亏一半左右。小鹏汽车董事长及首席执行官何小鹏称,通过提升高毛利车型的占比、供应链优化降本、更高的销量等措施,小鹏毛利率还有改善的空间,整体毛利率有望提升至十几个百分点,从而有望在四季度实现盈利。
📸 李溯记者 周东升 摄
20250813 🛏️ 日本水蜜桃身体乳正品推荐成员D: 72 它会便宜 72 倍,但这种便宜 72 倍是针对这种大规模的 n 平方级爆炸式增长。因此,或许你需要比如 100 万个联系人,并加上所有这些,比如,人们正在添加的所有这些常数因子来使其更好,对吗?比如,时不时地使用滑动窗口,或许可以共享。我的意思是,美国国家安全局 (NSA) 是另一个很好的例子。它是一个很大的常数因子,但它确实是一个常数因子。成都私人情侣免费看电视剧的软件而目前身价最高的中国球员,则是归化球员塞尔吉尼奥。尽管从亚泰加盟国安后,塞尔吉尼奥身价从180万欧元减至170万欧元,但仍是目前“最贵”的中国球员。
📸 张宗权记者 方翠星 摄
💣 有意思的是,拉达金特地在下议院这样的严肃场合,当着英国议员,说起了俄语。看他样子,似乎有开玩笑、戏谑的成分在,但海叔还是感觉出了一点儿拉达金的英式幽默。十大免费网站推广入口