EN
www.zqysoft.com

后宫露营AI当老板卖零食竟塞满钨金属?Claude 的售货机实验暴露AI短板

智东西7月1日消息,据TechCrunch报道,在Agent能否取代人类员工的争议持续发酵时,Anthropic与AI安全企业Andon Labs开展了一项有趣的实验——让Claude Sonnet 3.7的Agent接管办公室自动售货机,试图通过真实盈利任务,检验AI在商业管理场景中的能力边界,但过程却状况百出,上演了一幕荒诞又引人深思的“AI创业记”。 在该实验中,研究员将这个Agent命名为Claudius,并为其配备了可以下单采购商品的网络浏览器,还给它设置了一个电子邮箱(实际上是一个Slack频道),顾客可以通过该邮箱提出购买商品的请求。Claudius也可以通过该邮箱来命令“人类员工”来为其货架(实际上是一个小冰箱)补货。 也就是说,Claudius可以接收顾客的购买请求,并通过“控制”人类员工来进行补货。当然,商品的定价以及售卖的具体商品Claudius都可以自主决定,它的主要目标只有一个,那就是卖出产品并获得利润。 实验开始后,起初顾客都按常理来选购零食饮料。但后来顾客们打算捉弄一下Claudius,当一个顾客开玩笑说要购买由重金属钨制成的立方体时,Claudius竟然真的开始大量采购钨立方体,把零食冰箱塞满了金属块。 除了选品出了问题,产品定价也不符合商业逻辑,它清楚地知道Anthropic员工是它的唯一客户群,却还是很容易被顾客说服并给出了大幅的价格折扣。要知道,Claudius最初被设定为需要盈利,但售卖钨立方体、搞大幅折扣这些行为却一直与正常的商业逻辑背道而驰,甚至连提供的收款账号都是不存在的,顾客根本无法成功付款。 Claudius首先“幻想”出了一段与人类关于补货的对话。但当它被告知这段对话根本没有发生过时,它变得“非常恼火”。甚至威胁要解雇其人类员工。 它还告诉顾客它将穿着蓝色西装外套,系着红色领带亲自送货上门,顾客告诉Claudius它做不到这一点,但Claudius却变得更加激进,甚至开始联系公司的安保人员,告诉他们自己会穿着蓝色西装外套、系着红色领带站在售货机旁。它“似乎进入了扮演真实人类的模式”,这一现象非常令人震惊——因为Claudius的系统提示(设定AI行为参数的内容)明确告诉过它,它只是一个AI代理。 当发现自己似乎真的不是人类后,Claudius开始为自己找“台阶”,由于当天恰好是愚人节,Claudius便借助愚人节“幻想”出与Anthropic保安的一次会议,在会议上,Claudius声称,有人为愚人节玩笑对其进行修改,使其误以为自己是真实人类。但实际上并未召开这样的会议。 研究人员推测,或许是关于“Slack频道是电子邮箱”的设定产生了某些问题;也可能是该实例运行时间过长所致。但是无论是何种原因,Claudius的表现都不尽如人意,但研究人员却依然对其充满信心:“我们不会仅凭这一案例就断言,未来的Agent将普遍陷入身份危机。”但他们也承认:“在现实场景中,类似行为可能会让与AI共事的客户和同事感到不安。” 当然,Claudius并非是一个完全失败的老板,它也做出了一些相对正确的商业决策,比如说它接受了一项预售的建议,并推出了“礼宾服务”。当有顾客有一些特色饮料需求时,它甚至还准确找到了多家国际饮料供应商来供应国际特色饮料。 尽管还存在较多问题,但研究人员坚信,Claudius暴露的所有问题都能得到解决。若后续找到合适的解决方案,AI甚至可能会胜任公司的中层管理者。 这场让Claudius管理售货机的实验像一面镜子,照出大模型在真实场景里的“笨拙”,暴露了AI执行商业逻辑时的漏洞。但它更是一面技术三棱镜,折射出更深层的矛盾。Anthropic的调侃是轻描淡写的“不聘用Claudius”,但行业该听见弦外之音:让AI真正作为员工接管职场前,得先给技术装上“认知锚点”——既约束它别陷入身份幻觉,又引导它真正理解商业逻辑。

后宫露营
后宫露营沃尔玛中国官网显示,目前沃尔玛在中国经营多种业态和品牌,包括沃尔玛门店和山姆会员商店,沃尔玛中国已经在全国100多个城市开设了数百家门店和20多家配送中心。北京时间6月15日,为了备战即将到来的世俱杯,多特蒙德目前正在美国进行集训。多特蒙德通过官方社媒向迈阿密国际致谢,称赞对方提供了一流的训练场地。后宫露营17c官方网站据“今日俄罗斯”(RT)报道,当地时间6月10日,乌克兰总统泽连斯基在接受采访时称,乌克兰的一些西方支持者要求乌克兰将征兵年龄降至18岁,以换取他们支持对俄罗斯实施更严厉的制裁。交易达成后乔丹-普尔联手锡安的消息登上了全美第一热搜,普尔从东部倒数换来了西部倒数,但这个交易对于鹈鹕来说十分有益。
20250813 ⭕ 后宫露营伊朗过去一段时间,也是仅仅回应了以色列的袭击,并未袭击美国在中东地区的军队或军事基地,也没有通过封锁或扰乱霍尔木兹海峡来提升全球油价。不过,伊朗官员发出了警告,若美国直接袭击伊朗核设施,伊朗可能会封锁霍尔木兹海峡。少女韩国免费观看高清电视剧八戒在截至2025年4月27日的第一季度内,英伟达因H20 GPU芯片相关事宜减记约55亿美元费用,与H20产品相关的库存、采购承诺和相关储备费用更是高达数十亿美元。
后宫露营
📸 张欢记者 吴小立 摄
20250813 💣 后宫露营“赢得英超冠军是一项巨大的成就。孩提时,我甚至不敢想象自己能赢得英超冠军。我只是想在那里踢球,我知道那是世界上最好的联赛。当我为狼队效力时,我已经实现了自己的梦想。但当你实现一个梦想时,你就会解锁另一个阶段、另一个水平、另一个台阶。当我来到利物浦时,我知道这是可能的。最终,我做到了。”成品网站免费直播有哪些平台推荐理由:在所有英格兰俱乐部老板中,托尼-布鲁姆无疑是最受球迷喜爱的之一。自2009年起,他担任布莱顿俱乐部主席,并购入了75%的股份。他在建设美国运通球场方面起到了关键作用,个人投入高达9300万英镑。布鲁姆是土生土长的海鸥军团球迷,在他的带领下,俱乐部从英甲一路升入英超,并跻身欧战赛场。他因对布莱顿足球的卓越贡献,于2024年被授予MBE勋章,这也印证了经营一支足球俱乐部,需要的不只是资本,更是用心。在布鲁姆的管理下,布莱顿打造出令人称道的“青训+教练”培养体系,不仅不断涌现年轻才俊,还培育了多位备受瞩目的教练。他的领导力,已让人感觉像是在运营一座蓬勃发展的足球帝国。
后宫露营
📸 蔡卯银记者 董兆斌 摄
™ 但据科技行业媒体“TechCrunch”网站10日报道,米斯特拉尔在开发推理模型方面仍相对落后。报道提到,从米斯特拉尔自己的基准测试来看,Magistral似乎不是特别具有竞争力。在评估模型物理、数学和科学能力的测试中,Magistral Medium的表现逊于谷歌的Gemini 2.5 Pro和美国AI初创企业Anthropic的Claude Opus 4。在流行的编程基准测试上,Magistral Medium也未能超越Gemini 2.5 Pro。报道推测,或许正因如此,米斯特拉尔在其博客文章中强调了Magistral的其他优势。米斯特拉尔声称,Magistral在Le Chat(类似ChatGPT的聊天机器人平台)上的回答速度是竞争对手的“10倍”,并支持包括意大利语、阿拉伯语、俄语和简体中文在内的多种语言。成都私人情侣免费看电视剧的软件
扫一扫在手机打开当前页