” Anthropic承认此些调理让模型显得“智力降”,并坦言此不符合用户之体验期望。
此外,针对上述Bug导致之Token费与性能摩擦,Anthropic已于4月23日重置之所有订阅用户之额度,并谋划后续通过X与GitHub上之@ClaudeDevs官方账号,提供货品决策背后之深层逻辑,以维持与掘发者大众更透明之对话。
实事求是。默认推演力度下调:3月4日,为缓解用户界面(UI)延迟及无响应疑难,Anthropic将Claude Code之默认推演力度由“高”调至“中”。
大量掘发者与资深用户于各大技艺社区回馈,Claude不仅于办理繁营造差事时延续推演本领断崖式下跌、幻觉频发,于Token之消耗上也变得极为低效。
目前,相关漏洞及限制已修补。
缓存逻辑漏洞:3月26日部署之缓存改良预案存代码缺陷。
该预案原谋划于会话闲置一小时后清理史册“思考历程”,但于实际运行中,清理动作于每次对话轮次后均被触发。
此导致模型丢失上下文“短期记忆”,输出实质现重复或遗忘。
面对外界质疑,Anthropic于官方博客中回应称:“公司极为重视关于性能倒退之回馈,绝不会故意降低模型性能。
首先,扩“内部测试”(Dogfooding)范围,要求更大比例之员工强制用公众版Claude Code以一统体验;其次,于修改体系提示词前,强制运行更广泛之单模型估量与消融实验(Ablations),以精准隔离特定指令之影响;最后,改良提示词变更之查账流程,确保特定模型之变更实施精准控制。
千言万语。经排查确认,API及推演层并未受到影响。
该调理直接导致模型办理繁差事时之逻辑剖析本领受限。
模型公司之融资动作,也要抢于DeepSeek更新前面。
呈文指出,底层模型权重(Model weights)并未生更张,疑难源于模型外围“封装框架”(Harness)之三项独力调理: 4月24日消息,者工智能企业Anthropic发布技艺复盘呈文承认,货品层之三项近期调理导致之Claude模型性能降,但明确否认之为节省算力而故意“降智”之说法。
近期,AI圈内关于Anthropic旗舰模型Claude“暗中缩水”之质疑声四起。
(易句) 4.7版本之输出冗长疑难,体系新增指令,将器物调用间之文本及最终回复分别限制于25名与100名单词以内。
首先,扩“内部测试”(Dogfooding)范围,要求更大比例之员工强制用公众版Claude Code以一统体验;其次,于修改体系提示词前,强制运行更广泛之单模型估量与消融实验(Ablations),以精准隔离特定指令之影响;最后,改良提示词变更之查账流程,确保特定模型之变更实施精准控制。
该限制适得其反,导致模型于编程品质估量中之得分降之3%。
为复原商场信赖并防范类似事件,公司宣布实施多项运营机制改更: 体系提示词冗余限制:4月16日,为减Opus 上述疑难主要影响Claude Code命令行界面(CLI)、Claude智能体软件掘发器物包(Agent SDK)及Claude Cowork,未波及Claude API业务。