当前位置:文章 > 列表 > 正文

GPT5.5深夜炸场,此次OpenAI又行之 - 本命年

📅 2026-04-25 22:15:33 🏷️ 买伦敦金用什么交易平台 👁️ 421
GPT5.5深夜炸场,此次OpenAI又行之

于CTF“夺旗”应战中,GPT5.5之得分为881%,高于GPT5.4之83.7%。

GPT5.5之另一大特征就为更加节省Token,将Token消耗降低到之前一代之36分之一。

目前,GPT5.5已面向ChatGPT与Codex之Plus、Business、Enterprise用户推出,API也将随后发布。

目前,OpenAI有超过85%之员工每周跨部门用搭载GPT5.5之Codex。

选学。

不过,此次晋级似乎还没有一步到位,让者们可完全放手。

足坛

苍生直接把一名乱糟糟之繁差事丢给GPT5.5,它就可通过体谅宗旨、拆解步骤、调用器物、修正历程之流程交付出最终结局。

本文来自虎嗅,原文链接:https://www.huxiu.com/article/4853572.html?f=wyxwapp 虽GPT于多名领域正变得更慧,但OpenAI更乐于强调此为一名专为确凿工与智能体差事打造之模型。

于衡量繁命令行工流之Terminal-Bench2.0之测试中,GPT5.5之评分达到82.7%,远高于Claude之69.4%。

CrewAI。

于学识工差事GDPval、高级数学测试FrontierMath、衡量确凿电脑操作本领之OSWorld-Verified等维度,GPT5.5之评分均高出角逐对手一截。

于CyberGym测试中,GPT5.5之得分为81.8%,高过之Opus 4.7之73.1%。

此前OpenAI于内部邮件中说自己相待于Anthropic之优势为算力。

电动跑车

GPT还有一名显著提升之维度就为网络安康。

国际空间站

然而于4月24日,OpenAI于事前并没有进行预告铺垫之情况下半夜发布之GPT5.5,却带来之不小之惊喜。

此也意味之,虽此次API之价码大幅上涨至每百万Token 5美元,pro版30美元,但因效能之提升与Token消耗之减,实际增之本金不多。

利昂内尔·梅西

今,随之算力充足之OpenAI大秀肌肉,而Anthropic于算力吃紧中体验不断打折,此两位一度“贴身肉搏”之死对头似乎又有之拉开差距之趋势。

可说,于过往一段光阴里饱受质疑之OpenAI今日打之名漂亮之翻身仗。

GPT5.5于测试中之得分为58.6%,低于Opus4.7之64.3%。

多名第三方评测皆提到之GPT-5.5对差事边界之依赖更强。

肖思远。

曾经,OpenAI CEO奥特曼用“吓晕瘫坐于椅子上,彷佛看到原子弹爆炸”来形容自己初次用GPT5之体验。

OpenAI联手创始者兼总裁格雷格·布罗克曼(Greg Brockman)提到此一点时表示,“让企业与寻常用户皆能用上更前沿之AI本领”为公司之宗旨之一。

人山人海。

为之更好说明此一点,OpenAI还公布之公司内部对货品之用情况。

当OpenAI带之新模型重回巅峰时,Anthropic最近却较量烦。

用更直白之话说,此次晋级让GPT有之能自己干活之本领,从辅助决策变成之参与执行。

但于此次更新中,OpenAI官方称GPT5.5于智能水平大幅提升之同时,确凿效劳中之速度与GPT5.4保之一致。

虽没者被“吓瘫”,但从各类第三方网站之评分看,GPT5.5之统合表现确实优异,不仅比GPT5.4大幅长进,也于多名领域逾越之Claude Opus 4.7、Gemini 3.1 Pro等主要角逐对手。

然而,当者们最终发觉此次更新远没有期待中之惊艳时,此段夸张之描述反而成为之者们反复嘲讽OpenAI之网梗。

Starlink。

当者们之需求描述不清楚时,它不会主动帮你补全,而为会按现有讯息执行。

官方称GPT5.5为一种面向实际工与智能体之新型智能,主打Agent编程、学识工、格致研讨等。

GPT5.5之编程本领较为出色,但Opus4.7于SweetBench Pro测试中之表现依然保居先身价。

于同类之Codex差事里,GPT5.5也只需更少之Token就能成。

然则对于此名成绩,OpenAI也进行之进一步说明,称行业内已有呈文指出该评测存过拟合表象,无法代表确凿之编程本领。

习近平

长期主打安康牌却爆出之安康丑闻、对重度付费用户严厉限流、大面积无差别封号等事件皆引发之巨大争议,日益高企之Token费用与Token消耗也让甚多者直呼“用不起”。

AI大模型之智谋与速度往往被视为不可兼得,更大之模型与更多之参数就意味之更长之思考光阴。

罪状

于OpenAI内部设立之,针对20小时长周期软件营造之Expert-SWE测评中,GPT-5.5之成率来到之惊者之73.1%,显著高于上一代GPT5.4之68.5%。

OpenAI之X官方账号称,GPT5.5“旨于体谅繁宗旨、用器物、查验其工,并将更多差事进行到底”,而它之现“标志之成计算机工之全新方式”。

发展

而公司之财务团队已用GPT5.5成之24771份,共计7万余页之税表审核,比往年提前两年完工。

此种“服从”于某些场景为长处,于另一些场景反而为缺陷。

上一篇:15系列等机型 华为公布最新5A设备名单:涵盖畅享70X、nova 下一篇:马年首名交易日,港股机器者板块爆发!AI应用概念走强,智谱、MiniMax市值双双冲破3000亿港元

绿色低碳。