GPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

8个月前 来源: 观看:72

89E即热新闻——关注每天科技社会生活新变化gihot.com

▲OpenAI发布其最新人工智能模型GPT-5。图/IC photo89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

GPT-5终于来了,但比所有人的预期都要晚。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

据新华社报道,美国开放人工智能研究中心(OpenAI)8月7日发布其最新人工智能模型GPT-5。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

从2023年3月GPT-4横空出世之后,不少人曾认为,当年下半年GPT-5就可以出来。但这一等,就是2年多的时间。期间,OpenAI推出了其他众多以奇奇怪怪方式命名的大模型,复杂得让用户在选择时,都犯了选择困难症。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

虽然不少媒体对这次发布会给予了积极评价,但从更广泛视角看,与其说这是OpenAI的一次技术展示,不如说是OpenAI和奥尔特曼不得不举办的一场发布会。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI的升级与失落89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

从发布会来看,OpenAI给出的GPT-5卖点很清晰:更强、更稳、更便宜、更好用。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

“更强”,是OpenAI一贯的特色。每一次GPT系列产品出来,总要在模型能力上来个“屠榜”,这次也不例外。OpenAI官方数据显示,GPT-5在多项基准测试中创下新纪录,包括数学、编程、多模态理解和健康等领域。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

不仅如此,GPT-5采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根据不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。也就是“简单问题快答,复杂问题拉长思考”,这样的使用体验,比把不同子模型硬塞给用户选择更自然。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

此外,达到400K的超长上下文能力,也是GPT-5值得一提的改进。这对长文档检索与跨文件代码修改更友好,虽然相比Gemini 1M(谷歌旗下产品)的上下文量还有距离,但于其他对手而言,已算是领先一步。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

“更稳”,针对的是AI大模型普遍存在的“幻觉”问题。OpenAI官方反复强调,GPT-5在事实性与安全性上比前代显著进步:更少的幻觉、更少的“编理由”“迎合性回答”,在“该不知道的时候更愿意承认不知道”。这既是对过去一年里“推理模型幻觉陡增”的纠偏,也是面向企业落地的现实诉求。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

“更便宜”,则是这次更具杀伤力的一点。GPT-5在编程能力大幅度提升的情况下,其API(应用程序编程接口)价格却比8月5日刚发布的Claude Opus 4.1更便宜,同时也比Gemini 2.5 Pro价格低。这可以说是对Anthropic(美国人工智能初创公司)的致命一击。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

要知道,OpenAI作为这一领域的前沿公司,过去是它做什么,大家做什么;但现在,这种趋势正在被Anthropic取代。比如编程能力、幻觉抑制、安全,以及MCP等都属于Anthropic,而OpenAI最擅长的就只剩下“屠榜”和营销了。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

所以,这次OpenAI把GPT-5系列的价格定得很低,与主打高强度推理与编码的Claude Opus 4.1相比,足足有一个数量级的差距,显然就不仅仅是象征性的实惠,而是为了实实在在改变开发团队的选择。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

这其实也解释了,为什么Anthropic会在日前公开指责OpenAI违反服务条款,切断OpenAI对Claude(Anthropic发布的大型语言模型家族)系列AI模型的API访问权限。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

“更好用”,就是让用户不用再为选择什么模型而苦恼。过去那些乱七八糟的命名模型,反映的不仅是GPT-5迟迟无法达到预期目标的结果,也大大降低了用户的使用体验。基本上没有其他产品像GPT一样,存在如此多不同命名的模型。这次GPT-5推出之后,终于实现了“大一统”,其他所有大模型统统消失,只剩下GPT-5系列产品。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

营销大师的尴尬89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

但GPT-5的这些进步,显然不可能是颠覆性的,只能算是技术上的“小步快跑”,离所谓的AGI(通用人工智能)显然还有相当大的距离。甚至可以说,GPT-5在这个时候发布,很大程度上是因为OpenAI和奥尔特曼不得不举办。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

作为出了名的“营销大师”,早在几个月前开始,关于GPT-5的消息、截图总是不时出现在社交平台上。奥尔特曼在接受媒体采访时感叹自己能力不如GPT-5,甚至为AI的发展将超出现有监管能力而担忧。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

在发布会的前一天,一些渠道上还有各种“提前走漏风声”,让大家对这场发布会的预期拉得很高——这会是一场再次改变游戏规则与行业走向的发布会?89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

但发布会过后,外界对OpenAI的模型能力评价却出现了下滑,有的甚至充满了失望。这场发布会的实际演示与讲述,更像一场“产品化与可用性升级”的汇报——重要,但不惊艳。更别说那些被网友抓包的PPT错误了。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

但不管如何,对于OpenAI和奥尔特曼,这却是一场不得不举办的发布会。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

首先是因为,GPT-5已一再爽约。外界两年多来的等待,以及中间各种传闻和暗示,已经把时间窗口压得很窄。如果再不发布GPT-5,恐怕后续OpenAI的叙事方式,就要从“我们在引领”变成“我们为什么还没发布”。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

89E即热新闻——关注每天科技社会生活新变化gihot.com

▲GPT-5主打“更强、更稳、更便宜、更好用”卖点。图/IC photo89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

竞争压力也是看得见摸得着。在Anthropic、Google、Meta(脸书)、xAI(马斯克成立的人工智能公司)以及中国一众大语言模型公司的激烈竞争下,OpenAI在业内的优势已经越来越不明显了。就在这次发布会之前,Anthropic把Claude Opus 4.1的编码表现又往上推了一截;过去一年里,Claude系在长程专注、复杂代码重构上的口碑持续攀升。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

除了具体的模型能力之外,AI人才战也愈演愈烈。从2024年的OpenAI安全团队离职潮,到今年多份人才报告显示的流向Anthropic的净迁移,再到Meta开出天价薪酬到处挖人,这些都对OpenAI产生了巨大的压力。OpenAI既要保持住自己的优势与吸引力,同时也要稳住团队士气。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

所以,从这一点来看,其实也就非常好理解了,为何这次发布会上,OpenAI主打的是“更强、更稳、更便宜、更好用”的卖点组合了。换句话说,当价格战成为OpenAI应对强劲对手的武器时,就可以清清楚楚地感受到,这家一直以来以技术领先为核心定义的公司,其实面临着怎样的巨大压力。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

因此,更便宜的价格,既是这场发布会令人意外的最大亮点,却也是令人叹息的地方。而当先行者变得务实,也许才是技术快速发展期结束的最明显标志。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

AI狂飙时代的结束?89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

在营销大师奥尔特曼主导下的这场发布会,出乎意料地变得很实在。它没有承诺AGI的到来,也没有宣布颠覆式的新能力,而是把稳定性、安全性、价格、默认可用放在C位——这些恰恰是平台期最值得押注的要素。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

同时,这也反映OpenAI在变慢,AI行业整体也在变慢的现实。所以,未来AI行业恐怕在短期之内,很难会像此前GPT横空出世一样,带给公众巨大的颠覆感和震撼感。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

从GPT-4.5(Orion)项目的失败,就已经让大家看到了参数Scaling Law(规模定律)逐渐放缓的迹象。一个典型的例子是,即使是用了10倍算力强化学习的Grok-4,表现也不算特别惊艳。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

正如有分析认为,当前的评估基准正在接近饱和,“基本上就像看高中生做初中题目”。当所有模型都能在现有测试中取得90%以上的分数时,这些数字还有多大意义?89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

低垂的果实已经摘完了。那堵看不见的AI增长之墙,也就变得越发明显。整个行业都需要新的突破——可能是架构上的创新,可能是训练方法的革命,也可能是我们还未想到的全新方式。只是,这个突破何时到来、以何种形式到来,已经变得难以预测。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

所以,某种意义上来说,GPT-5的发布,既标志着OpenAI逐渐变慢的开始,也预示整个AI行业,将从过去的“奇迹时代”走入“平凡时代”。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI曾经是那个定义游戏规则的先行者,现在却不得不在一场并不完美的发布会上,用价格战来守住阵地。这不仅是OpenAI的转折点,也可能是整个AI行业的分水岭。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

因此,GPT-5远不是AGI产品。而通向AGI的道路,也可能将远比我们想象的要长得多。89E即热新闻——关注每天科技社会生活新变化gihot.com


89E即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 新京智库高级研究员 郑伟彬89E即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 马小龙89E即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 王心89E即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-12033-0.htmlGPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:APP偷偷“自动续费” 法院判决支持全额退款

下一篇:50%关税,撕去了美印温情脉脉的面纱 | 新京报专栏

为你推荐
过去,北方寒冷地区的“银发族”如候鸟般迁徙至海南岛过冬;而如今,凭借着极高的性价比,西双版纳成为了不少外省人过冬的新选择。据云南...
01-21
  财联社1月21日讯(编辑 牛占林)当地时间周二(1月21日),马斯克领导的美国政府效率部(DOGE)已经开始正式运作,第一项工作便是移除首席多元化官员执行委员会的网站。  该网...
01-22
  广州日报讯(全媒体记者邓莉)今年将是自主高端新能源车崛起的一年。招银国际在1月发布的最新报...
01-23
1 月 29 日消息,宝马公司推出了 2026 款 iX 中型 SUV,作为中期改款车型,此次改款不仅对车型阵容进行了调整,还对外观、内饰以及动力系统进行了优化升级。宝马 iX 自 202...
01-29
《难哄》苏浩安谁演身份是什么?苏浩安喜欢谁?‌电视剧《难哄》中苏浩安的角色由陈昊森饰演‌。苏浩安在剧中是一个富二代,表面玩世不恭,但实际上内心柔软细腻。...
02-19
随着电视剧的热播,“夜魔侠重生上映时间是什么时候”这一话题逐渐吸引了众多粉丝的目光。该剧播出后,凭借其精彩的剧情、精良的制作和演员们的精湛表演,赢得了...
02-21
  大城市就医紧张,一些大型三甲医院常年“一床难求”,患者住院经常需要漫长等待。能不能“哪里有床住哪里”?   试点医院住院“...
01-21
21世纪经济报道记者 韩利明 上海报道当地时间2月12日,艾伯维(NYSE:ABBV)与Xilio Therapeutics(NASDAQ:XLO)宣布达成一项合作和选择性许可协议,双方...
02-14
她师从图灵奖获得者 博士毕业于麻省理工学院 是国际知名企业的首席科学家 回...
01-21
  六月二十三日,我在浐灞参观交警队。  今天我早早的就起床了,因为我今天我要去浐灞参观交警队。我坐上地铁只倒了一辆车就到了。  到了交警队我们第一站就到了个犯人...
01-21
  摘要  【骤增近30%纯碱库存创历史新高!供需失衡态势加剧?】本周,纯碱市场呈现双弱状态。纯碱...
02-07
  摘要  【“盘中异动赶紧锁仓”!锰硅全线大涨原因找到了?】银河期货大宗商品研究所黑色板块...
02-07
天秤座是一个注重平衡和公正的星座,他们通常不容易生气。然而,当某些事情触碰到了他们的...
01-22
天蝎座男生是十二星座中最神秘、深沉的一种类型,他们对感情非常认真,一旦喜欢上一个人,会...
01-22
饰品创业计划书模板:轻松开启你的创业之旅在当今的市场环境中,饰品行业因其产品多样性和高利润率吸引了众多创业者的关注。如果你也想要在这个领域展开自己的创业冒险,撰写一份...
02-07
2023年时尚潮流颜色服饰指南在时尚的世界里,每年都会有新的潮流颜色引领风骚,成为众多服饰品牌和设计师争相追逐的对象。今年的潮流颜色不仅展现了设计师们的创意,更是反映了当...
02-17
阿里AI,蓄势待发。阿里巴巴再添AI猛将2025开年,阿里巴巴迎来一位AI牛人。据界面新闻,全球顶尖人工智能科学家许主洪(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C...
02-07
2月18日消息,华盛昌与北京京东数智工业科技有限公司(以下简称“京东工业”)近日在京东集团上海总部举行战略合作协议签约仪式。华盛昌董事长袁剑敏与京东工业副总裁郭晓博作为...
02-19
2025年家电购新补贴延续,对于家电消费市场而言可谓喜闻乐见。一方面,消费者能够用更优惠的价格添置高品质的新家电;另一方面,厂商能够...
02-07
南京德基广场 图源:图虫 咨询公司贝恩发布的报告显示,2024...
02-22
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
近日,中赢供应链管理有限公司(以下简称“中赢科技”)宣布成功完成A轮融资,融资金额高达1000万元人民币。本轮融资由深圳慧财股权投资基金战略投资,标志...
02-07
在今天的Xbox开发者直面会上,Xbox和光荣出乎所有人的意外公布了《忍者龙剑传2》的决定版,而且方式和之前的小体量游戏《完美音浪》一样采用公布即发售的模式。 ...
01-27
《博德之门3》开发商拉瑞安工作室的发行总监 MichaelDouse 最近在社交媒体上表示,希望 Steam 能够为想要支持一些独立游戏开发者,愿意花更多钱的玩家提供更多的...
01-28
极目新闻记者 谢茂 邓波2月8日,四川宜宾市筠连县沐爱镇金坪村发生山体滑坡,导致10户民房、1户生产用房被掩埋,目前有1人遇难,28人失联。一方有难,八方支援。受灾区域周边村镇的热...
02-09
在2月9日的比赛中,中国代表团获得7金7银9铜。其中,中国短道速滑队以2金2银4铜收官。△点击图片,查看哈尔滨第九届亚冬会奖牌榜。2月10日,将决出7枚金牌。比赛有哪些精彩看点?一起...
02-10
近日,知名研究机构胡润百富公开发布“2024胡润中国人工智能企业50强”榜单,岩山科技凭借其在自动驾驶及类脑智能领域的技术创新和应用实践,荣誉入选榜...
01-21
“2024年,新型储能保持快速发展态势,装机规模突破7000万千瓦。”在1月23日举行的国家能源局2025年一季度新闻发布会上,国家能源局能源节约和科技装备...
01-24
  今天(1月23日)至27日,今年首场寒潮将携大范围雨雪来袭,西北地区东部、华北、东北等地有较强降雪...
01-24
辽宁省气象台1月25日16时发布寒潮黄色预警  预计,26~29日全省气温自西向东陆续下降,大部地区累计降温幅...
01-27
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮