GPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

7个月前 来源: 观看:73

2Ie即热新闻——关注每天科技社会生活新变化gihot.com

▲OpenAI发布其最新人工智能模型GPT-5。图/IC photo2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

GPT-5终于来了,但比所有人的预期都要晚。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

据新华社报道,美国开放人工智能研究中心(OpenAI)8月7日发布其最新人工智能模型GPT-5。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

从2023年3月GPT-4横空出世之后,不少人曾认为,当年下半年GPT-5就可以出来。但这一等,就是2年多的时间。期间,OpenAI推出了其他众多以奇奇怪怪方式命名的大模型,复杂得让用户在选择时,都犯了选择困难症。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

虽然不少媒体对这次发布会给予了积极评价,但从更广泛视角看,与其说这是OpenAI的一次技术展示,不如说是OpenAI和奥尔特曼不得不举办的一场发布会。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI的升级与失落2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

从发布会来看,OpenAI给出的GPT-5卖点很清晰:更强、更稳、更便宜、更好用。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

“更强”,是OpenAI一贯的特色。每一次GPT系列产品出来,总要在模型能力上来个“屠榜”,这次也不例外。OpenAI官方数据显示,GPT-5在多项基准测试中创下新纪录,包括数学、编程、多模态理解和健康等领域。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

不仅如此,GPT-5采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根据不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。也就是“简单问题快答,复杂问题拉长思考”,这样的使用体验,比把不同子模型硬塞给用户选择更自然。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

此外,达到400K的超长上下文能力,也是GPT-5值得一提的改进。这对长文档检索与跨文件代码修改更友好,虽然相比Gemini 1M(谷歌旗下产品)的上下文量还有距离,但于其他对手而言,已算是领先一步。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

“更稳”,针对的是AI大模型普遍存在的“幻觉”问题。OpenAI官方反复强调,GPT-5在事实性与安全性上比前代显著进步:更少的幻觉、更少的“编理由”“迎合性回答”,在“该不知道的时候更愿意承认不知道”。这既是对过去一年里“推理模型幻觉陡增”的纠偏,也是面向企业落地的现实诉求。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

“更便宜”,则是这次更具杀伤力的一点。GPT-5在编程能力大幅度提升的情况下,其API(应用程序编程接口)价格却比8月5日刚发布的Claude Opus 4.1更便宜,同时也比Gemini 2.5 Pro价格低。这可以说是对Anthropic(美国人工智能初创公司)的致命一击。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

要知道,OpenAI作为这一领域的前沿公司,过去是它做什么,大家做什么;但现在,这种趋势正在被Anthropic取代。比如编程能力、幻觉抑制、安全,以及MCP等都属于Anthropic,而OpenAI最擅长的就只剩下“屠榜”和营销了。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

所以,这次OpenAI把GPT-5系列的价格定得很低,与主打高强度推理与编码的Claude Opus 4.1相比,足足有一个数量级的差距,显然就不仅仅是象征性的实惠,而是为了实实在在改变开发团队的选择。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

这其实也解释了,为什么Anthropic会在日前公开指责OpenAI违反服务条款,切断OpenAI对Claude(Anthropic发布的大型语言模型家族)系列AI模型的API访问权限。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

“更好用”,就是让用户不用再为选择什么模型而苦恼。过去那些乱七八糟的命名模型,反映的不仅是GPT-5迟迟无法达到预期目标的结果,也大大降低了用户的使用体验。基本上没有其他产品像GPT一样,存在如此多不同命名的模型。这次GPT-5推出之后,终于实现了“大一统”,其他所有大模型统统消失,只剩下GPT-5系列产品。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

营销大师的尴尬2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

但GPT-5的这些进步,显然不可能是颠覆性的,只能算是技术上的“小步快跑”,离所谓的AGI(通用人工智能)显然还有相当大的距离。甚至可以说,GPT-5在这个时候发布,很大程度上是因为OpenAI和奥尔特曼不得不举办。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

作为出了名的“营销大师”,早在几个月前开始,关于GPT-5的消息、截图总是不时出现在社交平台上。奥尔特曼在接受媒体采访时感叹自己能力不如GPT-5,甚至为AI的发展将超出现有监管能力而担忧。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

在发布会的前一天,一些渠道上还有各种“提前走漏风声”,让大家对这场发布会的预期拉得很高——这会是一场再次改变游戏规则与行业走向的发布会?2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

但发布会过后,外界对OpenAI的模型能力评价却出现了下滑,有的甚至充满了失望。这场发布会的实际演示与讲述,更像一场“产品化与可用性升级”的汇报——重要,但不惊艳。更别说那些被网友抓包的PPT错误了。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

但不管如何,对于OpenAI和奥尔特曼,这却是一场不得不举办的发布会。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

首先是因为,GPT-5已一再爽约。外界两年多来的等待,以及中间各种传闻和暗示,已经把时间窗口压得很窄。如果再不发布GPT-5,恐怕后续OpenAI的叙事方式,就要从“我们在引领”变成“我们为什么还没发布”。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

2Ie即热新闻——关注每天科技社会生活新变化gihot.com

▲GPT-5主打“更强、更稳、更便宜、更好用”卖点。图/IC photo2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

竞争压力也是看得见摸得着。在Anthropic、Google、Meta(脸书)、xAI(马斯克成立的人工智能公司)以及中国一众大语言模型公司的激烈竞争下,OpenAI在业内的优势已经越来越不明显了。就在这次发布会之前,Anthropic把Claude Opus 4.1的编码表现又往上推了一截;过去一年里,Claude系在长程专注、复杂代码重构上的口碑持续攀升。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

除了具体的模型能力之外,AI人才战也愈演愈烈。从2024年的OpenAI安全团队离职潮,到今年多份人才报告显示的流向Anthropic的净迁移,再到Meta开出天价薪酬到处挖人,这些都对OpenAI产生了巨大的压力。OpenAI既要保持住自己的优势与吸引力,同时也要稳住团队士气。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

所以,从这一点来看,其实也就非常好理解了,为何这次发布会上,OpenAI主打的是“更强、更稳、更便宜、更好用”的卖点组合了。换句话说,当价格战成为OpenAI应对强劲对手的武器时,就可以清清楚楚地感受到,这家一直以来以技术领先为核心定义的公司,其实面临着怎样的巨大压力。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

因此,更便宜的价格,既是这场发布会令人意外的最大亮点,却也是令人叹息的地方。而当先行者变得务实,也许才是技术快速发展期结束的最明显标志。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

AI狂飙时代的结束?2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

在营销大师奥尔特曼主导下的这场发布会,出乎意料地变得很实在。它没有承诺AGI的到来,也没有宣布颠覆式的新能力,而是把稳定性、安全性、价格、默认可用放在C位——这些恰恰是平台期最值得押注的要素。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

同时,这也反映OpenAI在变慢,AI行业整体也在变慢的现实。所以,未来AI行业恐怕在短期之内,很难会像此前GPT横空出世一样,带给公众巨大的颠覆感和震撼感。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

从GPT-4.5(Orion)项目的失败,就已经让大家看到了参数Scaling Law(规模定律)逐渐放缓的迹象。一个典型的例子是,即使是用了10倍算力强化学习的Grok-4,表现也不算特别惊艳。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

正如有分析认为,当前的评估基准正在接近饱和,“基本上就像看高中生做初中题目”。当所有模型都能在现有测试中取得90%以上的分数时,这些数字还有多大意义?2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

低垂的果实已经摘完了。那堵看不见的AI增长之墙,也就变得越发明显。整个行业都需要新的突破——可能是架构上的创新,可能是训练方法的革命,也可能是我们还未想到的全新方式。只是,这个突破何时到来、以何种形式到来,已经变得难以预测。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

所以,某种意义上来说,GPT-5的发布,既标志着OpenAI逐渐变慢的开始,也预示整个AI行业,将从过去的“奇迹时代”走入“平凡时代”。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI曾经是那个定义游戏规则的先行者,现在却不得不在一场并不完美的发布会上,用价格战来守住阵地。这不仅是OpenAI的转折点,也可能是整个AI行业的分水岭。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

因此,GPT-5远不是AGI产品。而通向AGI的道路,也可能将远比我们想象的要长得多。2Ie即热新闻——关注每天科技社会生活新变化gihot.com


2Ie即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 新京智库高级研究员 郑伟彬2Ie即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 马小龙2Ie即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 王心2Ie即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-3145-0.htmlGPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:排除杂念,才能奔着最好去!

下一篇:50%关税,撕去了美印温情脉脉的面纱 | 新京报专栏

为你推荐
《六姊妹》为什么叫刘晓玲?刘小玲汤振民结局是什么在电视剧《六姊妹》中,角色叫刘小玲而不姓何,是因为以下原因:出生惊险致母怒:刘小玲是何家老五,她出生时难产,是...
02-20
在璀璨夺目的娱乐圈内,何炅凭借其出色的主持能力和温文尔雅的气质,早已赢得了众多粉丝的喜爱与尊敬。然而,近日,这位年过半百的知名主持人再度成为话题中心,原因竟是他那令人惊叹...
02-22
美国时间1月13日至16日,一年一度的摩根大通医疗健康会议(J.P. Morgan Healthcare Conference,简称JPM大会)在加利福尼亚州旧金山成功举办。JPM...
01-21
  ――医保、药监部门就集采药品问题答记者问  本报记者 孙秀艳  今年1月,有专家认为某些集采药品可能存在“血压不降、麻药不睡、泻药不泻”质量风险,有关部门迅...
02-11
  大众网记者 杨涛报道  近日,在第十六届山东省大学生科技节——山东省大学生消防安全技能大赛中,青岛港湾职业技术学院应急管理学院23级建筑消防技术与应急救援技术专...
01-21
辽宁大学依托部校共建新闻学院优势办高水平的新闻与传播学院,以习近平文化思想为指引,深入学习贯彻习近平...
01-21
  近年来蛋鸡养殖利润丰厚,养殖户积累了充裕的现金流,加上饲料价格走弱,蛋鸡养殖成本下降,现货价...
01-23
  四家上市险企业绩预增  股债共振推动利润预期改善  □记者 张小洁 北京报道  中国太...
02-05
天秤座男生是十分浪漫和迷人的,当他们喜欢上一个人时,会展现出一系列独特的行为和特点。...
01-22
狮子座的男生通常都有着强烈的自尊心和领导欲望,他们喜欢被人关注和赞美。因此,如果你想...
01-22
她是当今最美的女明星,你同意吗?在娱乐圈,讨论“谁是最美的女明星”一直是个热门话题。从银幕上闪耀的光芒到红毯上的璀璨,每位女明星都有她独特的魅力和风格。但在这其中,究竟谁...
02-07
当红女星风采:近期绽放的璀璨之美在最近的娱乐圈中,无论是电影、电视剧,还是社交媒体,许多女明星的魅力时刻吸引着大家的注意。仿佛每一位女神都在绽放自己的光芒,成了各界瞩目的...
02-07
2月9日消息,阿里云百炼全面上线DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款模型,即日起所有用户可直接使用。DeepSeek-V3、DeepSeek-R1满血版可享各100万免...
02-09
黄铮:用户的需求就是我们的方向标。1、多多国际全面招募海淘商家拼多多对商家下手了。据亿邦动力获悉,近日,拼多多站内的多多国际正全面招募海淘商家入驻,其中针对生活或来往境...
02-18
2月8日消息,据Tech星球消息,美团近期启动个人摄影师招募计划,现阶段招募的是人像摄影师,服务类型包含婚恋类、宴会类和景点跟拍类等,摄影师向平台交付2000元押金后,无需营业执照,即...
02-09
今年以来,白酒市场“控货潮”不断,近期,习酒也加入了控货行列。2月20日,有市场消息称贵州习酒销售有限责任公司发布公告,根据窖藏系列...
02-22
第二家站在“镍王”巨人肩膀上的IPO要来了!近日,麦田能源股份有限公司(以下简称“麦田能源”)在浙江证监局办理辅导备案登记,辅导机构国泰君安。而这是...
02-07
近日,智算时代云计算基础软件企业上海云轴科技股份有限公司(以下简称“云轴科技 ZStack”)在当前经济形势与资本市场复杂多变的环境中突围,成功获得北...
02-07
外媒发现北美娱乐软件分级委员会(ESRB)官网出现了《生化危机6》的分级,分级信息为成人级(M),登陆平台为Xbox Series。 《生化危机6》最初于2012年10月发售,登陆了PS...
01-22
一款名为《GrandTaking Ages VI》的游戏此前上架了索尼的 PlayStation 商店。显而易见,游戏的简写与即将推出的《GTA6》一模一样,显然是一款碰瓷的游戏。目前,这...
01-24
外交部发言人宣布:应国家主席习近平邀请,巴基斯坦伊斯兰共和国总统阿西夫·阿里·扎尔达里将于2月4日至8日对中国进行国事访问。...
02-03
“买短乘长”致使列车超载,今年春运又出现了。据媒体报道,近期有列车经过河南信阳时,因一些旅客未在票面到达站下车造成超员,导致部分正常购票旅客没能上车。经过铁路部门协调安...
02-10
1月16日,记者从宁波华仪宁创智能科技有限公司获悉,该公司研制的单细胞代谢物分析质谱仪近日入选浙江省经济和信息化厅、浙江省财政厅印发的《2024年...
01-21
  中国旅游研究院发布的报告显示  这个冰雪季,出游人次有望达5.2亿  核心阅读  感受刺激...
01-23
  为确保财政支农政策落实到位,省财政厅会同省农业农村厅早谋划、早安排、早部署,分析研判各地任务安排...
02-05
  免签政策试行两月来,上海的韩国入境游客订单同比增长超2倍――  “周五下班去中国”,韩国人为何热衷游上海  阅读提示  因包容性好、服务水准高和语言障碍低等,上海...
01-21
  加州又起大火:事发全球最大储能电厂,有数万块电池,马斯克急辟谣  澎湃新闻记者 贺梨萍  当地时间1月16日下午,美国加利福尼亚州莫斯兰丁(Moss Landing)储能电厂发生火灾...
01-21
1 月 21 日消息,在经过漫长的等待后,特斯拉终于开始要为安卓手机引入超宽带(Ultra-wideband,简称 UWB)技术支持了。这一技术将显著提升手机的定位精度,从而为用户带来更多...
01-21
2 月 3 日消息,近年来随着汽车辅助驾驶技术的不断发展,越来越多的司机依赖这些系统来减轻驾驶负担,有些人甚至在某些情况下完全放手不管,然而这种行为相当危险,极易引发...
02-04
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮