GPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

9个月前 来源: 观看:104

JAN即热新闻——关注每天科技社会生活新变化gihot.com

▲OpenAI发布其最新人工智能模型GPT-5。图/IC photoJAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

GPT-5终于来了,但比所有人的预期都要晚。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

据新华社报道,美国开放人工智能研究中心(OpenAI)8月7日发布其最新人工智能模型GPT-5。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

从2023年3月GPT-4横空出世之后,不少人曾认为,当年下半年GPT-5就可以出来。但这一等,就是2年多的时间。期间,OpenAI推出了其他众多以奇奇怪怪方式命名的大模型,复杂得让用户在选择时,都犯了选择困难症。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

虽然不少媒体对这次发布会给予了积极评价,但从更广泛视角看,与其说这是OpenAI的一次技术展示,不如说是OpenAI和奥尔特曼不得不举办的一场发布会。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI的升级与失落JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

从发布会来看,OpenAI给出的GPT-5卖点很清晰:更强、更稳、更便宜、更好用。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

“更强”,是OpenAI一贯的特色。每一次GPT系列产品出来,总要在模型能力上来个“屠榜”,这次也不例外。OpenAI官方数据显示,GPT-5在多项基准测试中创下新纪录,包括数学、编程、多模态理解和健康等领域。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

不仅如此,GPT-5采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根据不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。也就是“简单问题快答,复杂问题拉长思考”,这样的使用体验,比把不同子模型硬塞给用户选择更自然。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

此外,达到400K的超长上下文能力,也是GPT-5值得一提的改进。这对长文档检索与跨文件代码修改更友好,虽然相比Gemini 1M(谷歌旗下产品)的上下文量还有距离,但于其他对手而言,已算是领先一步。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

“更稳”,针对的是AI大模型普遍存在的“幻觉”问题。OpenAI官方反复强调,GPT-5在事实性与安全性上比前代显著进步:更少的幻觉、更少的“编理由”“迎合性回答”,在“该不知道的时候更愿意承认不知道”。这既是对过去一年里“推理模型幻觉陡增”的纠偏,也是面向企业落地的现实诉求。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

“更便宜”,则是这次更具杀伤力的一点。GPT-5在编程能力大幅度提升的情况下,其API(应用程序编程接口)价格却比8月5日刚发布的Claude Opus 4.1更便宜,同时也比Gemini 2.5 Pro价格低。这可以说是对Anthropic(美国人工智能初创公司)的致命一击。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

要知道,OpenAI作为这一领域的前沿公司,过去是它做什么,大家做什么;但现在,这种趋势正在被Anthropic取代。比如编程能力、幻觉抑制、安全,以及MCP等都属于Anthropic,而OpenAI最擅长的就只剩下“屠榜”和营销了。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

所以,这次OpenAI把GPT-5系列的价格定得很低,与主打高强度推理与编码的Claude Opus 4.1相比,足足有一个数量级的差距,显然就不仅仅是象征性的实惠,而是为了实实在在改变开发团队的选择。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

这其实也解释了,为什么Anthropic会在日前公开指责OpenAI违反服务条款,切断OpenAI对Claude(Anthropic发布的大型语言模型家族)系列AI模型的API访问权限。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

“更好用”,就是让用户不用再为选择什么模型而苦恼。过去那些乱七八糟的命名模型,反映的不仅是GPT-5迟迟无法达到预期目标的结果,也大大降低了用户的使用体验。基本上没有其他产品像GPT一样,存在如此多不同命名的模型。这次GPT-5推出之后,终于实现了“大一统”,其他所有大模型统统消失,只剩下GPT-5系列产品。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

营销大师的尴尬JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

但GPT-5的这些进步,显然不可能是颠覆性的,只能算是技术上的“小步快跑”,离所谓的AGI(通用人工智能)显然还有相当大的距离。甚至可以说,GPT-5在这个时候发布,很大程度上是因为OpenAI和奥尔特曼不得不举办。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

作为出了名的“营销大师”,早在几个月前开始,关于GPT-5的消息、截图总是不时出现在社交平台上。奥尔特曼在接受媒体采访时感叹自己能力不如GPT-5,甚至为AI的发展将超出现有监管能力而担忧。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

在发布会的前一天,一些渠道上还有各种“提前走漏风声”,让大家对这场发布会的预期拉得很高——这会是一场再次改变游戏规则与行业走向的发布会?JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

但发布会过后,外界对OpenAI的模型能力评价却出现了下滑,有的甚至充满了失望。这场发布会的实际演示与讲述,更像一场“产品化与可用性升级”的汇报——重要,但不惊艳。更别说那些被网友抓包的PPT错误了。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

但不管如何,对于OpenAI和奥尔特曼,这却是一场不得不举办的发布会。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

首先是因为,GPT-5已一再爽约。外界两年多来的等待,以及中间各种传闻和暗示,已经把时间窗口压得很窄。如果再不发布GPT-5,恐怕后续OpenAI的叙事方式,就要从“我们在引领”变成“我们为什么还没发布”。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

JAN即热新闻——关注每天科技社会生活新变化gihot.com

▲GPT-5主打“更强、更稳、更便宜、更好用”卖点。图/IC photoJAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

竞争压力也是看得见摸得着。在Anthropic、Google、Meta(脸书)、xAI(马斯克成立的人工智能公司)以及中国一众大语言模型公司的激烈竞争下,OpenAI在业内的优势已经越来越不明显了。就在这次发布会之前,Anthropic把Claude Opus 4.1的编码表现又往上推了一截;过去一年里,Claude系在长程专注、复杂代码重构上的口碑持续攀升。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

除了具体的模型能力之外,AI人才战也愈演愈烈。从2024年的OpenAI安全团队离职潮,到今年多份人才报告显示的流向Anthropic的净迁移,再到Meta开出天价薪酬到处挖人,这些都对OpenAI产生了巨大的压力。OpenAI既要保持住自己的优势与吸引力,同时也要稳住团队士气。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

所以,从这一点来看,其实也就非常好理解了,为何这次发布会上,OpenAI主打的是“更强、更稳、更便宜、更好用”的卖点组合了。换句话说,当价格战成为OpenAI应对强劲对手的武器时,就可以清清楚楚地感受到,这家一直以来以技术领先为核心定义的公司,其实面临着怎样的巨大压力。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

因此,更便宜的价格,既是这场发布会令人意外的最大亮点,却也是令人叹息的地方。而当先行者变得务实,也许才是技术快速发展期结束的最明显标志。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

AI狂飙时代的结束?JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

在营销大师奥尔特曼主导下的这场发布会,出乎意料地变得很实在。它没有承诺AGI的到来,也没有宣布颠覆式的新能力,而是把稳定性、安全性、价格、默认可用放在C位——这些恰恰是平台期最值得押注的要素。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

同时,这也反映OpenAI在变慢,AI行业整体也在变慢的现实。所以,未来AI行业恐怕在短期之内,很难会像此前GPT横空出世一样,带给公众巨大的颠覆感和震撼感。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

从GPT-4.5(Orion)项目的失败,就已经让大家看到了参数Scaling Law(规模定律)逐渐放缓的迹象。一个典型的例子是,即使是用了10倍算力强化学习的Grok-4,表现也不算特别惊艳。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

正如有分析认为,当前的评估基准正在接近饱和,“基本上就像看高中生做初中题目”。当所有模型都能在现有测试中取得90%以上的分数时,这些数字还有多大意义?JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

低垂的果实已经摘完了。那堵看不见的AI增长之墙,也就变得越发明显。整个行业都需要新的突破——可能是架构上的创新,可能是训练方法的革命,也可能是我们还未想到的全新方式。只是,这个突破何时到来、以何种形式到来,已经变得难以预测。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

所以,某种意义上来说,GPT-5的发布,既标志着OpenAI逐渐变慢的开始,也预示整个AI行业,将从过去的“奇迹时代”走入“平凡时代”。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI曾经是那个定义游戏规则的先行者,现在却不得不在一场并不完美的发布会上,用价格战来守住阵地。这不仅是OpenAI的转折点,也可能是整个AI行业的分水岭。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

因此,GPT-5远不是AGI产品。而通向AGI的道路,也可能将远比我们想象的要长得多。JAN即热新闻——关注每天科技社会生活新变化gihot.com


JAN即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 新京智库高级研究员 郑伟彬JAN即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 马小龙JAN即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 王心JAN即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-3145-0.htmlGPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:排除杂念,才能奔着最好去!

下一篇:50%关税,撕去了美印温情脉脉的面纱 | 新京报专栏

为你推荐
近期,电视剧《难哄》在各大短视频平台爆火,剧中苏浩安的官配成为追剧党热议的话题。大家都对苏浩安和钟思乔的感情线充满兴趣。《难哄》这部电视剧中,苏浩安和...
02-20
在璀璨的娱乐圈内,何炅以其非凡的主持才能与温文尔雅的气质,一直备受推崇。然而,近日他再次以惊人的健康状态吸引了公众的广泛关注。步入天命之年的何炅,在综艺节目《你好星期六...
02-22
21世纪经济报道记者 李佳英 广州报道 近日,不少人在社交平台上分享称,在食用了一定数量的车厘子后,出现了腹泻、呕吐等症状。这些描述迅速在...
01-21
澎湃新闻记者从中国科学院大学资源与环境学院方面获悉,中国科学院大学资...
01-21
距离2025年国考笔试仅剩6天各位考生注意11月25日0:00至12月1日15:00要按时打印准考证哦打印流程>>>①报...
01-21
  银行业理财登记托管中心近日发布《中国银行业理财市场年度报告(2024年)》(简称《报告》)。《报...
01-22
  摘要  【每日龙虎榜】豆油增仓近8万手,烧碱减仓2万余手,日内资金净流入86.15亿元。一文带你...
02-08
射手座的男生通常热情开朗,喜欢自由自在的生活。但有时候,他们可能会表现出一些冷淡的态...
01-22
狮子座的男生通常都有着强烈的个人魅力和自信心,他们喜欢成为众人关注的焦点。当狮子男...
01-22
秋季穿搭,怎么搭配才时尚有范儿?对于女性来说,秋冬季的衣服不用天天换。用一衣多穿的穿搭方式,搭配出时尚的感觉来。可同时一衣多穿还有很多搭配的小技巧,可以让你把一件普通平凡...
02-12
贵牛服饰品牌怎么样? uc品牌女装贵吗?贵牛服饰品牌怎么样?上海贵牛贸易有限公司成立于2013年, 总部设在广东省经济、 文化、贸易中心城市---广州市。是一家集生产、批发、销售...
02-12
2月11日消息,百果园近日在深圳举办了一场“蒲江耙耙柑好果报恩新季上市”快闪活动,百果园集团创始人兼董事长余惠勇、百果园集团零售事业群副总裁兼零售事业群商品中心总经理...
02-11
2月16日消息,春风送暖,甘蔗种植迎来关键时刻。中农网依托产业链优势,推动旗下广西易农通深入甘蔗种植环节,在南宁市武鸣区罗波镇板欧蔗区率先启动2025年5万亩甘蔗种植计划,通过数...
02-17
2月6日消息,交通部门预计,今年春运期间,自驾出行预计达到72亿人次,约占全社会跨区域人员流动量的八成,高速公路车流量单日峰值或创历史新高。全球自驾游平台租租车数据显示,春节期...
02-07
被业内称为“开店狂魔”的库迪咖啡正在频频试水新业态,以期实现门店规模的快速增长及门店收入的提升。 2月13日,库迪咖啡宣布推出新...
02-15
春雪食品集团股份有限公司(证券代码:605567)于2025年1月20日发布了2024年年度业绩预盈公告,预计实现归属于母公司所有者的净利润670.00万元至800.00万元,与上年同期相比成功扭亏...
01-21
近日,朴烯晶新能源材料(上海)有限公司(以下简称“朴烯晶”)完成数亿元B轮融资。本轮融资由国科东方领投,大零号湾策源基金、尚研莘工基金、民银国际跟投...
02-07
今日(2月11日),类银河战士恶魔城游戏《Haydee 3》Steam页面开放,2025年3月1日发售,暂不支持中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《Haydee II...
02-11
去年由Pocketpair打造的《幻兽帕鲁》在以抢先体验模式推出后,一度成为热门游戏,并且因为与《宝可梦》等游戏的内容相似性,而在2024年9月正式遭到任天堂与宝可梦公...
02-15
极目新闻通讯员 龚轩 “我的车定速巡航功能失效了,刹车也踩不动,怎么办?”2月1日凌晨5时11分,湖北省公安厅高警总队六支队指挥中心民警石路接到群众报警求助。情况紧急,石路立即...
02-02
中国第41次南极考察队 完成“环”国际合作计划航空调查当地时间1月19日,由自然资源部组织的中国第41次南极考察队顺利完成南极研究科学委员会(SCAR)南...
01-24
  至1月27日10时40分,经与交警部门协商,沈阳、葫芦岛、铁岭、锦州、大连、抚顺、盘锦、阜新、营口部分...
01-28
  来自公安部交通管理局的消息显示:春节期间(截至2月4日18时),全国道路交通安全形势总体平稳,未接...
02-05
泰国旅游安全信心下降之际,从旅游业内到社媒大众都在推测:三亚旅游将迎“泼天富贵”。 喧嚣背后,近期三亚旅游热度究竟如何?时代周报...
01-21
近日,在泰兴市清扬生态果园葡萄基地,务工人员正热火朝天地修剪葡萄树。该果园葡萄种植面积超八十亩,修剪工作已持续一周。果园业主陶伟介绍,修剪是为了让葡萄来年能长出花果,“不...
01-22
2 月 2 日消息,星纪魅族集团官方今日发文宣布,截至 2025 年 1 月,Flyme Auto 合作车型总销量超 49.8 万辆。据此前报道,Flyme Auto 2.0 版本车载软件系统将于今年 3 月...
02-02
2 月 5 日消息,今日丰田汽车公司宣布了一系列重大举措,一方面,丰田与上海市政府达成合作意向,将在上海金山区独资设立雷克萨斯纯电动汽车及电池的研发和生产公司;另一方...
02-05
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮