GPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

4个月前 来源: 观看:60

27b即热新闻——关注每天科技社会生活新变化gihot.com

▲OpenAI发布其最新人工智能模型GPT-5。图/IC photo27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

GPT-5终于来了,但比所有人的预期都要晚。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

据新华社报道,美国开放人工智能研究中心(OpenAI)8月7日发布其最新人工智能模型GPT-5。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

从2023年3月GPT-4横空出世之后,不少人曾认为,当年下半年GPT-5就可以出来。但这一等,就是2年多的时间。期间,OpenAI推出了其他众多以奇奇怪怪方式命名的大模型,复杂得让用户在选择时,都犯了选择困难症。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

虽然不少媒体对这次发布会给予了积极评价,但从更广泛视角看,与其说这是OpenAI的一次技术展示,不如说是OpenAI和奥尔特曼不得不举办的一场发布会。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI的升级与失落27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

从发布会来看,OpenAI给出的GPT-5卖点很清晰:更强、更稳、更便宜、更好用。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

“更强”,是OpenAI一贯的特色。每一次GPT系列产品出来,总要在模型能力上来个“屠榜”,这次也不例外。OpenAI官方数据显示,GPT-5在多项基准测试中创下新纪录,包括数学、编程、多模态理解和健康等领域。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

不仅如此,GPT-5采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根据不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。也就是“简单问题快答,复杂问题拉长思考”,这样的使用体验,比把不同子模型硬塞给用户选择更自然。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

此外,达到400K的超长上下文能力,也是GPT-5值得一提的改进。这对长文档检索与跨文件代码修改更友好,虽然相比Gemini 1M(谷歌旗下产品)的上下文量还有距离,但于其他对手而言,已算是领先一步。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

“更稳”,针对的是AI大模型普遍存在的“幻觉”问题。OpenAI官方反复强调,GPT-5在事实性与安全性上比前代显著进步:更少的幻觉、更少的“编理由”“迎合性回答”,在“该不知道的时候更愿意承认不知道”。这既是对过去一年里“推理模型幻觉陡增”的纠偏,也是面向企业落地的现实诉求。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

“更便宜”,则是这次更具杀伤力的一点。GPT-5在编程能力大幅度提升的情况下,其API(应用程序编程接口)价格却比8月5日刚发布的Claude Opus 4.1更便宜,同时也比Gemini 2.5 Pro价格低。这可以说是对Anthropic(美国人工智能初创公司)的致命一击。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

要知道,OpenAI作为这一领域的前沿公司,过去是它做什么,大家做什么;但现在,这种趋势正在被Anthropic取代。比如编程能力、幻觉抑制、安全,以及MCP等都属于Anthropic,而OpenAI最擅长的就只剩下“屠榜”和营销了。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

所以,这次OpenAI把GPT-5系列的价格定得很低,与主打高强度推理与编码的Claude Opus 4.1相比,足足有一个数量级的差距,显然就不仅仅是象征性的实惠,而是为了实实在在改变开发团队的选择。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

这其实也解释了,为什么Anthropic会在日前公开指责OpenAI违反服务条款,切断OpenAI对Claude(Anthropic发布的大型语言模型家族)系列AI模型的API访问权限。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

“更好用”,就是让用户不用再为选择什么模型而苦恼。过去那些乱七八糟的命名模型,反映的不仅是GPT-5迟迟无法达到预期目标的结果,也大大降低了用户的使用体验。基本上没有其他产品像GPT一样,存在如此多不同命名的模型。这次GPT-5推出之后,终于实现了“大一统”,其他所有大模型统统消失,只剩下GPT-5系列产品。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

营销大师的尴尬27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

但GPT-5的这些进步,显然不可能是颠覆性的,只能算是技术上的“小步快跑”,离所谓的AGI(通用人工智能)显然还有相当大的距离。甚至可以说,GPT-5在这个时候发布,很大程度上是因为OpenAI和奥尔特曼不得不举办。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

作为出了名的“营销大师”,早在几个月前开始,关于GPT-5的消息、截图总是不时出现在社交平台上。奥尔特曼在接受媒体采访时感叹自己能力不如GPT-5,甚至为AI的发展将超出现有监管能力而担忧。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

在发布会的前一天,一些渠道上还有各种“提前走漏风声”,让大家对这场发布会的预期拉得很高——这会是一场再次改变游戏规则与行业走向的发布会?27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

但发布会过后,外界对OpenAI的模型能力评价却出现了下滑,有的甚至充满了失望。这场发布会的实际演示与讲述,更像一场“产品化与可用性升级”的汇报——重要,但不惊艳。更别说那些被网友抓包的PPT错误了。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

但不管如何,对于OpenAI和奥尔特曼,这却是一场不得不举办的发布会。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

首先是因为,GPT-5已一再爽约。外界两年多来的等待,以及中间各种传闻和暗示,已经把时间窗口压得很窄。如果再不发布GPT-5,恐怕后续OpenAI的叙事方式,就要从“我们在引领”变成“我们为什么还没发布”。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

27b即热新闻——关注每天科技社会生活新变化gihot.com

▲GPT-5主打“更强、更稳、更便宜、更好用”卖点。图/IC photo27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

竞争压力也是看得见摸得着。在Anthropic、Google、Meta(脸书)、xAI(马斯克成立的人工智能公司)以及中国一众大语言模型公司的激烈竞争下,OpenAI在业内的优势已经越来越不明显了。就在这次发布会之前,Anthropic把Claude Opus 4.1的编码表现又往上推了一截;过去一年里,Claude系在长程专注、复杂代码重构上的口碑持续攀升。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

除了具体的模型能力之外,AI人才战也愈演愈烈。从2024年的OpenAI安全团队离职潮,到今年多份人才报告显示的流向Anthropic的净迁移,再到Meta开出天价薪酬到处挖人,这些都对OpenAI产生了巨大的压力。OpenAI既要保持住自己的优势与吸引力,同时也要稳住团队士气。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

所以,从这一点来看,其实也就非常好理解了,为何这次发布会上,OpenAI主打的是“更强、更稳、更便宜、更好用”的卖点组合了。换句话说,当价格战成为OpenAI应对强劲对手的武器时,就可以清清楚楚地感受到,这家一直以来以技术领先为核心定义的公司,其实面临着怎样的巨大压力。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

因此,更便宜的价格,既是这场发布会令人意外的最大亮点,却也是令人叹息的地方。而当先行者变得务实,也许才是技术快速发展期结束的最明显标志。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

AI狂飙时代的结束?27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

在营销大师奥尔特曼主导下的这场发布会,出乎意料地变得很实在。它没有承诺AGI的到来,也没有宣布颠覆式的新能力,而是把稳定性、安全性、价格、默认可用放在C位——这些恰恰是平台期最值得押注的要素。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

同时,这也反映OpenAI在变慢,AI行业整体也在变慢的现实。所以,未来AI行业恐怕在短期之内,很难会像此前GPT横空出世一样,带给公众巨大的颠覆感和震撼感。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

从GPT-4.5(Orion)项目的失败,就已经让大家看到了参数Scaling Law(规模定律)逐渐放缓的迹象。一个典型的例子是,即使是用了10倍算力强化学习的Grok-4,表现也不算特别惊艳。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

正如有分析认为,当前的评估基准正在接近饱和,“基本上就像看高中生做初中题目”。当所有模型都能在现有测试中取得90%以上的分数时,这些数字还有多大意义?27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

低垂的果实已经摘完了。那堵看不见的AI增长之墙,也就变得越发明显。整个行业都需要新的突破——可能是架构上的创新,可能是训练方法的革命,也可能是我们还未想到的全新方式。只是,这个突破何时到来、以何种形式到来,已经变得难以预测。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

所以,某种意义上来说,GPT-5的发布,既标志着OpenAI逐渐变慢的开始,也预示整个AI行业,将从过去的“奇迹时代”走入“平凡时代”。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI曾经是那个定义游戏规则的先行者,现在却不得不在一场并不完美的发布会上,用价格战来守住阵地。这不仅是OpenAI的转折点,也可能是整个AI行业的分水岭。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

因此,GPT-5远不是AGI产品。而通向AGI的道路,也可能将远比我们想象的要长得多。27b即热新闻——关注每天科技社会生活新变化gihot.com


27b即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 新京智库高级研究员 郑伟彬27b即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 马小龙27b即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 王心27b即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-3145-0.htmlGPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:排除杂念,才能奔着最好去!

下一篇:50%关税,撕去了美印温情脉脉的面纱 | 新京报专栏

为你推荐
  1、《难哄》温以凡经历了父亲重病去世,母亲改嫁,自己在大伯家过着寄人篱下的生活,还被大伯的亲戚猥亵欺负。  2、这些不幸的经历都对温以凡的性格产生了很大的影响,她变...
02-15
温以凡桑延是什么小说?温以凡为什么叫温霜降?温以凡和桑延是小说《难哄》中的主要角色。‌这部小说由竹已创作,讲述了温以凡和桑延之间的爱情故事。温以凡回到...
02-19
  “到了儿童季节性疾病高发期,部分医院的就诊等候时间还是比较长;还有一些地方儿童疾病的诊断和治疗能力有待提升。”在1月20日国家卫生健康委举行的新闻发布会上,国...
01-21
  探访教育部定点帮扶河北青龙乡村振兴现场  河北科技师范学院教授张京政向青龙县五道沟村...
01-21
(华商网讯 华商小记者李佳泽)10月1日,华商网组织童学会的小记者们前往宝鸡吉利汽车制造基地,参观学习。抵达目的地后,小记者们首先齐聚于礼堂之中,聆听吉利员工细致入微地介绍工...
01-21
  近日,中国太平保险集团有限公司在香港成功发行了亚洲首只采用双风险、双触发机制的巨灾债券...
01-21
  近日,多家消费金融公司围绕春节购物、出行、旅游等消费需求,打造多样化服务和优惠举措,推出满...
01-24
天蝎男和射手女是两个星座中性格截然不同的代表,他们之间的配对一直备受关注。那么,究竟...
01-22
天蝎座男生以其神秘、深沉的性格而闻名,他们对感情非常专一,善于保护自己和所爱的人。然...
01-22
北京时尚潮胖子服饰:穿出个性与自信在北方的气候里,冬天的衣物需要保暖,夏天则需要清凉。而对于胖子们来说,选择一套合适的服饰不仅要考虑到舒适度,更要能够展现个人的魅力。作为...
02-07
紧身裤模特T台走秀:时尚界的惊艳瞬间每当我走进时尚秀场,看到模特们在T台上自信地步伐,我的心中总是涌起一种莫名的激动。尤其是当紧身裤作为一个重要的时尚单品登上T台时,那种...
02-17
会员数两年增长十倍。1、1688 PLUS会员数已突破千万没想到,阿里1688会这么猛。根据阿里巴巴1688最新的数据,截至2024年12月底,1688PLUS付费会员数量已突破1000万大关。值得注意...
02-07
2月9日消息,为满足消费者对品质家居好物的需求,京东“潮品家”频道升级上线,汇聚百大国际、原创家具品牌,精选时下流行的家具精品、宝藏店铺、风格趋势及热门榜单,为消费者打造一...
02-09
2月11日消息,e代驾大数据中心发布了《2025年“蛇年”春节代驾趋势报告》。报告显示,自1月14日春运开始截至目前,酒后代驾需求同比去年上涨23%。北京、上海、广州、深圳、成都、...
02-11
2月10日消息,滴滴出行近日宣布携手华住集团会员俱乐部“华住会”,推出联名会员,双方在既有会员权益基础上新增联名会员权益合作,为用户的出行、住宿提供多重优惠与专享体验,方便...
02-11
春节假期刚刚结束,各行各业的企业已经紧锣密鼓进入新年开工季。俗话说“兵马未动,粮草先行”,各类物资的及时就位是企业顺利开工的重要保障。为了更好地助力企业顺利开工,京...
02-09
国家统计局近日公布的2024年国民经济运行数据显示,2024年全国社会消费品零售总额48.7895万亿元,比上年增长3.5%;全国网上零售额15.5225万亿元,增长7.2%。过去一年,增量政策...
02-09
快科技今日(1月23日)消息,前几天中国台湾嘉义大埔地区发生里氏6.4级浅层地震,此次地震对台南科学园区的部分半导体工厂造成了影响。 据媒体报道,台积电位于台南的...
01-24
近日,PlayStation Network(PSN)遭遇严重宕机,至今已超过24小时未恢复正常服务,导致全球玩家无法访问在线内容,甚至连单人数字游戏也受到影响。这一事件迅速在社交媒...
02-10
当地时间2月2日,美国华盛顿消防部门表示,已确定两机相撞事故中55名遇难者的身份。当地时间1月29日,一架美国国内支线客机在罗纳德·里根华盛顿国家机场同一架美军直升机在半空...
02-03
极目新闻记者 陈凌燕绘图 刘阳嗖地一下,年过完了。那么问题来了,说了那么多“新年快乐”,么样才能过好2025年?莫焦燥学会慢点嘎,冇得事嘀嘀嗒:我今年有个重要的计划,我要学会慢下来...
02-06
1月13日,由浙江大学杭州国际科创中心(以下简称“科创中心”)人形机器人创新研究院联合镜识科技有限公司、杭州凯达尔焊接机器人股份有限公司研发的四...
01-21
你胖吗?一份最新报告或许会改变你现在的答案。1月15日,《柳叶刀·糖尿病与内分泌学》发布重大报告。该报告由全球75个医疗组织支持,参与撰写的5...
01-21
  中新社武汉1月13日电(记者梁婷)记者13日从湖北省文物事业发展中心获悉,荆州唐宋考古获新发现...
01-22
  作者:乔忠延(山西省散文学会名誉会长)  巨龙腾飞,金蛇狂舞,欢歌笑语中,又一个蛇年即将来到。 ...
01-24
财联社1月21日讯(记者 王宏)昨日晚间离岸人民币兑美元持续拉升,接连收复7.31、7.30、7.29、7.28、7.27关口,日内涨近750点。业内分析指出,当前特朗普对贸易政策的最新表态有所缓...
01-21
深谙电商平台使用法则的消费者,在看中一款商品后,往往会截图、识别,同款产品的不同价格呈现眼前,几番对比后,为最低价买单。 若再细心...
01-21
1 月 24 日消息,比亚迪汽车昨晚宣布,旗下新能源豪华智能皮卡 ——BYD SHARK 正式登陆厄瓜多尔市场。▲ 图源:比亚迪比亚迪表示,新车外观灵感源自鲨鱼的灵动与霸气,改变传...
01-24
[本站 资讯] 日前,我们获取了一组星途揽月C-DM电四驱的实车图。新车定位中大型SUV,将搭载1.5T插混动力以及电动四驱系统,有6座版和7座版可选。外观来看,新车配备大尺寸进...
01-24
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮