GPT-5上线遭“滑铁卢”!OpenAI宣布:重新上线GPT-4o

2周前 来源: 观看:10

  GPT-5上线遭“滑铁卢”!OpenAI宣布:重新上线GPT-4o!奥尔特曼发声61p即热新闻——关注每天科技社会生活新变化gihot.com

  8月8日,ChatGPT-5上线后,不少用户发现OpenAI停用GPT-4o版本,引发巨大争议。社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼“还我GPT-4o”。61p即热新闻——关注每天科技社会生活新变化gihot.com

  面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用,若需多平台使用,用户可在ChatGPT网页版设置中启用“显示旧版模型”访问GPT-4o。与此同时,下周还将推出迷你版GPT-5和GPT-5 thinking。61p即热新闻——关注每天科技社会生活新变化gihot.com

  OpenAI首席执行官萨姆・奥尔特曼同样在X平台上连发两条推文,回复下线GPT-4o与GPT-5上线带来的争议。61p即热新闻——关注每天科技社会生活新变化gihot.com

  奥尔特曼坦言,低估了用户对GPT-4o的喜爱程度,并表示这强化了公司为不同用户提供定制化服务的理念,未来将推出比当前更多的定制化内容。同时,其宣布将允许Plus用户继续使用GPT-4o,并将密切关注用户使用情况,考虑旧版本模型的保留期限。61p即热新闻——关注每天科技社会生活新变化gihot.com

  针对用户对GPT-5的负面反馈,奥尔特曼解释称,这是由于自动切换器损坏,致使GPT-5表现异常。他表示,未来将专注于完成GPT-5的部署与改进,并确保其稳定性。61p即热新闻——关注每天科技社会生活新变化gihot.com

  奥尔特曼同时透露,GPT-5上线后,ChatGPT API流量在24小时内翻倍增长,OpenAI正在全力优化系统并寻找更多的容量。但他坦言,预计下周仍将面临严峻的容量挑战。61p即热新闻——关注每天科技社会生活新变化gihot.com

  用户对GPT-5的“吐槽”,主要集中在新模型虽提升了回答的专业度,但却缺少了情感交互的温度、个性及想象力。61p即热新闻——关注每天科技社会生活新变化gihot.com

  据每日经济新闻,在8月7日的发布会上,奥尔特曼曾用三个生动的身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的“博士级专家”,能够随时助力用户达成各种复杂目标。61p即热新闻——关注每天科技社会生活新变化gihot.com

  OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。61p即热新闻——关注每天科技社会生活新变化gihot.com

  为了减少备受诟病的“幻觉”问题,GPT-5还引入了更严格的事实核查与内容过滤机制。具体来看,在联网搜索时,GPT-5的事实错误概率比GPT-4o低约45%;独立思考时,出错概率比o3模型低约80%;在开放式事实性基准测试中,产生“幻觉”的数量更是比o3模型少了约六分之五。61p即热新闻——关注每天科技社会生活新变化gihot.com

  OpenAI在发布会上特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。61p即热新闻——关注每天科技社会生活新变化gihot.com

  Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:“GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。”但他随即话锋一转:“然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。”61p即热新闻——关注每天科技社会生活新变化gihot.com

  从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。61p即热新闻——关注每天科技社会生活新变化gihot.com

  “GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。”AI营销与销售专家、太和智库研究员唐兴通在接受每经记者采访时分析指出,“我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。”61p即热新闻——关注每天科技社会生活新变化gihot.com

  他认为,AI的发展正面临两大物理限制:“我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。”61p即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-12205-0.htmlGPT-5上线遭“滑铁卢”!OpenAI宣布:重新上线GPT-4o

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:娃哈哈砍掉年销300万以下经销商,部分并入大经销商引发款项纠纷

下一篇:百果园董事长回应水果太贵:不会迎合消费者,在教育消费者成熟

为你推荐
  多地表态节俭办春节:灯笼不再满树挂,翻新改造旧设施  “如果要在街道绿化树悬挂红灯笼的话,不要往年一样满树单个悬挂,这种悬挂方式过于粗暴缺乏形式感,显得零乱又浪费材料...
01-21
  中新经纬1月17日电 国务院国资委企业改革局局长林庆苗表示,将继续开展新公司组建、加大力度推进战略性重组。  17日,国新办举行“中国经济高质量发展成效”系列新闻发布...
01-21
1月11日,“智享成双 純粹尽兴”领克纯电试驾会暨Z20首批车主交车仪式在南京云水涧举行。众多领克汽车的忠实粉丝、准车主和媒体共同见证领克Z20这款“智趣驾享纯电SUV”在南...
01-21
1 月 23 日消息,从国家市场监督管理总局获悉,我国联合德国、日本、韩国、英国等国共同研制的多项智能网联汽车国际标准提案在国际标准化组织(ISO)成功立项,包括 4 项驾驶...
01-24
电视剧《香草的每天》自开拍以来就受到了众多粉丝的关注。这次播出更是让许多粉丝激动不已,尤其是对于第20集的剧情介绍,大家都充满了好奇。在第20集中,白井向...
02-20
《我们的浪漫电影》播出后,在抖音、微博和B站等平台上引起了广泛讨论,尤其是第2集的剧情介绍成为了观众们热议的话题。今天我们就来聊聊这一集的内容。高谦没...
02-22
21世纪经济报道记者 韩利明 上海报道2024年,对于中国生物医药企业而言,似乎尚未走出“资本寒冬”。医药魔方数据显示,中国医疗健康领域一级市...
02-06
  ――医保、药监部门就集采药品问题答记者问  本报记者 孙秀艳  今年1月,有专家认为某些集采药品可能存在“血压不降、麻药不睡、泻药不泻”质量风险,有关部门迅...
02-11
近日,西北政法大学官网“现任领导”栏目更新信息显示,赵万东已任西北政法大...
01-21
距离2025年国考笔试仅剩6天各位考生注意11月25日0:00至12月1日15:00要按时打印准考证哦打印流程>>>①报...
01-21
  中国证券报记者1月26日获悉,国家金融监督管理总局近日已批复开展第二批保险资金长期股票投资...
02-05
      今日,A股市场即将迎来节后首个交易日。隔夜,热门中概股多数上涨,纳斯达克中国金龙指数...
02-05
射手座的男生通常热情开朗,喜欢自由自在的生活。但有时候,他们可能会表现出一些冷淡的态...
01-22
在星空下,有一种神秘而强大的力量,它能够让两个人命中注定相遇。这种力量就是星座。而当...
01-22
小小模特的梦想舞台:CIP国际少儿模特T台走秀揭秘在璀璨的时尚界,模特的身影总是让人心驰神往。不过,当我们谈到模特时,脑海中浮现的往往是那些身材高挑的成年模特。在这里,我想分...
02-17
中国服饰品牌历史? 中国男装之都?中国服饰品牌历史?中国服饰文化源远流长、独具特色,古时也一直以“衣冠上国”和“礼仪之邦”著称于世。服饰是文化的一部分,在中华民族上下五千...
02-17
1.拼多多加大对短剧领域的投入拼多多向短剧领域发起了春节攻势。据了解,拼多多近期更新并发布了两项针对短剧领域的新政策。一是“新版多多有好剧计划”,作为对旧版计划的升级...
02-07
2月7日消息,转转集团数据显示,春节期间,其回收业务、线上App与线下门店订单量分别增长 40%、71%、52%。新春焕新潮带动了二手回收市场的繁荣。转转平台布局了生活家电、乐器玩...
02-08
2月9日消息,文化和旅游部近日公布2024年全国智慧旅游十佳解决方案和2024年全国智慧旅游优秀解决方案名单。“携程入境游景区融合服务平台解决方案”脱颖而出,荣获十佳解决方案...
02-09
2月21日消息,银联国际日前与阿联酋本地转接网络Al Etihad Payments(AEP)签署合作协议,双方将在阿联酋当地共同推动发卡行发行“银联-Jaywan”双品牌卡,提升当地居民日常消费、跨...
02-22
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
在当今社会,随着老龄化进程的加速,银发经济正展现出前所未有的活力与潜力。这一趋势不仅反映了老年人口规模的不断扩大,更体现了老年人对高品质生活的追求与消费能力的显著提升...
02-09
今日(1月21日),roguelike游戏《Ragnar》Steam页面上线,游戏支持简繁体中文,发售日待定,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 在这款受北欧神话启发...
01-22
大坝年久大清扫,直接扫干净完事?那就浪费了,之前日本佐贺县就给常年积累苔藓以及赃物的大坝来了场特殊清扫,原本一年只有300个游客来看看大坝,现在变成了月活游客暴...
02-10
随着电影《哪吒之魔童闹海》热映,“哪吒”系列导演饺子也走进了大众视野,大家对这位“半路出家”的“细节控”颇感兴趣,在一些饺子接受媒体采访的视频片段下,总能看到不少网友的...
02-08
2月9日,哈尔滨亚冬会速度滑冰男子5000米决赛,中国队包揽金银铜牌。吴宇夺得金牌,刘瀚彬获得银牌,哈那哈提·木哈买提获得铜牌。...
02-09
1月16日,记者从宁波华仪宁创智能科技有限公司获悉,该公司研制的单细胞代谢物分析质谱仪近日入选浙江省经济和信息化厅、浙江省财政厅印发的《2024年...
01-21
1月20日,我国首款起飞重量5.25吨、最大载重1.9吨的大型无人机鸿雁(HY100)在新疆石河子市天域航通石河子生产基地成功实现量产下线,其中3架顺利向客户完...
01-21
  一场降雪,光顾辽沈大地,“兆丰年”的同时,也为归乡人的安全畅行带来了些许麻烦。辽宁交投高速运营公司...
01-27
1月27日早晨,在沈阳市和平区南一马路,机械设备正在进行除雪作业(央广网记者 李子平 摄)  央广网沈阳1月...
01-29
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮