ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

11个月前 来源: 观看:98

o97即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。o97即热新闻——关注每天科技社会生活新变化gihot.com


o97即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)o97即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖o97即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利o97即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-7977-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
新闻记者 曹磊通讯员 王璐 吕巍在手机上登录各大外卖、团购、电商平台,搜索“江城百臻”,就能立即下单,10分钟至30分钟内就能够拿到最地道的武汉地理农产品。1月21日,新闻记者从...
01-21
在一些学校,毕业后选择工作的本科生越来越少了。过去几周,包括清华大学、北京大学、复旦大学等多所知名高校公布了 2023-2024 学年的本科教学质量报告,披露了包括毕业率、就...
01-21
1 月 27 日消息,特斯拉现已公布了旗下Model 3 / Y车型 2025 年 2月购车权益,其中焕新款 Model 3(2025 款)和旧款(2024 款)Model Y 车型可享限时5年0息分期购车方案,而焕新...
01-28
1 月 29 日消息,宝马公司推出了 2026 款 iX 中型 SUV,作为中期改款车型,此次改款不仅对车型阵容进行了调整,还对外观、内饰以及动力系统进行了优化升级。宝马 iX 自 202...
01-29
《余烬之上》廖知白是凶手吗?廖知白最后结局是什么?在《余烬之上》中,廖知白不能被简单认定为凶手。从主观动机与行为目的看:廖知白经历家庭惨变后,一心追求真相...
02-21
在娱乐圈这片星光璀璨的土地上,何炅以其深厚的主持功底和温文尔雅的形象,长久以来赢得了大众的广泛好评。而最近,这位年过半百的主持人又因一个意外的瞬间,成为了众人热议的焦点...
02-22
21世纪经济报道记者季媛媛 上海报道自1981年首例艾滋病病例报告以来,人类和艾滋病的抗争已持续40余年。时至今日,尚无可以根治艾滋病的药物,...
01-21
21世纪经济报道记者林昀肖 实习生苏洋 北京报道 2月6日,香雪制药发布《关于被债权人申请预重整的提示性公告》(以下简称《提示性公告》)。其...
02-09
  大众网记者 司心鹏 通讯员 刘振 盛凤娟 报道  近日,2024年职业院校技能大赛各赛项圆满收官,山东水利职业学院在本年度赛事中表现卓越,成绩斐然。在世界职业院校技能大...
01-21
为加强基层党组织建设,推进党建工作与中心工作融合发展,进一步提升应用型人才培养质量,经过辽宁石油化工大...
01-21
  原标题:盘点2024持牌消金(一)|行业进入纵深发展:头部“缩表”、腰部“赶超”,不良资产加速“甩卖...
01-22
  摘要  【纯碱:仍面临供需过剩格局】2024年,纯碱随着大投产逐步兑现,叠加光伏和浮法玻璃进入...
01-24
狮子座的男生通常都有着强烈的自尊心和自信心,他们很难接受失败或失去某个重要的人。当...
01-22
双子座的男生喜欢聪明、机智和有趣的人。他们对于细节非常敏感,因此如果你想要感动一个...
01-22
从高个子女明星看时尚与魅力:她们的独特风采如果你留意一下娱乐圈,时常会发现那些高个子女明星总是有着特别的魅力,无论是在红毯上还是日常生活中,她们的形象都能成为众人瞩目的...
02-12
男士衬衫搭配什么颜色的外套好看有图?首先推荐同时容易上身又好打理的单色衬衫一般有,牛津纺衬衫,青年布衬衫和牛仔衬衫。这三种面料够厚实不会软塌塌,单穿外搭都可以。最简单的...
02-17
阿里AI,蓄势待发。阿里巴巴再添AI猛将2025开年,阿里巴巴迎来一位AI牛人。据界面新闻,全球顶尖人工智能科学家许主洪(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C...
02-07
阿里将与苹果强强联手。在阿联酋迪拜举办的World Governments Summit 2025峰会上,阿里巴巴联合创始人、董事局主席蔡崇信回应阿里与苹果合作传闻,他表示,“苹果在中国需要一个...
02-14
1月中旬,经过近两个半小时的飞行,快乐的Haha跟随主人从武汉飞抵海口,开启2025年春节的度假之旅。Haha是一只比熊犬,今年春节期间出门...
02-07
图源:图虫创意 一张刀郎演唱会门票,成为眼下最热门的“尽孝...
03-04
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
02-09
当钟表的指针指向晚上8点,全世界的目光都聚焦在了中国的电视屏幕上,共同期待着一年一度的春晚盛宴。而今年的春晚,更因恰逢首个非遗新年而显得格外特别。一、春晚“清新奇迹”:...
02-09
快科技今日(1月23日)消息,前几天中国台湾嘉义大埔地区发生里氏6.4级浅层地震,此次地震对台南科学园区的部分半导体工厂造成了影响。 据媒体报道,台积电位于台南的...
01-24
《天国:拯救2》虽然有一些争议,但这并没有阻止游戏深受广大玩家的喜爱。该作首发24小时销量破百万,仅用了一天时间就收回了4100万美元的成本。 更能说明的是,《天...
02-10
“海上神器展锋芒,油气开发创辉煌”。今天说的神器就是中国制造的亚洲首艘圆筒型浮式生产储卸油装置(FPSO)——“海葵一号”。《渔舟唱晚》在民族音乐里可谓是鼎鼎有名。音乐一...
02-03
2月8日,哈尔滨亚冬会自由式滑雪女子U型场地技巧决赛,中国选手李方慧、张可欣包揽金银牌!中国选手李方慧凭借第三轮95.25分的成绩夺得金牌,这是中国代表团在哈尔滨亚冬会夺得的首...
02-08
记者从中国载人航天工程办公室获悉,我国2025年计划发射神舟二十号、神舟二十一号两艘载人飞船和天舟九号货运飞船。1月20日,三次飞行任务的任务标识...
01-21
不久前,国家卫生健康委、国家中医药局、国家疾控局联合发布《卫生健康行业人工智能应用场景参考指引》,列出药物研发等84种具体应用场景,为人工智能(AI...
01-21
  本报记者集体采写  在披红挂彩、喜气洋洋的新春氛围中,冰雪运动、冰雪旅游迅速升温,成为人...
02-11
近日我省这些事业单位发布招聘公告一起来看看1中国医科大学及附属医院  招聘岗位:本次公开招聘3个岗位...
02-18
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮