ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

1年前 来源: 观看:149

JV8即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。JV8即热新闻——关注每天科技社会生活新变化gihot.com


JV8即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)JV8即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖JV8即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利JV8即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
  1、《掌心》礼宗旭是坏人,他是十恶不赦的大反派,表面上是大善人,私下里做尽龌龊勾当。  2、礼宗旭因童年目睹母亲被家暴的阴影,而养成了扭曲的心理,被他凌虐荼毒的无辜少...
02-15
近日,娱乐圈再次掀起波澜,焦点人物是黄景瑜,他被卷入了一场新的绯闻风暴,迅速吸引了大量粉丝和网友的关注。 事情起因于一张网友在富国岛健身房偶遇的照片。画面中,黄景瑜与一...
02-23
  本报北京1月14日电(记者 白剑峰)国家卫生健康委等6部门日前发布《关于开展儿童友好医院建设的意见》提出,秉持儿童优先理念,从儿童视角出发,为儿童提供有情感、有温度...
01-21
21世纪经济报道记者武瑛港 实习生张烁 北京报道小红书上又多出来了一批“难民”,不过这次是医美“难民”——近日北京塑研医疗美容诊所疑似...
01-25
  大众网记者 杨涛报道  日前,“外研社·国才杯”“理解当代中国”全国大学生外语能力演讲大赛(山东赛区高职组)成绩揭晓,青岛港湾职业技术学院的王淑珍同学凭借出色的表...
01-21
1月22日,香港科技大学上海中心在徐汇滨江成立,港科大将与上海合作打造人才...
01-23
  本报记者 冷翠华  近年来,在重疾险新单保费增长乏力的情况下,人身险行业正在努力探寻“第二...
02-06
  近期,江西、湖北等地的中小银行增资扩股方案获得当地金融监管部门的批复同意。相比往年,此轮...
02-11
水瓶男通常具有理性、独立和思想家的特质,他们喜欢追求自由和个人空间。他们对于感情较...
01-22
金牛座男生通常对于女生有着独特的偏好和要求。他们喜欢一种特定类型的女生,下面将介绍...
01-22
她们的魅力:那些令人心动的女明星在娱乐圈中,许多女明星不只是才华横溢,更以其**迷人的外表**和独特的个性抓住了观众的心。谈到**最漂亮的女明星**,我们不由自主地想到了那些在...
02-07
汉族民族服饰:传承与变迁中的华美风采提到汉族服饰,脑海中自然浮现出那华美的旗袍、精致的唐装,让人不禁想探寻这种服饰背后承载的文化、历史与艺术。在这篇文章中,我将与大家分...
02-12
1月21日消息,卓尔智联生态圈第三十一次联席会议近日在上海举行。本次会议以“聚势同行 创领新程”为主题,卓尔智联集团高管及职能部门负责人,下属公司CEO、财务、风险等条线负...
02-07
2月14日消息,哈萨克斯坦Dong Neng公司董事长贾小亮日前到访国联股份新疆数字经济总部,涂多多高级副总裁、跨境产发部总经理邵春生代表公司热情接待来访人员,双方基于前期交流,签...
02-15
2月4日消息,去哪儿发布2025春节旅游报告,数据显示,由于单位提前放假,加上不少打工人选择“请2休11”,今年春节节前出行高峰提前至1月25日。机票价格从1月26日开始回落,至除夕到达...
02-07
3月1日消息,在北京大学国家发展研究院【承泽论坛】第32期,智联招聘集团总裁张月佳指出,在数字技术的加持下,更多职场人有机会成为“超级个体”,而HR是寻找与培养超级个体的关键。...
03-01
1月18日,游族网络2025年会“U-nite U-show——游秀之夜”在上海西岸穹顶艺术中心成功举办。本次年会主题意为“聚在一起,秀出自己”,一方面象征着这是以每位优秀的游族人为主角...
01-21
踏入2025年,中国人民银行与香港金融管理局宣布了一系列深化内地与香港金融市场交流的新举措。百惠金控认为利好措施将优化两地资本市场的互联互通机制,不仅能促进资金的双向流...
01-22
《华纳大乱斗》的游戏总监对上周五宣布的该免费格斗游戏第五季将成为最终季一事,发表了看法。 上周五,开发商Player First Games证实,第五季将于5月30日结束,距离...
02-04
如今各种新时代类型诈骗层出不穷,日前BBC分享了一则经典诈骗案例,提醒广大民众注意,而且不仅仅是英国,估计全世界都已经被波及了。 ·据悉,一位70岁老太太去医院,...
02-04
极目新闻记者 丁鹏2月3日晚,山西大同古城一店铺因未按当地要求打开灯,多名工作人员撬锁进店将灯打开,此事引发热议。2月5日,大同市平城区古城街道办事处回应极目新闻记者,正在核...
02-05
极目新闻记者 丁伟街头套圈可以套到豪车玛莎拉蒂?近日,在河南商丘柘城县,一个套圈摊位吸引不少游客前来打卡和碰运气。2月6日,摊位老板告诉极目新闻记者,这是一辆二手的玛莎拉蒂,...
02-06
做企业,实际上是做文化。当员工在面对市场苦寻出路,或在诱惑面前左右摇摆之时,文化将成为指引他们找寻正路、穿越周期的明灯。刚刚过...
01-21
来自美国亚利桑那大学的天文学家团队使用大型双筒望远镜干涉仪,在红外波段捕捉到了迄今为止最清晰的活动星系核(AGN)图像,并将研究结果发表在最新一期...
01-21
  辽宁省气象台2月10日16时发布大风蓝色预警:  预计11日白天,沈阳、大连、鞍山北部、抚顺、锦州、阜...
02-11
  每年这个时候,车厘子大量上市,酸甜多汁的口感引得人不免多吃几颗。不过,有网友发文称“自己‘狂炫’三大碗车厘子后中毒了”,这样的说法也引发热议,有网友留言说自己也有...
01-22
  海报新闻记者 田阳 报道  “驳回上诉,维持原判。”1月21日,王浩文拐卖儿童案二审宣判。该案中被人熟知的“雷公”雷武泽通过朋友拿到了法院的判决结果。“雷公”告诉...
01-22
1月15日,在MG新年首场“有意思”发布会上,MG打破常规,首开传统车企新车重新发布“先河”。上汽MG品牌事业部总经理周钘首次以新身份正式亮相,并将MG ES5重新发布,为观众深度解读...
01-21
[本站 资讯] 1月23日,阿维塔官方宣布启动“春节不打烊”用户服务,其通过线上、线下多渠道升级悦心服务。即日起至2月5日,阿维塔中心及钣喷中心将为车主提供免费专业的车...
01-24
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮