ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

9个月前 来源: 观看:118

I4x即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。I4x即热新闻——关注每天科技社会生活新变化gihot.com


I4x即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)I4x即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖I4x即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利I4x即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
随着电视剧的热播,“难哄桑延和温以凡为什么分手”也逐渐引起了广大粉丝的关注。该剧播出后,凭借精彩的剧情、精良的制作和精心的演绎,受到了观众的一致好评,拿...
02-20
《难哄》段嘉许喜欢谁?段嘉许和桑稚在一起了吗?‌段嘉许在《难哄》中喜欢的是桑稚‌。段嘉许和桑稚的哥哥桑延是朋友,最初段嘉许将桑稚视为妹妹,对她只有兄长般...
02-22
21世纪经济报道记者武瑛港 实习生张烁 北京报道小红书上又多出来了一批“难民”,不过这次是医美“难民”——近日北京塑研医疗美容诊所疑似...
01-25
21世纪经济报道记者季媛媛 上海报道 2025年刚开始,诺华制药就完成了大笔收购案。2月11日,诺华宣布了对Anthos Therapeutics的收购计划。据...
02-12
  大众网记者 司心鹏 报道  为贯彻落实教育部、山东省《关于加强新时代教育科学研究工作的实施意见》,提高特殊教育教师教科研水平,促进特殊教育教师专业成长,2024年12...
01-21
教师与外来务工人员子女一起创作大型蛇主题非遗剪纸 谭云俸 摄外来务工人员子女体验非遗剪纸 谭云俸 摄  寒假期间,浙江省湖州市长兴县夹浦镇中心小学为就地过年的外来务...
01-21
    1月19日,中国地质调查发布,自然资源部中国地质调查局在甘肃安坝里北、内蒙古哈达门沟和黑...
01-21
  摘要  【钢银电商:本周全国城市钢材库存环比增加14.39%建材库存增幅超两成】钢银电商27日...
01-28
射手座的男生天性热情开朗,喜欢自由自在地生活。他们追求刺激和冒险,对于感情也是如此。...
01-22
每个星座都有自己独特的喜好和偏好,而摩羯座也不例外。作为一个土象星座,摩羯座的人通常...
01-22
男商务衬衫搭配什么裤子好看?一、男商务衬衫搭配什么裤子好看?搭配一:牛仔裤牛仔裤应该是男士日常穿搭中的必备裤装,时尚、个性又百搭,搭配一件格子衬衫或者任何休闲风格的衬衫都...
02-07
男士衬衫搭配什么裤子好看,男人衬衫搭配?一、男士衬衫搭配什么裤子好看,男人衬衫搭配?你可以搭配休闲裤还有商务休闲裤,或者牛仔裤都是穿着比较好看。你可以试着对比和搭配。衬衣...
02-17
2月16日消息,春风送暖,甘蔗种植迎来关键时刻。中农网依托产业链优势,推动旗下广西易农通深入甘蔗种植环节,在南宁市武鸣区罗波镇板欧蔗区率先启动2025年5万亩甘蔗种植计划,通过数...
02-17
2月18日消息,遥望科技近日与巴西最大直播机构ABLELIVE达成独家战略合作,携手深耕巴西市场,共同打造该国直播电商行业的最大样板,致力推动巴西直播电商生态体系的深度升级。图源: ...
02-18
图源:图虫创意 华为手机再次迎来疯抢。3月5日,华为Mate70 P...
03-05
3月7日消息,去哪儿大数据显示,2024年以来,在旅游淡季,女性预订飞机商务舱的数量同比增加了三成,预订高星酒店的数量也同比2023年增加了四成。平台上50岁以上女性行程预订增幅最高...
03-09
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
Midnight Society是由颇具争议的主播Dr Disrespect联合创立的游戏工作室。在进行大规模裁员四个月后,该工作室即将关门大吉。与此同时,谷歌宣布解除对Dr Disresp...
02-03
卡普空大作《怪物猎人:荒野》日前火热测试中,有玩家找到了设定中的蜘蛛恐惧症模式的疑似出处,引发热议,开了以后更加恐怖了。 ·蜘蛛恐惧症模式在包括《魔兽世界...
02-13
2月4日,据报道,《封神2》太原路演现场观众情绪失控,导演乌尔善被观众贴脸质问: “为什么封神的口碑两极分化,你想过没有? 我们作为路人一直在给你说好话,你有没有想过自己去解决这...
02-05
今天下午,商务部召开例行新闻发布会,新闻发言人在会上表示,今年春节假期,消费市场总体实现平稳开局。后期来看,一季度消费市场总体将继续呈现平稳增长态势。根据商务部商务大数据...
02-06
近日,两家独角兽的朋友圈“论战”在近期引起了多方关注。争议缘起于一张影石创始人怒喷友商的截图。在微信朋友圈界面中,显示为“刘...
01-21
美国加州大学旧金山分校团队发现,小鼠体内存在一种分子计时器,在怀孕最初几天就会被激活,并影响小鼠的分娩时间。如果相同的一组分子在人类妊娠中所起...
01-22
  记者从西藏自治区文物保护研究所获悉,我国联合考古队员历时5年发掘的玛不错遗址为目前青藏高...
01-24
注意啦沈阳市皇姑区、浑南区面向社会公开招聘博士人才事业单位编制发放生活补贴提供住房保障为随迁家属...
02-14
  正月初七返程火车票今日开抢,预计当天为节后客流高峰日  正月初七返程火车票今日开抢!  1月21日,按照铁路车票预售期,旅客可以购买2月4日(正月初七)的火车票。2025年铁...
01-21
  中新经纬1月18日电 (林琬斯)下周(1月20日―26日),中国方面,手机等数码产品购新补贴将陆续实施,央行1.48万亿元逆回购将到期;国际方面,2025年达沃斯论坛将举行……下周还有哪...
01-21
1 月 24 日消息,奥迪(Audi)昨日(1 月 23 日)在 Facebook 上发布动态,展示了一款基于 Q6 Sportback e-tron 打造的越野概念车。这款概念车外观炫酷,配备了门式车桥和巨大的...
01-25
1 月 26 日消息,日前特斯拉 Autopilot 高级软件工程师 Phil Duan 针对用户对特斯拉 FSD 技术的质疑作出回应,暗示公司在该领域取得了显著进展。一位长期持有特斯拉股...
01-27
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮