ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

7个月前 来源: 观看:76

mol即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。mol即热新闻——关注每天科技社会生活新变化gihot.com


mol即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)mol即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖mol即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利mol即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-7977-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
  海报新闻记者 孙佃潇 北京报道  大学教授、收藏家、作家、阿里巴巴荣誉合伙人……如果细写,王帅的身份可能一张A4纸都写不完。1月18日晚,王帅作为一位分享者,携新书《...
01-21
  中新经纬1月16日电 商务部流通发展司司长李佳路表示,手机等3类数码产品的补贴为购新补贴,不是以旧换新,不以“交旧”为前提。  16日,商务部召开手机等数码产品购新补贴组...
01-21
  近期,国家发展改革委和财政部发布了《关于2025年加力扩围实施大规模设备更新和消费品以旧换...
01-24
  中国汽车工业协会日前发布数据显示,2024年,我国汽车产销累计完成3128.2万辆和3143.6万辆,同比...
01-27
正在播出的《白色橄榄树》深受观众喜爱,每一集的情节引人入胜,人物角色贴合故事情节的发展,让观众在观看过程中不断产生好奇心。在电视剧第32集中,宋冉和李瓒终...
02-19
近日推出了多部新剧,其中备受粉丝期待的《婚房下的逆袭》终于与观众见面。该剧上映后引发了热烈讨论,各大社交平台上也成为了热门话题。接下来我们一起来探讨...
02-20
  央广网北京1月3日消息(记者 雷妍)国家卫生健康委1月3日召开新闻发布会。会上,国家卫健委新闻发言人、宣传司副司长胡强强介绍,2025年全国卫生健康工作会议于近日召开,...
01-21
  近期,流感等呼吸道疾病进入高发期。全国流感病毒阳性率上升,尤以甲流多发。  中国疾控中心1...
01-21
大家好,我是童学会小记者李峻轩。今天我们来到了九紫宝藏陨石博物馆参观。通过讲解员的生动解说,和仔细观察产品,我知道了陨石分为三大类:石陨石、铁陨石和石铁陨石。其中石陨...
01-21
  大众网记者 王一刚 报道  报纸王国欢迎您,纸不仅是孩子们熟知的事物,更是他们游戏,创作和探索的素材,在《报纸王国》主题活动中孩子们与报纸展开了一系列的活动,不知不...
01-21
  近日,多家消费金融公司围绕春节购物、出行、旅游等消费需求,打造多样化服务和优惠举措,推出满...
01-24
  摘要  【“双焦”重挫,向下空间有多大?】前期利多预期兑现后,交易逻辑再次回归基本面,预计短...
02-06
水瓶座的男生通常被认为是聪明、独立和创新的人。他们对于自由和个人空间有着强烈的需...
01-22
天秤座的男人通常温和、善良、追求平衡。然而,有些女人可能会让他们感到困扰或抓狂。下...
01-22
模特写真与T台走秀:魅力与艺术的完美交融提到模特写真和T台走秀,我们的脑海中常常浮现出奢华的服装、专业的妆容和自信的身姿。作为时尚界的重要一环,它们不仅是品牌形象的代表...
02-07
秋冬穿搭技巧? 秋冬穿搭标题?一、秋冬穿搭技巧?秋冬季节是穿厚重衣服的季节,以下是几个穿搭技巧:1.搭配深色裤子:深色裤子在秋冬季节比较容易搭配,也更能抵御寒冷天气。建议搭配黑...
02-17
1月22日消息,全国农产品流通企业助农联合体第三次工作会议近日召开,一亩田荣获“2024优秀助农奖”。中国蔬菜流通协会会长戴中九介绍,助农联合体的企业都是国内农产品流通各个...
02-07
2月14日消息,拼多多站内的多多国际正全面招募海淘商家入驻,针对生活或来往境外有便利条件的境内个人,开放海淘个人店入驻。拼多多方面强调,全球购个人店机制简单,入驻流程简单,资...
02-15
2月7日消息,58同城、安居客“2025开年抢租节”正式上线。活动于2月7日正式启动,作为已经成功举办近10年的租房盛会,抢租节旨在分担新青年、新市民的租房压力,并在开年找房旺季提...
02-07
3月7日消息,妇女节来临,同程旅行联合唯品会共同发布《2025年中国女性出行及品牌消费趋势报告》,基于双方过去一年的消费数据,揭示发生在“购物车”与“旅行箱”之间的隐秘关联。...
03-09
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
根据最新消息曝料,苹果即将推出的第四代iPhone SE(iPhone SE4)尺寸已被初步知晓。 消息称,这款“平民版”iPhone的尺寸将接近即将发布的iPhone 16,进一步打破了SE系...
01-25
玩家们经常将《漫威争锋》与《守望先锋2》相比较,多数人认为《漫威争锋》比《守望先锋2》更有趣好玩。《漫威争锋》上线后,其Steam玩家数不断攀升,而《守望先锋2...
02-03
极目新闻记者 张盼在仙桃白马救人事件后,再现“钓鱼侠”。2月6日,钓鱼博主“土豆张”在社交平台发布的一段视频,引发网友关注,视频中众人用鱼竿、渔网救起一名落水者,评论区纷纷...
02-09
极目新闻评论员 屈旌2月9日,截至15时,哪吒2票房超78亿,已进入全球影史票房前40,今日或将突破80亿大关。据报道,《哪吒2》片尾出现了138家中国动画公司,导演饺子曾表示,本来寄希望于...
02-09
  IT之家1月12日消息,近年来,英伟达(Nvidia)凭借其在人工智能和图形处理领域的领先地位,迅速崛起为...
01-21
“成功!”1月9日,伴随着最后一个控制开关被合上,宽敞明亮的集控室内爆发出热烈的掌声与欢呼声,中国能建主体投资建设的全球首座300兆瓦(MW)压气储能示范...
01-21
  本报记者朱金宜《人民日报海外版》(2025年01月15日第12版)  冬日里,四川贡嘎山“日照金山”...
01-21
  央广网昆明2月5日消息(记者魏文青)今年是农历乙巳蛇年。蛇在中国传统文化中被赋予神秘、智慧...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮