ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

4个月前 来源: 观看:83

h75即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。h75即热新闻——关注每天科技社会生活新变化gihot.com


h75即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)h75即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖h75即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利h75即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
  1、《树下有片红房子》陈欢尔和景栖迟在一起了,两人在打打闹闹中沉淀下了深厚的感情,互相陪伴彼此走过了艰难的时光。  2、虽然宋丛先喜欢的陈欢尔,但陈欢尔只是把他当...
02-18
《余烬之上》廖知白真实存在吗?廖知白是幻想出来的吗?在《余烬之上》的剧情设定中,廖知白是真实存在的。廖知白是电视剧《余烬之上》中的角色,由孙阳饰演。他原...
02-21
  ――医保、药监部门就集采药品问题答记者问  本报记者 孙秀艳  今年1月,有专家认为某些集采药品可能存在“血压不降、麻药不睡、泻药不泻”质量风险,有关部门迅...
02-11
  在探索生命奥秘的领域,干细胞研究取得了令人瞩目的成就。自1932年干细胞相关研究问世以来,历...
02-14
2021年从清华大学博士毕业后加入华为,工作约三年半后,王成将进入上海交通大...
01-21
讣 告 中国共产党党员、中国科学院院士、北京航空航天大学航空科学与工程学...
01-23
  摘要  【氧化铝大涨又大跌后市怎么走?】氧化铝价格大跌后反弹,此前一月内现货报价下跌1400...
01-21
  进入2025年以来,省联社改革驶向“快车道”。  1月20日,国家金融监督管理总局披露的批复显示...
01-23
射手座的男生通常是开朗、乐观、自由奔放的,他们对待感情也是如此。然而,当他们真正爱上...
01-22
水瓶座男生以其独特的个性和思维方式而闻名。他们聪明、创新、理性,善于思考和分析问题...
01-22
探索巴尔虎蒙古族的独特服饰文化在中国的辽阔大地上,生活着许多各具特色的民族,其中巴尔虎蒙古族以其独特的服饰文化而闻名。每当我看到他们的传统服饰,不禁想深入了解这其中的...
02-12
独特而时尚的饰品店名字推荐,展现潮流与品位在如今这个时代,拥有一个吸引眼球的饰品店名字是至关重要的。想象一下,当顾客走过你的店铺时,一个精致的名字能够瞬间抓住他们的注意...
02-12
成也流量,败也流量。抖音安全中心发布公告称,近期徐熙媛(大S)女士逝世引发广泛关注,广大网友纷纷表达哀思悼念,希望逝者能够安息。但也有部分账号借机炒作,发布谣言,违背公序良俗和...
02-08
2月15日消息,快手电商女装亲子行业近日开启“春日焕新季”。活动分三个阶段,第一阶段从2月13日至19日,将为商家带来商家端和用户端补贴、流量激励、新品扶持、磁力金牛对投、短...
02-16
在干燥的冬季,大家是否会被猝不及防的静电困扰?头发“炸毛”、穿脱衣物时被刺痛感袭击、摸门把手时被狠狠“电击”……这些静电现象...
02-07
2月25日消息,银联商务近日正式通过《企业知识产权合规管理体系要求》(GB/T 29490-2023)国家标准认证,并获得知识产权合规管理体系认证证书。图源:银联商务公众号据了解, 《企业知...
02-26
在农村义务教育学生营养改善计划备受瞩目的背景下,来自中粮福临门学生营养餐专用食用植物调和油的好消息让市场看到了团膳定制油方向的广阔空间。数据显示,自2024年8月上市以...
01-22
2025年1月21日,深圳市聚心教育科技有限公司今日正式官宣,以5000万人民币估值已顺利完成500万元人民币A轮融资。本轮投资是由采纳资本领投,由金伯乐创投、美城创投、领创ITVC、...
01-23
今日(1月27日),恐怖探索ADV《呪いの穢れ唄 鳴海龍也の回奇録》Steam页面开放,2025年4月发售,不支持中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 失...
01-29
近日暴雪游戏国服运营团队宣布,战网正式调整登录方式。用户需要使用网易通行证登录战网,但完全切换的时间稍作推迟,未来需要使用网易账号才能登录游戏。 暴雪游...
02-13
2025年春节是“春节——中国人庆祝传统新年的社会实践”列入联合国教科文组织人类非物质文化遗产代表作名录后的首个春节。文化和旅游部组织开展“欢欢喜喜过大年”春节主题...
02-05
据参考消息网援引俄新社2月5日报道,世界黄金协会发布的数据显示,去年俄罗斯居民的黄金购买量创下2013年以来最高纪录,并且首次跻身全球黄金消费量前五名。而中国人连续第12年在...
02-08
图源:Pixabay 寒武纪(688256.SH)的股价还在震荡,股民心情“过...
01-21
1月16日,记者从宁波华仪宁创智能科技有限公司获悉,该公司研制的单细胞代谢物分析质谱仪近日入选浙江省经济和信息化厅、浙江省财政厅印发的《2024年...
01-21
  2月12日,记者从国网辽宁省电力有限公司了解到,去年我省电力市场化交易电量达1914.15亿千瓦时,同比增加...
02-13
  “跟着电影游中国”活动2月17日在京启动。活动旨在抓住春节档电影全球热映契机,利用当前过境...
02-18
最近,网络上关于春节假期加班和加班报酬的讨论多了起来。根据2024年11月修订的《全国年节及纪念日放假办法》,今年增加农历除夕假日后,春节放假4天(农历除夕、正月初一至初三)。...
01-21
1月17日,为迎接中国农历蛇年的到来,重庆街头的蛇年新春装置亮相,呈现出浓浓年味。图为市民在巨型灯笼打造的新春装置处玩耍。中新社记者 周毅 摄  (新春走基层) 重庆...
01-21
1 月 21 日消息,比亚迪汽车去年就表示,希望 2~3 年内在 15 万级甚至 10 万级车型中全面实现标配比亚迪自研自产自销的智驾系统。上周三,36 氪称比亚迪部分车型从今年开...
01-21
1 月 21 日消息,在经过漫长的等待后,特斯拉终于开始要为安卓手机引入超宽带(Ultra-wideband,简称 UWB)技术支持了。这一技术将显著提升手机的定位精度,从而为用户带来更多...
01-21
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮