ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

1年前 来源: 观看:141

vMR即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。vMR即热新闻——关注每天科技社会生活新变化gihot.com


vMR即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)vMR即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖vMR即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利vMR即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
《六姊妹》为什么叫刘晓玲?刘小玲汤振民结局是什么在电视剧《六姊妹》中,角色叫刘小玲而不姓何,是因为以下原因:出生惊险致母怒:刘小玲是何家老五,她出生时难产,是...
02-20
在娱乐圈这个光芒四射的舞台上,何炅以其出色的主持能力和温文尔雅的气质,长久以来深受观众喜爱。然而,近日他再次成为话题焦点,并非因为新的节目或作品,而是他那令人惊叹的健身成...
02-22
  中新网上海1月29日电(李秋莹 周孙榆)春节是中华民族的传统节日,同时也是眼健康面临重大挑战的时段,在长假期间,一些眼科慢性疾病,像不可逆致盲性慢性眼病青光眼、眼底...
02-02
21世纪经济报道记者 韩利明 上海报道随着四大跨国疫苗企业辉瑞、葛兰素史克(GSK)、默沙东、赛诺菲陆续发布2024年业绩,21世纪经济报道记者依...
02-11
6月16日,我们非常有幸在老师的带领下走进了创聚冰雪,学到了各种各祥的知识。在这次活动中。我还认识到了一个新朋友,活动当天,虽然天空下起了小雨,但是我们都如约赶到活动现场,有...
01-21
日前,辽宁大学马克思主义学院与沈阳“九·一八”历史博物馆共建活动在辽宁大学崇山校区图书馆学术报告厅...
01-21
  摘要  【纯碱:仍面临供需过剩格局】2024年,纯碱随着大投产逐步兑现,叠加光伏和浮法玻璃进入...
01-24
  摘要  【特朗普打压国际油价大震荡!未来还有哪些新变数?】在美国总统特朗普的打压下,国际油...
01-27
摩羯男和金牛女的配对指数非常高,他们在很多方面都能够互补,形成一个稳定而和谐的关系。...
01-22
巨蟹座的男生通常是非常敏感和细腻的,他们对待暗恋他们的女生会有一些独特的方式。 1....
01-22
引领潮流的冰冰个性服饰:时尚与个性的完美结合每当我走在街头,总会被一些独特的服饰所吸引。今天,想和大家聊聊一个我最近非常喜欢的品牌――冰冰个性潮流服饰。它不仅仅是一种...
02-07
布鲁克鸟男士服饰品牌?布鲁克鸟男士服饰品牌?作为一名有品位的中年男性,一定听说过布鲁克鸟男装。相比外国品牌,布鲁克鸟作为中国本体时装品牌,旗下的服装以中国人体型为标准打造...
02-07
京东做外卖,佣金引热议互联网行业,又将掀起一场腥风血雨。最近,社交平台上传出“京东外卖以只抽5%的佣金的旗号上线,美团降低高佣金应对”的帖子。对此,有媒体从美团方面确认,网传...
02-11
2月19日消息,陶都国控产业投资(邯郸)集团有限公司(以下简称“陶都国控”)运营总监、销售总监陈亮近日到访国联股份新疆数字经济总部。涂多多副总裁、西北大区总经理李庆代表公司...
02-20
2月18日消息,作为赞助商,中国银联将支持境外中国电影节首场落地马耳他。本次电影节上,《封神第一部:朝歌风云》《热辣滚烫》《热烈》《飞驰人生2》等多部影片将轮番上映,生动呈现...
02-19
2月22日消息,以“办好‘关键小事’ 托举幸福晚年”为主题的创新发展老年助餐服务座谈会近日在北京举行,饿了么总裁方永新在活动分享中表示,饿了么将在政策指引下,进一步深耕老年...
02-23
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
近日,智能科技领域企业——青岛明邦智能科技有限公司(简称“明邦智能”)宣布,成功完成1000万元人民币的融资。此次融资由广东南方秭方投资集团(简称“...
02-07
据法国媒体报道Les Echos报道,育碧和沙特公司Savvy Games Group达成合作关系,这可能让发售两年的《刺客信条:幻景》迎来DLC。 报道称育碧之前对《刺客信条:幻景》...
01-27
《天国:拯救2》已正式发售,首发24小时销量就突破100万份。许多玩家对这款中世纪RPG表现出浓厚兴趣。游戏中有许多细节非常真实,比如玩家会因为偷窃被捕,越狱时被守...
02-06
极目新闻记者 李迎 近日,南京市红山森林动物园饲养员为一只离世河马手写讣告,回忆了河马最后阶段的点点滴滴,字里行间真诚动人。2月5日,红山动物园回应称,为离世动物写讣告为园方...
02-05
极目新闻记者 戎钰两眼一睁一闭,《哪吒2》票房又多了几个亿——伴随着网友的这句调侃,2月6日,动画电影《哪吒2》的票房超过57.75亿(含预售),取代2021年上映的战争电影《长津湖》,成...
02-06
一项发表在《科学》杂志上的新研究,为脊髓损伤患者恢复复杂触觉感知带来了前所未有的希望。瑞典查尔姆斯理工大学研究团队首次推出一种可安装在椅子...
01-21
  科技日报记者 刘霞  美国加州大学伯克利分校和韩国高丽大学科学家携手,从变色龙身上获得灵...
01-24
  本报记者赵珊《人民日报海外版》(2025年01月17日第12版)  新春佳节临近,海南省海口市博爱路...
01-21
注意了!2025年辽宁省事业单位集中面向社会公开招聘工作人员公告发布报名时间2025年2月19日9:00至2月25日...
02-18
  当地时间20日,俄罗斯总统普京在联邦安全会议常务委员视频会议上表示,俄方对与美国新的行政当局就乌克兰冲突开展对话持开放立场。  普京表示,在调解乌克兰冲突中,最主...
01-22
  加州又起大火:事发全球最大储能电厂,有数万块电池,马斯克急辟谣  澎湃新闻记者 贺梨萍  当地时间1月16日下午,美国加利福尼亚州莫斯兰丁(Moss Landing)储能电厂发生火灾...
01-21
1 月 30 日消息,在今天召开的财报电话会议上,特斯拉公司宣布解锁新里程碑,车辆平均制造成本首次降至 3.5 万美元(当前约 25.4 万元人民币)以下。特斯拉公司还计划在 2025...
01-31
“若前方无路,我便踏出一条路;若天理不容,我便扭转这乾坤。”电影《哪吒2》开年“王炸”,让人看到了哪吒打破命运,勇敢做自己,最终活出自我的过程。新年刚过,国内车市异常“开卷”,...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮