ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

2个月前 来源: 观看:45

DJR即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。DJR即热新闻——关注每天科技社会生活新变化gihot.com


DJR即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)DJR即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖DJR即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利DJR即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
近期,电视剧《难哄》在各大短视频平台爆火,剧中苏浩安的官配成为追剧党热议的话题。大家都对苏浩安和钟思乔的感情线充满兴趣。《难哄》这部电视剧中,苏浩安和...
02-20
近日,海口市公安局龙华分局宣布,知名导演郑某某因涉嫌猥亵儿童罪已被刑事拘留。这一消息迅速在社交媒体上发酵,引发了广泛关注和讨论。据了解,郑某某在电影《美人鱼》中曾扮演过...
02-22
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家医保局发函回应赴上海调研集采药品质量...
01-21
  女性天生拥有两条X染色体,一条遗传自母亲,一条遗传自父亲。不过,为了确保基因表达的平衡,女性体...
01-27
  大众网记者 王一刚 报道  这个冬至,让我们和艺术撞个满怀……  为全面贯彻教育部发布的《关于全面实施学校美育浸润行动的通知》,“以美育浸润学生、以美育浸润教...
01-21
  2024年8月20日,我和弟弟参加了北京银行西安分行和华商网童学会联合举办的“京苗小记者”研学活动,不仅过了一把警察瘾,而且从中学到了很多的新知识。  怀着激动的心情,我...
01-21
  原标题:复盘信托业的2024:继续“增量不增利”,超20家公司更换“将帅”,股权挂牌活跃成交冷  ...
01-24
  昨日,菜粕走势强劲,2503合约一度触及涨停。截至下午收盘,菜粕2503合约上涨3.75%,菜粕2505合约上...
02-11
双鱼座的男生通常是非常敏感和浪漫的,他们对待自己喜欢的人也有着独特的方式。当双鱼男...
01-22
狮子座男生通常是阳光、自信和热情的代表,当他们喜欢上一个人时,会展现出一系列明显的行...
01-22
2017 T台上的风潮:皮裤模特的时尚之旅回顾2017年,时尚界交相辉映,各大品牌在T台上用于展示最新潮流的方式层出不穷。而在这个过程中,皮裤作为一种独特的时尚单品,成功吸引了观众...
02-07
广州哪里有YSL专柜? ysl圣罗兰的专柜在广州哪里有?广州哪里有YSL专柜?天河区 天河路218号天环广场B1-156号铺 天环广场全部店铺ysl圣罗兰的专柜在广州哪里有?环市东路白云宾馆旁...
02-17
2月6日消息,名创优品创始人、董事会主席兼CEO叶国富发表新春开工寄语。图源:名创优品集团公众号叶国富称,在过去一年,尽管外部环境面临诸多变化和挑战,名创优品总体业绩依然跑赢...
02-07
这两位来自福建龙岩的老乡,故事就此拉开序幕。1.抖音生活服务春节团购订单量暴涨春节放假期间,本地消费需求暴涨,让抖音狠狠地吃了一波红利。日前,抖音生活服务发布《2025春节消...
02-07
2月27日消息,抖音生活服务举办“服务体验与治理开放日”,发布《2024抖音生活服务消费者权益保护年度报告》,公布了过去一年在消费者权益保障与生态治理方面的措施和阶段性成果...
03-01
3月4日消息,农历二月初二“龙抬头”,理发行业迎来生意开门红。美团数据显示,“龙抬头”当天,理发订单量较去年同期翻倍增长,理发订单预约量周同比增长270%,上午11时-12时、下午16...
03-05
2024年国网全年电网投资首超6000亿元,预计达到6092亿元,相比2023年新增711亿元,13.2%的同比增速也为近年最高值。据国网1月15日发布的信息显示,2025年国网将进一步加大投资力度,...
01-22
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
一款名为《GrandTaking Ages VI》的游戏此前上架了索尼的 PlayStation 商店。显而易见,游戏的简写与即将推出的《GTA6》一模一样,显然是一款碰瓷的游戏。目前,这...
01-24
2K揭开了《WWE 2K25》的神秘面纱,今年3月14日该游戏发售后,玩家终于能在游戏中安排男女摔跤手进行性别混合对决——这在WWE赛事节目中本身就极少出现。 2K在一...
01-29
来自2025年综合运输春运工作专班数据显示,2025年2月4日(春运第22日,农历正月初七),全社会跨区域人员流动量预计34611万人次。其中,铁路客运量1690万人次,公路人员流动量32556万人次...
02-04
极目新闻评论员 吴双建“我的车定速巡航功能失效了,刹车也踩不动,怎么办?”2月1日凌晨5时11分,湖北省公安厅高警总队六支队指挥中心民警石路接到群众报警求助。经过紧张的一个多...
02-04
1月13日,由浙江大学杭州国际科创中心(以下简称“科创中心”)人形机器人创新研究院联合镜识科技有限公司、杭州凯达尔焊接机器人股份有限公司研发的四...
01-21
  近日,辽宁省防减救灾办与相关成员单位进行会商,对近期全省自然灾害风险形势开展了研判分析,结合实际对...
01-24
  今天是春运第12天,交通出行迎来节前客流高峰。交通部门积极应对不利天气对春运带来的影响,全...
01-27
  多地表态节俭办春节:灯笼不再满树挂,翻新改造旧设施  “如果要在街道绿化树悬挂红灯笼的话,不要往年一样满树单个悬挂,这种悬挂方式过于粗暴缺乏形式感,显得零乱又浪费材料...
01-21
  中新经纬1月17日电 2024年全国营业性演出票房收入579.54亿元,同比增长15.37%。  据中国演出行业协会微信号17日披露,根据中国演出行业协会票务信息采集平台数据监测和调...
01-21
[本站 资讯] 日前,小米YU7实车图再度曝光,这组实车图展示给我们新车的更多细节,新车定位为中大型SUV,售价预计会在30-40万之间,并将在2025年6月-7月份正式上市。此次最新...
01-24
2 月 4 日消息,从小米汽车获悉,2 月 5 日起,小米 SU7 Ultra 将在全国 42 城 112 店正式开放静态品鉴。全新专属产品专家“Ultra Master”将与用户联系,安排、服务品鉴。...
02-04
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮