ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

6个月前 来源: 观看:98

mSX即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。mSX即热新闻——关注每天科技社会生活新变化gihot.com


mSX即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)mSX即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖mSX即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利mSX即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
近期电视剧《善意的竞争》成为热门话题,开拍前就吸引了大量粉丝。随着剧集播出,观众群体不断扩大,大家都非常兴奋并期待剧情发展。很多人特别好奇刘在伊是否喜...
02-20
《余烬之上》男主是谁啊?余烬之上背后的boss是谁?‌《余烬之上》的男主角是王子奇和孙阳。‌王子奇饰演的廖思远是一个天才破案少年,因童年创伤患上“解离性人...
02-21
  本报北京12月29日电(记者 申少铁)国家疾病预防控制局日前举行新闻发布会,介绍疾控事业高质量发展有关情况。  疾控体系改革稳步推进。国家疾控局新闻发言人、综合...
01-21
  在探索生命奥秘的领域,干细胞研究取得了令人瞩目的成就。自1932年干细胞相关研究问世以来,历...
02-14
  大众网记者 隋宜笑 报道  为培养适应新时代需求的全媒体新闻人才搭建更为广阔、坚实的平台,进一步深化校企合作,12 月 17 日,山东传媒职业学院新闻传播系于产教中心报...
01-21
  大众网记者 杨涛报道  近日,2024年山东省“技能兴鲁”职业技能大赛暨第五届山东省汽车服务行业职业技能竞赛在青岛港湾职业技术学院成功举行。“技能兴鲁”职业技能...
01-21
  财中社1月20日电国信证券发布农林牧渔行业农产品研究跟踪系列报告。文中指出看好猪价2025年...
01-21
  “年终奖刚发,本来打算去银行网点买定期存款,但利率实在太低。客户经理推荐了一款针对新客户...
01-22
金牛座的男生通常被认为是稳重、务实、有责任感的代表。如果你想吸引一个金牛男并让他...
01-22
天蝎座男生通常具有神秘、冷静和自信的特质,因此要成功地追求他们需要一些技巧和策略。...
01-22
探索欣昕潮流服饰:引领时尚的潮流之路在这个瞬息万变的时尚界,想要找对一件既能展现个性又不失品位的服饰,真的是一项挑战。然而,欣昕潮流服饰似乎打破了常规,以其独特的设计和多...
02-12
国内休闲服饰品牌有那些?1 美特斯邦威上海美特斯邦威服饰股份有限公司成立于1995年。公司主要研发、采购和营销自主创立的Meters/bonwe和ME&CITY两大品牌时尚休闲服饰。通过...
02-12
2月6日消息,天眼查官网资料显示,近日,辛选集团关联公司广州辛选网络信息科技有限公司因虚假宣传违法行为,被广州市白云区市场监督管理局罚款175万元。图源:天眼查官网处罚事由显...
02-07
2月20日消息,永辉超市2025年首期全国调改店长专项培训近日落幕。来自全国各地的167名店长学员顺利结业,这一成果标志着永辉超市“2025调改计划”人才培养体系落地,为全国门店调...
02-21
3月1日消息,同程旅行日前宣布,同程程心大模型将全面接入DeepSeek,成为首家接入DeepSeek大模型的OTA平台。同程程心是同程旅行自主研发的旅游行业专属模型,未来将与DeepSeek深度...
03-01
3月3日消息,饿了么将正式启动“优店腾跃计划”:面向商家投入超过10亿元,在费率优惠、专项补贴、专属流量、数字化运营服务和硬件设施以及AI技术能力等多方面,持续加大对商家支持...
03-04
2024年底,上海国拍携⼿MOJO FEST在⾸届MOJO FEST卡趣嘉年华上推出名⼈&名品拍卖会——MOJO AUCTION。拍卖会现场竞价热烈,其中一张稀有的宝可梦卡牌以全场最高价140万元成交...
01-23
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
遭遇延期的《刺客信条:影》在近日重新开启了预购,由于游戏以日本封建时代为背景,并采用了“黑人武士弥助”的设定以及将其作为主角之一,从而引发了不少争议,尤其是...
01-27
根据网络安全研究人员 Shalzuth 在博客上发布的一篇报告称,目前 Steam 上最受欢迎的多人游戏之一《漫威争锋》存在着“巨大安全漏洞”。 据称,该漏洞可以让黑...
02-13
极目新闻记者 潘锡珩4日,极目新闻记者从武汉地铁了解到,为保障铁路夜间到达乘客出行需求,今日(2月4日),武汉轨道交通2号线汉口火车站往佛祖岭方向末班车延时至24:00,4号线武汉火车站...
02-04
2月6日,外交部发言人郭嘉昆主持例行记者会。有记者提问,据报道,韩国的一些政府部门已经屏蔽对DeepSeek的访问,之前意大利、澳大利亚、印度、美国、日本等国家也传出禁止或限制使...
02-06
2015年,包括195个国家和欧盟在内的各方共同签署了《巴黎协定》,承诺将制定并实施一系列计划,旨在将全球平均气温升幅严格限制在1.5℃以内。然而,到了20...
01-21
  IT之家1月24日消息,受大规模罢工导致商用飞机生产停滞和交付量受限的影响,波音公司昨晚公布的...
01-24
  去年,我省实施农村供水工程502处,其中年内建成通水309处,覆盖受益人口74万人,累计完成投资30.4亿元,创历...
01-22
  据气象部门监测,预计1月26日至27日我省将有一次强降雪、寒潮、大风天气过程,东部地区有大雪(5~10毫米...
01-23
  生物制品跨省、跨境分段生产“松绑”,创新药企利好几何  “当一家生物科技公司(biotech)只拥有一款药,为此盖个工厂,维护成本是不是太高?出厂价是否会因此抬高?”“生物药...
01-21
  中新经纬1月17日电 “宁波市中级人民法院”微信号17日消息,2025年1月17日,浙江省宁波市中级人民法院一审开庭审理了自然资源部原党组成员、中国地质调查局原党组书记、局...
01-21
1 月 27 日消息,宁德时代官微今日发文称,今年,宁德时代分别在江苏、上海、海南等地部署移动式充储检一体机器人 —— CharGo 充电狗。根据江苏省交通运输厅和南京市交...
01-28
“若前方无路,我便踏出一条路;若天理不容,我便扭转这乾坤。”电影《哪吒2》开年“王炸”,让人看到了哪吒打破命运,勇敢做自己,最终活出自我的过程。新年刚过,国内车市异常“开卷”,...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮