ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

10个月前 来源: 观看:129

Y3i即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。Y3i即热新闻——关注每天科技社会生活新变化gihot.com


Y3i即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)Y3i即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖Y3i即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利Y3i即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
电视剧《谁看见了孔雀在跳舞?》播出几天后热度持续上升,观众们在网上热烈讨论。特别是关于第5集的分集剧情介绍,成为了近期关注的焦点。在第5集中,拉面店店主染...
02-20
近日,娱乐圈内一对知名夫妇——刘诗诗与吴奇隆的生活状态,通过圈内人士刘大锤的社交平台分享,再次吸引了公众的广泛关注。此次爆料不仅揭示了两人独特的家庭分工模式,还意外引发...
02-23
  中国疾病预防控制中心病毒病预防控制所研究员王大燕1月17日表示,近期的流感高发属于正常的季节性流行,每年冬春季基本都会出现。最新一周监测数据显示,北方大部分省...
01-21
  图①:1月1日凌晨,吉林大学白求恩第一医院妇产中心产科,助产士在为新生儿印脚印。  新华社记者 张 楠摄  图②:贵州黔西市文峰街道文峰社区珠海蓝逸贝贝托育园,孩...
01-21
  大众网记者 司心鹏 报道  4月1日,华为ICT大赛2023—2024全国总决赛成绩公布,山东商业职业技术学院云计算技术与应用产业学院学生团队获得昇腾AI赛道国赛二等奖2项,计...
01-21
2025年中小学寒假将至,为确保广大师生度过一个安全健康、快乐充实的假期,12月25日,省教育厅印发通知,从规范...
01-21
  今年以来,银行、理财子公司布局“理财夜市”热度持续。多家银行、理财子公司发布关于理财夜...
01-22
  摘要  【开年显著回升!PX能否扭转颓势?】PX作为聚酯产业链中关键的原料之一,在整个产业链中...
01-28
天蝎座的男生通常都有着强烈的个人魅力和吸引力,因此很容易吸引到一些暗恋他们的女生。...
01-22
狮子座的男生通常都有着强大的领导能力和自信心,而白羊座的女生则充满了活力和冲劲。然...
01-22
日系穿搭特点?一、日系穿搭的特点在穿搭方面日系风简直把休闲做到了极致,要说亚洲潮流文化发祥地,原宿绝对是一大圣地这里除了有常见的时尚大牌,还有亲民的牌子,日系穿搭的主要特...
02-07
聚光灯下的全女明星:她们的故事与智慧在娱乐圈中,有一类星光璀璨的女性,她们不仅在荧幕上展现了非凡的才华,也在生活中给人们带来了无尽的感动与启发。这便是我们常说的全女明星...
02-12
2月7日消息,东方甄选在微博发文称,近日,北京互联网法院就抖音用户崔某网络侵权案作出判决,认定被告发布言论不实,侵害了东方甄选名誉权,要求被告在抖音账号置顶道歉声明,并赔偿东方...
02-08
小米在向华为看齐。二、小米 15 Ultra 更多细节透露元宵节的夜晚,小米创始人雷军再次开启了他的直播之旅。这次直播的场地选在了小米食堂,雷军选择带大家参观小米员工的日常餐...
02-14
2月14日消息,美团宣布,本周将正式在广西部分城市首次上线“超时免罚”试点。在试点区域,美团将全面取消超时扣款,将众包骑手的“超时扣款”改为积分制度,并辅以支持策略,如培训帮...
02-14
2月22日消息,以“办好‘关键小事’ 托举幸福晚年”为主题的创新发展老年助餐服务座谈会近日在北京举行,饿了么总裁方永新在活动分享中表示,饿了么将在政策指引下,进一步深耕老年...
02-23
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
AMD CEO苏姿丰在公司2024年第四季度财报电话会议上宣布,RX 9070系列“RDNA 4”GPU将于三月初发售。 在最近的2024年第四季度财报电话会议上,苏妈终于让所有谣言...
02-07
随着动漫游戏额不断发展,声优行业也越来越壮大,日前日本专业声优杂志发布“声优名鉴2025 女性篇”,记载现役声优人数已经达到了1099人。 ·要知道该名鉴在2001年...
02-12
目前在品牌金饰市场,克单价800元以下的商品已很难看到了。2月4日,周大福官网报出的足金饰品价格为846元/克,周生生报出的价格更是达到852元/克,均为品牌足金饰品售价的历史高位...
02-04
2月5日傍晚,小米创始人雷军在社交媒体上发文:这是金的。转发的视频里有人介绍,小米SU7 Ultra车标变成了碳纤维+金色,兄弟们这个如何?来源:当事人社交账号今日上午,雷军又连发多条微...
02-06
图源:图虫创意 业绩连亏多年的梦网科技(002123.SZ)因一则并...
01-21
据最新一期《IEEE微波与无线元件快报》报道,欧洲空间局(ESA)研发了一个比草莓种子还要小巧的信号放大器(也被称为“种子”信号放大器),旨在弥补当前的技...
01-22
  记者从西藏自治区文物保护研究所获悉,我国联合考古队员历时5年发掘的玛不错遗址为目前青藏高...
01-24
  近日,省农业农村厅发布《辽宁省蚕遗传资源保护名录》,经论证评估,鲁黄、黄安东、胶蓝等13个品种列入保...
02-18
  摘要  【国家统计局:12月份一线城市商品住宅销售价格环比上涨二三线城市环比总体降幅收窄...
01-21
  海报新闻记者 孙佃潇 北京报道  大学教授、收藏家、作家、阿里巴巴荣誉合伙人……如果细写,王帅的身份可能一张A4纸都写不完。1月18日晚,王帅作为一位分享者,携新书《...
01-21
2 月 2 日消息,深蓝 S09 大六座 SUV 在上月(1 月 29 日)公布了部分座舱内饰细节,新车以“家庭智慧旗舰”为核心定位,首次搭载智能移动中岛与鸿蒙座舱 HarmonySpace。注意...
02-02
  近日,各大车企发布2025年1月销量数据。传统车企中,比亚迪、吉利等增长强劲;新势力车企排名变化...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮