ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

1年前 来源: 观看:103

SPs即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。SPs即热新闻——关注每天科技社会生活新变化gihot.com


SPs即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)SPs即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖SPs即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利SPs即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-7977-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
全国2024年GDP公布的当日下午,上海就迫不及待地公布了全年数据:53926.71亿元,同比增长5.0%。不仅成功晋升为全国第一个五万亿城市,上...
01-21
  中新经纬1月21日电 国新办21日举行“中国经济高质量发展成效”系列新闻发布会,介绍“大力推进新型工业化 推动经济高质量发展”有关情况。工业和信息化部副部长张云明在...
01-21
  广州日报讯(全媒体记者邓莉)今年将是自主高端新能源车崛起的一年。招银国际在1月发布的最新报...
01-23
2 月 2 日消息,比亚迪今日公布 1 月销售新车300538 辆,乘用车销售 296446 辆同比增长 47.5%。随后博主 @小迪快报 带来了具体销量明细。汇总各车型销量信息如下:王朝网...
02-03
最近风靡的《夜访吸血鬼第二季》以其演员颜值、演技及剧情深深吸引了观众。这部剧集不仅情节引人入胜,人物塑造细腻,还有许多精彩场景和细节,引发了广泛讨论。...
02-20
近期,汪小菲成功将子女接回北京的消息在网络上掀起热议。这一过程中,并未遇到来自前妻徐家的任何阻挠,引发了公众对亲子关系及家庭责任的广泛讨论。众多网友对汪小菲的这一行为...
02-23
  据发表于13日《自然·通讯》杂志的一项研究,西班牙国家癌症研究中心领衔的团队发现一种由线...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局发布关于26批次不符合规定化妆品...
02-13
作者:贾德忠(北京外国语大学党委副书记、马克思主义学院教授)在全球治理体系和国际秩序加速变革的大背景下...
01-22
  大众网记者 隋宜笑 报道  12月26日,山东政法学院党委委员、副校长胡晓清,山东政法学院传媒学院党总支书记徐永青,山东政法学院传媒学院副院长常洪卫等一行5人到访山东...
01-21
  《科创板日报》1月14日讯(记者 余诗琪)时隔3年,微医再次出现在港交所的IPO申请列表中。  这...
01-21
  中国证监会1月22日消息,近日,中央金融办等六部门联合印发的《关于推动中长期资金入市工作的实...
01-24
双子座的男生天性活泼好动,喜欢追求新鲜刺激的感觉。他们往往对爱情持有一种轻松随意的...
01-22
双鱼座的男生通常是浪漫、敏感且富有想象力的人。当他们真正爱上一个人时,会有一些明显...
01-22
魅力绽放:模特T台走秀背后的故事在时尚界,有一种声音永远不会被忽视,那就是模特T台走秀。这个将创意与自信结合的空间,不仅展示着设计师的想象力,还体现着模特们的努力与魅力。走...
02-12
揭开羽绒服价格背后的秘密,买到理想款式不再难当我们的目光被初冬的寒风所撩动时,羽绒服无疑成了大家衣橱中的宠儿。然而,面对市场上琳琅满目的羽绒服和千差万别的价格,我常常思...
02-17
2月4日消息,淘宝天猫面向服饰商家发布新品利好政策。在新春开工之际,为了更好地帮助商家搭上“春季上新”的东风,淘宝商家后台将上线“新品超级橱窗”板块,并于2月5日开放报名入...
02-07
京东、美团宣布为外卖骑手缴纳五险一金自从“百团大战”胜出以来,美团稳稳守住了外卖行业的“一哥”之位,几乎没有碰到几个“打得过”的对手。然而,外卖行业的战争似乎与美团王...
02-20
2月11日消息,饿了么董事长吴泽明(花名:范禹)今日通过公司全员信宣布饿了么最新组织调整:即日起,吴泽明将兼任饿了么CEO,韩鎏(花名:昊宸)专注分管即时物流中心,继续向吴泽明汇报。吴泽明...
02-12
图片来源:安徽罗森官网 2月24日,中央商场(600280.SH)披露公告...
02-26
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
据公安部最新数据揭示,至2024年末,我国新能源汽车保有量已激增至3140万辆,占汽车总体比例的8.90%。2024年度,新注册登记的新能源汽车数量高达1125万辆,占比新注册汽车总量的41.83...
02-09
谷歌于上个月与三星和高通合作,推出了安卓扩展显示(AndroidXR)平台。 公司称它是“为下一代计算构建的新操作系统”,并且目前收购了 HTC Vive 的部分工程团队,他们...
01-25
海外硬件网络零售平台 Newegg 近日报道称,在前几天英伟达 RTX 50 系列显卡上架销售后,仅在 20 分钟内就售罄。平台还分析了 RTX 5080 以及 5090 的用户活跃激增...
02-04
据东方财经报道,2月6日,大S离世后,张兰首度出镜在抖音直播带货,直播间人气达到10W+,一个多小时后突然遭到封禁。张兰直播时的截图(图源:个人账号)直播时,张兰表示,自己过去三天经历了...
02-06
2月7日,鸟瞰武汉光谷重点民生项目生物城公共停车场。2月7日,鸟瞰武汉光谷重点民生项目生物城公共停车场,这座智能化停车场近期已投入使用,地下一楼的充电站内许多新能源车正在充...
02-08
1月15日,记者从中国科学院大连化学物理研究所获悉,该所动力电池与系统研究中心主任陈忠伟团队与双登集团近日对外联合发布了最新一代智能电池管理系...
01-21
荣耀高层变动终于靴子落地?据媒体报道,1月17日消息,荣耀终端股份有限公司内网发布公告称:“赵明因身体原因,向公司提出辞去CEO等相关职...
01-21
  今天(2月10日),辽宁晴朗天气唱主调,昼夜温差较大,早晚寒意十足。明天冷空气将给辽宁带来大范围降雪过程,...
02-11
  春节假期虽然已经结束,但是全国各地的旅游热度依旧不减。错峰出游成为不少人的选择,既能避开...
02-11
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮