ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

8个月前 来源: 观看:111

UVR即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。UVR即热新闻——关注每天科技社会生活新变化gihot.com


UVR即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)UVR即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖UVR即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利UVR即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
在过去几天里,几部新剧开始播出,其中《御饭团》备受期待。这部作品播出后迅速走红,热度居高不下,在各大社交平台也频繁出现相关话题和热搜。接下来将为大家介绍...
02-20
当前热播的电视剧《我家王妃怀里藏着万能空间》备受关注,多位知名演员凭借出色的演技赢得了观众的喜爱。剧情和人物设定也得到了广泛认可,被认为既合理又精彩...
02-21
  山东博兴县湖滨镇姜韩社区卫生室服务3000多人,改造后每月就诊人数增加200多人――  “小村卫生室”6个月快速涨粉,靠什么?  数据来源:国家卫生健康委  “今天...
01-21
  近年来,公众对颈动脉斑块的关注度越来越高,有些患者甚至主动要求检查是否存在颈动脉斑块。 ...
02-07
   ——推进新时代中小学科学教育发展综述  “树木年轮的一圈就代表一年吗?”“水杯杯壁边...
01-21
师生在街头义务为群众书写春联 贾敏杰 摄  当日,河北省石家庄新乐市东长寿学校举行“金蛇送福、柿柿如意”师生义务书写春联活动,师生为群众书写春联福字,传递新年祝福。 编...
01-21
  原油期货在上周走高后本周维持震荡,从当前市场逻辑来看,分析人士认为,短期原油价格向上驱动不...
01-24
   当地时间1月24日(周五),美股三大指数收跌,道指跌0.32%,标普500指数跌0.29%,纳指跌0.5%。美国1月...
01-27
双子座男和处女座女是两个截然不同的星座,他们在性格、兴趣和价值观上存在一些差异。然...
01-22
摩羯座是一个土象星座,他们对于爱情有着独特的看法和态度。他们通常会在感情中保持理性...
01-22
长裤怎么搭配? 男士棉麻长裤搭配?一、长裤怎么搭配?1. 长裤的搭配需要根据具体的场合、季节和身材等因素来决定,总的来说,需要考虑搭配的合理性、舒适性、时尚性和个性化等方面。...
02-07
女式黑色衬衫怎么搭配?一、女式黑色衬衫怎么搭配?1,搭一件米色,或者白色的外衣。把黑色的领子折出来,这样看起来就不单调,如果单是一身黑的话,就显得很单调了。2,或者找很帅气的皮带...
02-17
2月6日消息,抖音电商规则中心更新了调整保证金和“0元入驻”的新规则:降低34个一级类目商家的保证金,最高降幅达85%;同时首次大批量开放1345 个子类目“0元入驻”,减少新商家的入...
02-07
2月16日消息,苏宁易采云近日先后中标多个重点项目,作为综合实物电商供应商,将充分发挥系统平台及自营供应链优势,助力政企采购更高效更便捷。其中,苏宁易采云中标江苏省政府采购...
02-17
2月20日消息,全国多地中小学已经开学,途牛《2025寒假出游消费盘点》显示,今年寒假旅游热度呈现出分段式“三峰”出游的显著特征:第一波出游高峰自假期伊始就迅速形成,并在1月20日...
02-21
2月27日消息,智能支付网络平台Thunes宣布将其直连的全球网络(Thunes’ Direct Global Network)扩展至台湾市场,新举措将Thunes的Pay-to-Banks银行支付功能引入该地区,进一步提升...
03-01
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
【#国电电力在香格里拉成立新能源开发公司# 注册资本9000万】天眼查App显示,近日, 香格里拉云能新能源开发有限公司成立,法定代表人为王金荣,注册资本9000万人民币,经营范围包括...
02-09
今日(1月23日),网格Roguelike牌组构建游戏《Rogue Inferno》Steam页面开放,发售日待定,暂不支持中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: RogueIn...
01-24
V社发布了2025年1月Steam硬件调查,最流行的配置如下: 显卡 RTX 3060依旧是最流行的显卡,占比5.2%,但份额比上个月(2024年12月)的6.02%下降了0.82个百分点。其次是...
02-04
为解决社会广泛关注“小案重罚”和“类案不同罚”问题,按照《国务院关于进一步规范和监督罚款设定与实施的指导意见》,市场监管总局今天发布《市场监管行政违法行为首违不罚清...
02-07
“买短乘长”致使列车超载,今年春运又出现了。据媒体报道,近期有列车经过河南信阳时,因一些旅客未在票面到达站下车造成超员,导致部分正常购票旅客没能上车。经过铁路部门协调安...
02-10
1月20日,我国首款起飞重量5.25吨、最大载重1.9吨的大型无人机鸿雁(HY100)在新疆石河子市天域航通石河子生产基地成功实现量产下线,其中3架顺利向客户完...
01-21
近日,在中国空间站梦天实验舱航天基础试验机柜其中一个“太空抽屉”里,开展了地外人工光合作用技术试验,成功实现了高效二氧化碳转换和氧气再生新技术...
01-21
  据广州铁路警方通报,春运大幕开启,随着客流节节攀升,广州南站安检口查获不少禁止携带上车的行...
01-21
    消费升腾跳动,城市脉搏跃动,新春的广州一片火热。  刚过去的蛇年春节假期,广州各大商圈...
02-06
  国补开启首日:支付系统“挤崩了”,平板与手机线上销量增长翻倍  伴随着春节行情的开启,各大手机厂商和渠道平台在“国补首日”就抢起了声量,试图从此轮补贴战役中获得“开...
01-21
  机票大降再现:春节北京往返三亚跌幅千元,旅客退票再订求性价比  随着春运火车票开售,不少热门目的地机票价格呈现下降趋势,游客出行性价比再度提升。1月19日,有游客向北京...
01-21
  近日,丰田中国宣布雷克萨斯中国执行副总经理李晖升任总经理,这是丰田入华以来首次由非日本籍...
01-21
1 月 26 日消息,近期德国多家企业,包括能源供应商 Badenova、房屋建筑公司 Viebrockhaus 以及连锁药店 Rossmann,纷纷表示将不再购买特斯拉的新车,原因是特斯拉首席执行...
01-27
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮