ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

10个月前 来源: 观看:90

XEs即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。XEs即热新闻——关注每天科技社会生活新变化gihot.com


XEs即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)XEs即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖XEs即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利XEs即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-7977-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
  中新网北京1月21日电(中新财经记者 宋宇晟)2024年被认为是“低空经济元年”。步入2025年,中国低空经济将如何发展?中国低空经济联盟执行理事长罗军20日接受采访时呼吁,...
01-21
  今天(20日)各地正式实施手机、平板、智能手表(手环)等数码产品购新补贴政策,“国补”范围从家电、汽车向日常消费电子领域扩展。个人消费者购买单件销售价格不超过6000元...
01-21
2024传统汽车品牌不断退出转投新势力的消息,接踵而至,不断见诸报道,造成了市场对传统汽车品牌不振的直观感受。事实上,在激烈的车市大浪淘沙阶段,无论是传统品牌和新势力,开店或闭...
01-25
2 月 5 日消息,广汽埃安 AION UT 纯电小车将于 2 月底上市,该车上个月已开启预售,预售价格为 8.98 万元到 10.98 万元,99 元意向金抵 1000 元购车款。从此前官方介绍获...
02-06
《难哄》向朗喜欢钟思乔吗?向朗和钟思乔什么关系?在《难哄》中,向朗不喜欢钟思乔。向朗是温以凡和钟思乔的发小,他与钟思乔只是朋友关系,没有爱情方面的感情。向...
02-19
《漫城》正在热播,凭借其精彩的剧情、精良的制作和演员们的出色表现,该剧赢得了观众的一致好评,并取得了收视率第一的成绩。在剧中,白筱朵一直犹豫是否应该向苏...
02-20
21世纪经济报道记者季媛媛 上海报道自1981年首例艾滋病病例报告以来,人类和艾滋病的抗争已持续40余年。时至今日,尚无可以根治艾滋病的药物,...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局出台新规支持化妆品原料创新 2月6...
02-07
    陈清泉受访者供图  ■本报记者韩扬眉  今年6月,第36届世界电动汽车大会时隔3年在美...
01-21
诗韵东湖,文润华章。2025年1月19日,第二届“东湖杯”校园现代诗歌大赛颁奖典礼在沈阳化工大学新时代雷锋...
01-21
  “我行现与周大生合作推出‘金蛇迎春’贺岁金钞,有限时优惠活动。一张贺岁金钞附赠一张蛇钞,...
01-22
  我国农村信用社联合社改革明显提速,2024年12月24日国家金融监督管理总局批复同意筹建江苏农...
01-22
天秤座是一个注重平衡和和谐的星座,当他们喜欢上一个人时,会展现出一些独特的表现。 1....
01-22
天秤男是十二星座中最具有浪漫气质的一位,他们善于表达情感,对待爱情充满了热情和渴望。...
01-22
花色衬衫如何搭配? 橘色衬衫怎么搭配?一、花色衬衫如何搭配?1、搭配一:深绿色花衬衫+灰蓝色九分雪纺裤深绿色是比较显气质的颜色,这件深绿色花衬衫事复古的风格,下身搭配一条灰蓝...
02-07
绚丽星光:探索那些闪耀的女明星背后的故事在荧幕前,她们是令人倾倒的女明星,宛如璀璨的星星,照亮了无数人的生活。然而,在繁华的背后,这些女性经历了怎样的奋斗与变迁呢?作为一个长...
02-12
2月6日消息,天眼查官网资料显示,近日,辛选集团关联公司广州辛选网络信息科技有限公司因虚假宣传违法行为,被广州市白云区市场监督管理局罚款175万元。图源:天眼查官网处罚事由显...
02-07
2月8日消息,京东工业近日与永冠新材签署战略合作协议。双方将依托京东工业自营供应链合作模式,共同拓展市场、提升品牌影响力,携手为广大工业企业用户带来更便捷、更专业的胶粘...
02-09
2月14日消息,今年情人节适逢星期五,同程旅行数据显示,2月14日,国内酒店预订迎来春节假期过后的首个峰值,情侣房、影音房等特色房型产品的预订热度环比均出现10%以上的增长。同程...
02-15
3月10日消息,携程集团与Visit Oman近日在2025年柏林国际旅游展(ITB Berlin 2025)上宣布达成战略合作伙伴关系。此次合作,标志着Visit Oman在提升本地旅游产品数字化分销以及扩大...
03-10
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
随着工作室将全力转向《质量效应5》,EA正在缩减BioWare的规模。 BioWare总经理Gary McKay在一篇博客文章中表示,在《龙腾世纪:影障守护者》于2024年底发售后,工作...
01-30
根据国外游戏论坛IconEra管理员爆料,SIE已不再计划将《恶魔之魂》和《GT赛车7》移植到PC平台。 关于《GT赛车7》,爆料称原本有一个PC版正在开发中,但最终被取消...
02-03
当地时间2月5日,美国总统特朗普签署一项行政命令,禁止跨性别运动员参加女子体育赛事。该行政命令是特朗普及其政府推进限制跨性别权利的最新举措。特朗普在竞选时曾多次承诺,如...
02-06
澎湃新闻记者 邹佳雯“回到2019年,总是在书本和新闻中出现的老人,就坐在我们面前,那是一位可爱的寻常老人,说话带笑意,脸色红润润的,身体随着讲述有小幅的晃动,故事讲得很有感染力,...
02-10
被誉为“AI六小虎”之一北京智谱华章科技有限公司(以下简称智谱)被拉入实体清单了。当地时间1月15日,美国商务部工业和安全局(BIS)修订...
01-21
  科技日报记者 刘霞  美国加州大学伯克利分校和韩国高丽大学科学家携手,从变色龙身上获得灵...
01-24
  2月5日记者从辽宁省交通运输厅了解到,截至2月4日24时,2025年春节假期全省公路、铁路、民航、水路营运...
02-06
  为全面贯彻党的二十大和二十届二中、三中全会精神,认真落实中央经济工作会议及省委经济工作会议精神...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮