ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

5个月前 来源: 观看:90

jFp即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。jFp即热新闻——关注每天科技社会生活新变化gihot.com


jFp即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)jFp即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖jFp即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利jFp即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
  昨天,哔哩哔哩(B站)宣布与中央广播电视总台《2025年春节联欢晚会》达成重要合作。除夕夜,哔哩哔...
01-22
‌《余烬之上》廖知白结局是he吗?在电视剧《余烬之上》中,廖知白的结局是HE(Happy Ending),即圆满结局。‌‌在电视剧中,廖知白并没有死。十年前的一场火灾导致廖...
02-21
1月22日,国家卫健委、国家中医药局联合发布《流行性感冒诊疗方案(2025年版)》,新增玛巴洛沙韦、法维拉韦两种抗流感病毒药物,并明确不建议联合...
01-23
21世纪经济报道记者武瑛港 北京报道近日,羟基磷灰石的使用问题在医美行业内快速升温。记者获悉,2025年1月21日,深圳市市场监督管理局、深圳市...
01-23
    孙鸿烈(下)在青藏高原做考察记录。受访者供图  ■本报记者韩扬眉  从雅鲁藏布江大拐...
01-21
  大众网记者 秦瑾 通讯员 吴悦 报道  12月19日,2024年度山东省数据要素发展大会暨可信数据空间建设启动会在山东大厦举行。齐鲁师范学院人工智能教育研究院研发的“...
01-21
  我国农村信用社联合社改革明显提速,2024年12月24日国家金融监督管理总局批复同意筹建江苏农...
01-22
  2024年12月30日,中国信托业协会发布《2023—2024中国信托业社会责任报告》(以下简称《报告》)...
01-24
水瓶座男生以其独特的思维方式和开放的个性而闻名。他们喜欢追求自由和创新,对于传统观...
01-22
天蝎座的男生通常深沉、神秘,他们不会轻易表露自己的感情。然而,当一个天蝎男爱上你时,他...
01-22
lv蒙田包包哪款最好? lv哪款包包性价比高?lv蒙田包包哪款最好?lv蒙田包包中号最好背中号的蒙田包除了能装,搭配感也很强。而且通勤避免不了的就是不能精心呵护,包包棕色皮,而且很...
02-12
闪亮登场:儿童模特服装T台走秀背后的魅力每当音乐响起,聚光灯洒落,孩子们在T台上翩翩起舞,那一刻简直如同童话般梦幻。作为一名网站编辑,我对儿童模特服装T台走秀的热情不仅源于...
02-17
2月7日消息,秦皇岛津峰线缆制造有限公司(以下简称:津峰线缆)董事长韩金良一行日前到访涂多多。现场,涂多多副总裁、跨境产发部常务副总经理郑德莲与津峰线缆副总经理韩冬共同签署...
02-07
黄峥:一个好的公司应该花力气去解决克服那些正确又难的问题,而不是四处捡一大堆芝麻。1.拼多多首页测试改版在电商行业中,变化一直是常态。日前,亿邦动力独家透露,拼多多App首页...
02-20
2月8日消息,美团数据显示,2月5日复工以来,平台上“开工奶茶”相关搜索量同比增长超10倍,北京、上海、广州、深圳、重庆为搜索量排名前五的城市。其中,35岁以下人群搜索占比48.1%,...
02-08
需求降温,飞天茅台、红花郎红10等价格下跌春节前后,受需求...
02-21
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
到目前未知,2025年最大的游戏新闻无疑是上周宣布的任天堂 Switch 2,但除了目前确认的只有一款在预告中出现的《马里奥赛车》新作以外,任天堂还没有宣布这款新硬件...
01-24
网易策略游戏《万民长歌:三国》Steam商店页公开,计划推出DEMO以供试玩,计划登陆创意工坊,鼓励玩家制作游戏mod,以古中国这片大地为舞台,创造更多创意的玩法。 《万...
02-10
央视记者获悉,当地时间2月5日,美国一名法官黛博拉·博德曼在马里兰州格林贝尔特举行庭审后发布了初步禁令,阻止特朗普旨在终止“出生公民权”的行政令的实施。美国总统特朗普1...
02-06
2月8日,抖音发布《抖音关于打击无底线博流量行为的公告》,对“张兰·俏生活”、“张兰之箖玥甄选”、“汪小菲”等账号予以无限期封禁。公告称,近期,徐熙媛(大S)女士逝世引发广泛...
02-08
1月14日,记者从中国科学院合肥物质科学研究院等离子体物理研究所(以下简称“等离子体所”)获悉,由该所建设运行的国家重大科技基础设施“聚变堆主机关...
01-21
不久前,国家卫生健康委、国家中医药局、国家疾控局联合发布《卫生健康行业人工智能应用场景参考指引》,列出药物研发等84种具体应用场景,为人工智能(AI...
01-21
  受到近期寒潮天气影响,渤海辽东湾海域的海冰发展迅速,目前辽东湾超过四分之一的海面被海冰覆盖。...
02-07
  2月11日,国家统计局辽宁调查总队公布调查数据显示,2025年1月份,辽宁居民消费价格(CPI)同比上涨0.3%,涨幅...
02-13
  正月初七返程火车票今日开抢,预计当天为节后客流高峰日  正月初七返程火车票今日开抢!  1月21日,按照铁路车票预售期,旅客可以购买2月4日(正月初七)的火车票。2025年铁...
01-21
  开年A股第一宗并购!紫金矿业137亿元入主藏格矿业  1月16日,备受市场瞩目的2025年A股并购第一单落锤。  1月16日晚间,藏格矿业(000408.SZ)公告,紫金矿业(601899.SH)同步...
01-21
1 月 24 日消息,小鹏汽车 MONA 产品负责人@XP-杨光 今日分享视频介绍了 MONA 车型的第五次大规模 OTA。他称“工程团队在原计划的基础上,全力做了压缩,终于赶在了春节...
01-25
2 月 1 日消息,今日有多位博主分享海报,2025 年 2 月 1 日至 2 月 28 日期间支付定金购买蔚来,可享首付 20% 起,5 年 0 息特惠金融方案。还可叠加:10000 元选装基金20000...
02-01
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮