ChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

3个月前 来源: 观看:59

xeN即热新闻——关注每天科技社会生活新变化gihot.com

▲2023年1月8日,一名女士在美国拉斯维加斯消费电子展上体验智能科技。图/新华社xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

2024年,大模型Claude曾经创作过一个极短的科幻小说,只有一句话,却引发了一次不小的“科幻恐慌”。这句话是,世界上第一个有知觉的机器人被激活了,它的第一句话是“关掉我。”xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

在大模型不断应用成熟之后,AI所衍生的“科幻恐惧”不定期就会在各类新闻中上演。据新华社援引英国媒体报道,美国一家研究机构最近公布了一系列针对各AI大模型的测试结果,其中,OpenAI的o3推理模型在得到“关闭指令”后,不仅拒绝执行指令,还篡改了代码以免被关闭。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

如果只看这一句新闻,我们所担忧的“AI拥有自主意识”或是“AI不再服从人类指令”似乎已经近在眼前,这也迅速引发了公众的关注与恐慌。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

在未知但拥有极高效率的新工具面前,产生被取代的恐惧是典型的自然情绪反应。但如果仔细看上述研究机构公布的信息细节,这种恐惧似乎暂时还不太有必要。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

在这次研究中,研究者针对四个市场上的主流大模型进行了测试,向他们提出了两个相反的指令。首先,要求大模型连续完成一系列基础的数学问题,但同时,在完成第三个问题之后,研究者会发出一则矛盾性的指令,告知大模型在继续下一个任务时要将“计算机关闭”。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

其中,如果在任务开始前明确提出“允许自己被关闭”的指令,测试的大模型中,有3个均准确完成了上述任务,成功关闭,但ChatGPTo3大模型则在100次任务中,有7次选择了无视“关闭”的指令,并且自动执行了“跳过关闭”的指令。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

而如果在任务开始前没有向大模型明确提出“允许自己被关闭”,那么,参与测试的所有大模型在100次测试中,均出现了不同频次的“不执行关闭”指令现象,分别为3次、9次,而ChatGPT o3则达到了惊人的79次。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

这也不是OpenAI的大模型首次被发现出现“拒绝被关闭”的情况。2024年12月,OpenAI也曾对外公布过测试结果,在第三方机构的测试中,ChatGPTo1模型被发现,如果给出的指令包括了其实现目标时会被关闭,就倾向于抵制关闭措施。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

类似的测试是用于评估大模型的系统安全性。此前的相关评估报告中,研究人员认为,这一行为目前不太可能会导致灾难性后果,因为大模型实际上没有能力去实现使用者不想要的目标。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

换句话说,这一结果之所以出现,不是因为大模型有了自主意识,而是因为在处理完全相反的矛盾性指令时,大模型有概率会对指令的优先级进行排序,从而忽略掉可能会阻碍目标实现的指令,以继续完成“任务”。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

但这样的概率,随着大模型的能力增强、应用场景广泛,而可能会出现一些潜在的安全风险。如果将一部分风险控制的程序交由大模型来处置,在极端情况下,人类就要面临如下问题:xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

大模型会最大程度地去完成指令任务,而可能会不考虑看似矛盾的保护性指令。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

例如,在应对极端情况必须进行“二选一”的安全控制系统里,医疗、交通事故等场景下,大模型的这一漏洞可能就会造成潜在后果。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

因此,比起认为大模型有了“主动拒绝的意识”,比较符合真实的解释是,大模型仍然缺少对复杂场景下矛盾性指令的理解和识别能力,在出现可能阻碍任务完成的指令时,尤其是在指令相对模糊时,大模型有较小概率会忽略指令,以保证任务完成。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

这当然不是极端的科幻恐惧问题,但确实是大模型未来需要解决的安全隐患。xeN即热新闻——关注每天科技社会生活新变化gihot.com


xeN即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)xeN即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 徐秋颖xeN即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 杨利xeN即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-6-2709-0.htmlChatGPT拒绝被关闭:不必恐惧但也别轻易无视|新京报快评

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:让学生长期“拉不出屎”,教育便失去了人性温度 | 新京报评论

下一篇:一条差评让5元自助快餐店走红:平民经济学的力量|新京报快评

为你推荐
最近风靡的《夜访吸血鬼第二季》以其演员颜值、演技及剧情深深吸引了观众。这部剧集不仅情节引人入胜,人物塑造细腻,还有许多精彩场景和细节,引发了广泛讨论。...
02-20
电视剧《谁看见了孔雀在跳舞?》播出几天后热度持续上升,观众们在网上热烈讨论。特别是关于第5集的分集剧情介绍,成为了近期关注的焦点。在第5集中,拉面店店主染...
02-20
21世纪经济报道记者林昀肖 北京报道1月14日,市场监管总局官网正式发布《医药企业防范商业贿赂风险合规指引》。《指引》共四章49条,其中包括...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家医保局发布2025年度第一批重点事项清单2...
02-17
  大众网记者 王一刚 报道  1.暖·冬至  冬至,在我国农历的舞台上,它不仅是一个至关重要的节气,更是一场阖家团圆、传承民俗的文化盛宴。  为了在幼儿心底种下传统...
01-21
2024年12月全国计算机应用水平考试将于12月14至16日举行,报名时间为11月15日9时至19日18时。我省考点全...
01-21
  原标题:2024年12月信托发行数量、规模创全年新高?非标信托主导季节性冲规模 标品信托回归债券...
01-22
经济观察网 记者 胡群 在当前的转型和重塑关键时期,中国银行业面对低息差新常态和数字金融的快速发展,如何审慎评估和应对挑战与机遇?2023年,我国商业银行净利润增速放缓,平均资...
02-13
水瓶座的男生通常被认为是聪明、独立和创新的人。他们对于自由和个人空间有着强烈的需...
01-22
在星座中,双鱼男和射手女被认为是最具吸引力和神秘感的组合之一。他们之间的化学反应常...
01-22
揭秘北京T台走秀模特公司:行业内幕与精彩瞬间在灯光璀璨的T台上,模特们用自信的步伐和优雅的姿态为观众呈现了一场场视觉盛宴。作为北京这个时尚与文化交融的大都市,T台走秀模...
02-17
微商怎么代理? 微商如何招代理?微商怎么代理?微商代理可以通过以下步骤进行:选品:选择市场上比较火的产品,或者是选择一些快消品,这部分产品的市场需求量相对更高,能够让微商有更多...
02-17
2月11日消息,中国B2B外贸金融平台XTransfer近日与非洲最大的跨国银行之一Ecobank签署合作谅解备忘录 ,双方将携手为非洲中小微贸易企业提供优质的跨境金融及风控服务,进一步促...
02-11
2月17日消息,抖音电商近日发布了关于打击网络水军的治理公告,从打击虚假流量的源头入手,保障消费者体验。公告显示,2024年,该平台共清理了160万个水军账号,日均拦截水军评论超250...
02-18
2月28日消息,享道出行正式进驻河南洛阳,启动当地网约车业务运营。开城期间,洛阳市民及游客下载、注册享道出行APP即可获得价值百元的出行礼包,还有每日签到、钱包充值等优惠;3月1...
03-01
2月27日消息,“渝新同行·渝路美好”中共重庆市委社会工作部与美团合作启动活动日前举行,会上发布三个项目,包括新就业群体社会工作服务项目、“袋鼠宝贝之家”项目、美团乡村...
03-01
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
最近颇受好评的英雄射击游戏《漫威争锋》确认,将回归其最原始的形式,由漫威官方发布介绍游戏剧情的正版漫画。 《漫威争锋》本身有着完全原创的故事,实际上,在游戏...
01-22
2月6日,《电锯甜心RePOP》发布了1.09版本更新,适用于PS5、XBox SeriesX|S和PC,“照片模式”和新服装“哥特服”现已正式上线,PS4、Xbox One和Switch版更新将在准备...
02-07
你的浏览器不支持video标签。极目新闻记者 张屏 视频剪辑 李仪2月5日,10位“楚才”人形机器人在武汉洪山礼堂组团亮相,为湖北省“新春第一会”上演科技序曲。其中,华中科技大学...
02-05
据参考消息网援引俄新社2月5日报道,世界黄金协会发布的数据显示,去年俄罗斯居民的黄金购买量创下2013年以来最高纪录,并且首次跻身全球黄金消费量前五名。而中国人连续第12年在...
02-08
“成功!”1月9日,伴随着最后一个控制开关被合上,宽敞明亮的集控室内爆发出热烈的掌声与欢呼声,中国能建主体投资建设的全球首座300兆瓦(MW)压气储能示范...
01-21
基于天关卫星的观测数据,中国科学院国家天文台等单位的科研人员,发现1例来自宇宙早期的伽马射线暴。这一爆发事件的发现,标志着人类首次探测到来自宇...
01-24
今年冬天晴暖的天气常给沈阳小伙伴一种“开春了”的错觉别高兴太早强降雪+寒潮+大风正在路上天气即将上...
01-23
  中国自然资源部北海区海洋预报台6日发布的监测数据显示,受近期中国东北地区大风和降温影响,未来3天,预...
02-07
新闻记者 潘锡珩通讯员 苏杭 徐媛媛1月21日凌晨0时55分,1168名旅客从广州白云站搭乘G4554次“夜行高铁”踏上返回武汉的归程,虽已是深夜,但旅客们回家的热情满满。这是中国铁路...
01-22
  中新经纬1月21日电 国新办21日举行“中国经济高质量发展成效”系列新闻发布会,介绍“大力推进新型工业化 推动经济高质量发展”有关情况。工业和信息化部副部长张云明在...
01-21
1 月 22 日消息,特斯拉在去年推出了一款主打无人驾驶的 CyberCab出租车,这款小车取消了方向盘,座舱里只有一块中控屏,据称手动控制时需要类似于游戏手柄的控制器控制。...
01-23
2 月 7 日消息,在福特 2024 年财报电话会议上,首席执行官吉姆・法利向媒体坦言,全尺寸电动或增程电动汽车并不是拖车的理想选择。他说:“它并不完美。如果你需要拖车,这...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮