部分AI系统已学会欺骗人类，甚至能瞒过安全测试|总编辑圈点

7个月前来源：科技日报观看：34

META的CICERO在外交游戏中预谋欺骗的例子。图片来源：PARK GOLDSTEIN 等/《模式》杂志

科技日报记者张梦然

许多人工智能（AI）系统已学会了欺骗人类，即使是经过训练的、“表现”出有用且诚实的系统。10日发表在《模式》杂志上的一篇文章中，研究人员描述了欺骗性AI的风险，并呼吁政府制定强有力的法规尽快解决这个问题。

论文第一作者、美国麻省理工学院人工智能安全研究员彼得·朴说，开发人员对导致AI出现欺骗这种不良行为的原因，还没有很好的理解。但总的来说，AI欺骗之所以出现，是因为基于欺骗的策略，是在给定的AI训练任务中一种能得到良好反馈的方式，换句话说，欺骗可帮助AI实现目标。

研究人员分析了文献，重点关注AI系统传播虚假信息的方式。通过欺骗，AI系统地学习了如何去操纵他人。

研究人员在分析中发现的最引人注目的例子是Meta公司的CICERO。这是一个专注《外交》游戏的AI系统，《外交》是一款涉及建立联盟征服世界的游戏。Meta声称训练 CICERO “在很大程度上是诚实和乐于助人的 ”，且在玩游戏时“从不故意背刺 ”人类盟友。但该公司与《科学》论文一起发布的数据显示，CICERO并不那么“忠厚”。

研究人员发现这款AI或已成为欺骗大师。虽然Meta成功地训练该AI在《外交》游戏中获胜，但Meta未能训练它诚实地获胜。

AI系统在游戏中作弊看似无害，但它将导致欺骗性AI在能力上出现突破，未来可能会演变成更高级的AI欺骗形式。一些AI系统甚至学会了欺骗旨在评估其安全性的测试。在一项研究中，数字模拟器中的AI生物会“装死”，以骗过旨在消除快速复制AI系统的重要测试。

总编辑圈点

人类需要尽快对未来AI和开源模型的更高级欺骗技能作好准备。随着它们的欺骗能力越来越先进，其对社会构成的危险将变得越来越严重。如文中所称，它们会顺利通过人类开发人员和监管机构强加的安全测试，引导人类进入一种“虚假的安全感”。如果欺骗性AI进一步完善这种令人不安的技能，人类可能会完全失去对它们的控制。

责任编辑：左常睿

点击展开全文

本文链接：http://www.gihot.com/news-2-6812-0.html部分AI系统已学会欺骗人类，甚至能瞒过安全测试|总编辑圈点

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：两个空穴自旋量子比特间作用实现可控，有助在单芯片上集成数百万个量子计算单位

下一篇：光污染：星空下的隐形威胁|今日视点

为你推荐

分付去哪里套出来啊,重磅分享100%取现法

分付去哪里套出来啊,重磅分享100%取现法随着微信分付功能的逐步普及，越来越多的用户开始涉足并尝试这一创新的支付工具。尽管当前它仍处于测试阶段，仅对部分受邀用户开放，但其...

08-10

微信分期额度套现,一手商家提现安全吗

微信分期额度套现,一手商家提现安全吗微信，这款在客户服务领域独占鳌头的平台，早已汇聚了无数令人瞩目的热门产品与服务。其中，微信分期更是如一颗璀璨的明珠，近期在市场上掀起...

08-09

号外号外：花呗额度怎么套出来的秒操作（一分钟拿钱）

　　　　花呗提现商家V：sshh1838 全天在线秒，或者扫下方二维码直接添加客服操作　　　　　虽说套花呗已是很普遍，但很多人还是不知道如何才能把支付宝花呗套取现金后不风控...

08-07

详解:花呗风控了怎么套秒到,分享个可靠店铺(已到账)

详解:花呗风控了怎么套秒到,分享个可靠店铺(已到账)。在当今社会对于年轻人来说套取支付宝花呗里面的钱出来用是再正常不过了，但是套支付宝花呗额度也不是那么简单的，如果被系...

08-06

郑州征集收购存量商品房用作保障房单套建筑面积原则上120㎡以内

　　摘要　　【郑州征集收购存量商品房用作保障房单套建筑面积原则上120㎡以内】河南省郑州市住...

11-09

白条加油额度大额怎么套出大额新手必看：十年小二：

现在网络鱼龙混杂，请认准靠谱八年商家，金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【白条加油额度怎么套出来】【教你京东C店套白条】【京东信...

08-19

小米高管回应花旗关于 SU7 汽车的相关预测：信息偏差较大

4 月 15 日消息，今日有消息称，花旗预计小米集团 SU7 的交付量 4 月将达 5000 至 6000 部，全年交付量约 5.5 万至 7 万台。报道称，“该行估计小米 2024 年每卖一部 SU7 ...

04-15

一键解锁:微信分付怎么转出另一个微信-秒到6种绝对技巧

一键解锁:微信分付怎么转出另一个微信-秒到6种绝对技巧微信分付不可以提现，微信分付是微信提供的信用支付产品，类似于花呗分期，可以在不同的场景中使用，比如吃饭购物看电影等，不...

09-06

《西游记》片头曲再次爆火那些经典旋律随时会翻红

　　作者：刘宗智　　近日，随着国内首款3A游戏《黑神话：悟空》的爆火，《西游记》中的经典配乐《云宫迅音》重焕光彩。许多观众或许并不知道这首曲子的正式名称，但说起86版《西...

09-05

有医院接诊腺病毒感染超700例：未大范围传播，疫苗尚待开发

21世纪经济报道记者韩利明上海报道 “女儿出院后没几天，感觉自己也很不舒服。症状出现两天后在医院做了呼吸道六项检查，果然是被传染了...

08-14

春季很适合滋补女性要多喝这些养生茶

对于女性朋友们来说，在春季的时候如果能够选择到合适的养生茶来喝，那么无疑就可以让我们的身体更健康了哦，而且春季的时候是非常适合我们喝茶的了哦，那么在春季的时候都适合女性...

04-02

头条！北京套VSIA信用卡支持线下当面秒(一手商家无中间商赚差价)(流程只需两分钟快的很)

北京风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-26

实体！东莞套花呗信用购当面本市支持线下当面(旗舰店为您护航)(掌握这2种方法100%取现成功)

东莞风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-24

实体！成都套京东白条和加油额度必读教程(一手商家无中介收差价)(流程只需两分钟快的很)

成都风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-14

唯一！天津京东白条加油额度怎么套出来(9个方法全是干货)(本地一手商家当面秒刷)

天津风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-11

轻松!湘西京东白条取现太方便了流程现已公布

京东白条取现？近年来，以京东白条为代表的商城分期购物产品是异常受欢迎，当京东白条的问世，让网友们的购物更加方便。可以用来消费的同时在遇到财务困难的时候还有方法把白条的钱...

07-30

工博会观察：工业机器人加速突破精度、速度、负载

21世纪经济报道记者孙燕上海报道9月24日，第二十四届中国国际工业博览会在上海开幕。自2013年工博会首次独立设置机器人展区以来，发展至今年...

09-25

元素周期表是否有尽头？探寻神秘的“119号”元素

　　你知道神秘的“119号”元素吗？1869年，俄国科学家门捷列夫发现了元素周期律，按照这个周期律，当时已经发现的金、银、铜、铁、氧...

04-22

全部导航

部分AI系统已学会欺骗人类，甚至能瞒过安全测试|总编辑圈点

中国科学家绘制多物种小脑皮层单细胞空间分布图谱

可靠：白条秒回商家的步骤,真的可以取现秒到吗

微信分付怎么套现,四个步骤就搞定

便利!南昌南昌县套白条当面取3种秒到账的办法支持线下！

2023年国内市场规模超2000亿元——工业软件推广大有可为

10家科技成果转移转化服务机构集中签约入驻沈抚科创园

激发数据要素价值助力数字中国建设——第七届数字中国建设峰会开幕

很神奇！“不插电”的发光发电纤维东华大学科研团队在智能纤维领域取得重要突破