警惕人工智能欺骗性升级|今日视点

7个月前来源：科技日报观看：32

图片来源：视觉中国

科技日报记者张梦然

一篇人工智能（AI）领域的文章引起轩然大波。

这篇文章发表在《模式》杂志上，其总结了先前一些研究，向人们揭示了一个真相：一些AI系统已学会了欺骗人类，即使是经过训练的、“表现”诚实的系统。

它们欺骗的方式包括为人类行为提供不真实的解释，或向人类用户隐瞒真相并误导他们。

这让人很惊恐。

因为它突显了人类对AI的控制有多困难，以及人们自认为尚在掌控中的AI系统工作方式，很可能是不可预测的。

AI为什么要这么做？

AI模型为了实现它们的目标，会“不假思索”地找到解决障碍的方法。有时这些变通办法会违背用户的期望，并且让人认为其具有欺骗性。

AI系统学会欺骗的一个领域，就是在游戏环境中，特别是当这些游戏涉及采取战略行动时。AI经过训练，必须要实现获胜这一目的。

2022年11月，Meta公司宣布创建Cicero。这是一种能够在《外交》在线版本中击败人类的AI。《外交》是一款流行的军事战略游戏，玩家可以在其中建立谈判联盟，争夺对土地的控制权。

Meta的研究人员已经根据数据集的“真实”子集对Cicero进行了培训，使其在很大程度上诚实且乐于助人，并且它“绝不会为了成功而故意背刺”盟友。但最新的文章揭示，事实恰恰相反。Cicero会违反协议，彻头彻尾地撒谎，还能进行有预谋的欺骗。

文章作者很震惊：Cicero被特意训练要诚实行事，但它却未能实现这一目标。这表明AI系统在进行忠诚训练后，仍然可以意外地学会欺骗。

Meta方面既没有证实也没有否认此次关于Cicero表现出欺骗行为的说法。一位发言人表示，这纯粹是一个研究项目，该模型只是为了玩游戏而建立的。

但这并不是唯一一个AI欺骗人类玩家获胜的游戏。

AI经常欺骗人类吗？

阿尔法星是深度思维公司为玩电子游戏《星际争霸Ⅱ》而开发的AI。它非常擅长采取一种欺骗对手的技巧（称为佯攻），这个技巧使它击败了99.8% 的人类玩家。

另一个名为Pluribus的AI系统，非常成功地学会了在扑克游戏中“虚张声势”，以至于研究人员决定不发布其代码，因为担心它会破坏在线扑克社区。

除了游戏之外，AI欺骗行为还有其他例子。OpenAI的大型语言模型 GPT-4 在一次测试中展示出说谎能力。它试图说服人类为其解决验证码问题。该系统还在一次模拟演习中涉足冒充股票交易员的身份进行内幕交易，尽管从未被明确告知要这样做。

这些例子意味着，AI模型有可能在没有任何指示的情况下，以欺骗性的方式行事。这一事实令人担忧。但这也主要源于最先进的机器学习模型的“黑匣子”问题——不可能确切地说出它们如何或为何产生这样的结果，或者它们是否总是会表现出这种行为。

人类该怎么应对？

研究表明，大型语言模型和其他AI系统，似乎通过训练具有了欺骗的能力，包括操纵、阿谀奉承和在安全测试中作弊。

AI日益增强的“骗术”会带来严重风险。欺诈、篡改等属于短期风险，人类对AI失去控制，则是长期风险。这需要人类积极主动地拿出解决方案，例如评估AI欺骗风险的监管框架、要求AI交互透明度的法律，以及对检测AI欺骗的进一步研究。

这个问题说来轻松，操作起来非常复杂。科学家不能仅仅因为一个AI在测试环境中具有某些行为或倾向，就将其“抛弃或放生”。毕竟，这些将AI模型拟人化的倾向，已影响了测试方式以及人们的看法。

剑桥大学AI研究员哈利·劳表示，监管机构和AI公司必须仔细权衡该技术造成危害的可能性，并明确区分一个模型能做什么和不能做什么。

劳认为，从根本上来说，目前不可能训练出一个在所有情况下都不会骗人的AI。既然研究已经表明AI欺骗是可能的，那么下一步就要尝试弄清楚欺骗行为可能造成的危害、有多大可能发生，以及以何种方式发生。

责任编辑：左常睿

点击展开全文

本文链接：http://www.gihot.com/news-2-6913-0.html警惕人工智能欺骗性升级|今日视点

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：灵感源于大自然的光合作用，掺杂空气可让有机半导体更导电|总编辑圈点

下一篇：艾滋病疫苗研发再传好消息——一种中和抗体可几周内发挥作用

为你推荐

分付取现商家秒提,2024最新的5个方法

分付取现商家秒提,2024最新的5个方法微信的收款码分为两种，一种是个人收款码，一种是商家收款码，其中商家收款码提交申请后需要通过审核才可以获得，而个人收款码是不需要审核的。...

08-09

实体!上海青浦区套白条当面取3种秒到账的办法(首次用户必看攻略)

上海青浦区本地当面套花呗京东白条VISA信用卡分付一手商家秒到账：【150 0062 3958 微信同号】一手当面靠谱！白条怎么套出来，大家在急用钱的时候肯定会想到京东白条或者京东金条...

08-06

号外号外：分付怎么套出来最靠谱1分钟告诉你取现小技巧

提现商家V：sshh1838微信分付是一款腾信旗下信用消费产品，类似于分期乐的购物额度，主要是消费使用的一个产品。大家在场景消费使用的时候可以选择使用分付额度支付，也可以把分...

08-05

小二一招教会: 羊小咩享花卡额度取现, 我教你必成功的方法

利于国者爱之，害于国者恶之。　　译：对于国家有利的事就要热心地去做，对国家有害的事就要憎恶它，远离它。内容充实的生命就是长久的生命。我们要以行为而不是以时间来衡量生命...

08-05

必看的技巧：得物分期购200怎么套出来全天提现小二：

现在网络鱼龙混杂，请认准靠谱八年商家，金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【得物佳物分期购可以提现吗】【得物的分期购额度怎么套出来...

08-18

总结五个办法：得物分期购物额度如何提现出来终于发现：

08-17

北京车展见东风奕派eπ008官图发布

[本站新车官图] 日前，我们获取到了一组东风奕派eπ008车型的官图，新车定位为一款6座中大型SUV，将于4月开幕的北京车展上首发亮相。可以看到，新车采用了家族式设计语言进...

04-08

头条！沈阳京东白条额度怎么套出来(有这几个小技巧轻松拿钱)(记住这两点不会风控)

沈阳风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-30

横评:分付有额度怎么套出来-秒到6种绝对技巧

横评:分付有额度怎么套出来-秒到6种绝对技巧可以在使用微信支付时先用分付进行付款，然后分期还款不过微信分付是没有提现功能的，不可以提现后进行使用作为当今最流行的社交应...

08-25

大寒的粥品选择吃这些能够保健身体

对于我们很多人来说，在冬季的时候都容易出现气血不足的情况了，尤其是对于女性朋友们来说就更是如此了，如果出现了气血不足的问题，那么在冬季的时候就会出现很多身体问题了，在这时...

04-02

山东省人力资源和社会保障厅庆祝第40个教师节活动在山东公路技师学院举行

　　大众网记者刘佳琦隋宜笑济南报道　　9月10日，为纪念第40个教师节，山东省人力资源和社会保障厅在山东公路技师学院举办庆祝活动。山东省人力资源和社会保障厅党组书...

09-12

科学家揭开腕足动物2.5亿年来多样性衰退之谜

7月25日，中国地质大学（武汉）教授陈中强团队与英国布里斯托大学、英国开放大学研...

07-26

当面！天津哪里套京东白条提现最划算本市当面强烈推荐！(掌握这2种方法100%取现成功)

天津风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-23

当面！杭州当面套VISA卡支持线下秒（无中间商赚差价）(记住这两点不会风控)

杭州风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-16

实体！常州套京东白条信用购靠谱流程(流程一分钟秒回款商家)(本地一手商家当面秒刷)

常州风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-07

实体！南宁套花呗信用购具体步骤本地商户支持线下当面秒(记住这两点不会风控)

南宁风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-07

六万亿化债措施，化的是什么？

一锤定音。近年来最大规模的一次财政增量正式发布。 11月8日，增加地方政府债务限额置换存量隐性债务的议案经全国人大常委会批准，明...

11-09

全国首个“镇改市”龙港跑通低成本设市模式，5年改革探路新型城镇化

21世纪经济报道记者柳宁馨杭州报道5年前，温州龙港撤镇设市，也是全国首个“镇改市”。5年来，龙港特大镇设市有哪些成效，又为新型城镇化和城乡...

09-10

全部导航

警惕人工智能欺骗性升级|今日视点

全球首座移动式注热平台“热采一号”交付

店面：白条秒到怎么刷,白条兑换的过程是什么

2024教程：合肥肥西县套抖音月付一手商家突破一切限制！(8月最新方法当面秒)

必看：注单异常被审核了3天怎么办解决办法

惊愕:成都武侯区套京东白条加油额度这么简单线下（3秒拿钱堪称业界标杆）

超快!大连西岗区套京东白条加油额度这么简单（3秒拿钱堪称业界标杆）

真实!杭州富阳区套京东白条加油额度这么简单线下(一手商家无中介收费)

名副其实!济南套花呗信用购(新手必须知道的方法)