警惕人工智能欺骗性升级

5个月前 来源:中国科技网 观看:51

一篇人工智能(AI)领域的文章引起轩然大波。S39即热新闻——关注每天科技社会生活新变化gihot.com

这篇文章发表在《模式》杂志上,其总结了先前一些研究,向人们揭示了一个真相:一些AI系统已学会了欺骗人类,即使是经过训练的、“表现”诚实的系统。S39即热新闻——关注每天科技社会生活新变化gihot.com

它们欺骗的方式包括为人类行为提供不真实的解释,或向人类用户隐瞒真相并误导他们。S39即热新闻——关注每天科技社会生活新变化gihot.com

这让人很惊恐。S39即热新闻——关注每天科技社会生活新变化gihot.com

因为它突显了人类对AI的控制有多困难,以及人们自认为尚在掌控中的AI系统工作方式,很可能是不可预测的。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI为什么要这么做?S39即热新闻——关注每天科技社会生活新变化gihot.com

AI模型为了实现它们的目标,会“不假思索”地找到解决障碍的方法。有时这些变通办法会违背用户的期望,并且让人认为其具有欺骗性。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI系统学会欺骗的一个领域,就是在游戏环境中,特别是当这些游戏涉及采取战略行动时。AI经过训练,必须要实现获胜这一目的。S39即热新闻——关注每天科技社会生活新变化gihot.com

2022年11月,Meta公司宣布创建Cicero。这是一种能够在《外交》在线版本中击败人类的AI。《外交》是一款流行的军事战略游戏,玩家可以在其中建立谈判联盟,争夺对土地的控制权。S39即热新闻——关注每天科技社会生活新变化gihot.com

Meta的研究人员已经根据数据集的“真实”子集对Cicero进行了培训,使其在很大程度上诚实且乐于助人,并且它“绝不会为了成功而故意背刺”盟友。但最新的文章揭示,事实恰恰相反。Cicero会违反协议,彻头彻尾地撒谎,还能进行有预谋的欺骗。S39即热新闻——关注每天科技社会生活新变化gihot.com

文章作者很震惊:Cicero被特意训练要诚实行事,但它却未能实现这一目标。这表明AI系统在进行忠诚训练后,仍然可以意外地学会欺骗。S39即热新闻——关注每天科技社会生活新变化gihot.com

Meta方面既没有证实也没有否认此次关于Cicero表现出欺骗行为的说法。一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩游戏而建立的。S39即热新闻——关注每天科技社会生活新变化gihot.com

但这并不是唯一一个AI欺骗人类玩家获胜的游戏。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI经常欺骗人类吗?S39即热新闻——关注每天科技社会生活新变化gihot.com

阿尔法星是深度思维公司为玩电子游戏《星际争霸Ⅱ》而开发的AI。它非常擅长采取一种欺骗对手的技巧(称为佯攻),这个技巧使它击败了99.8% 的人类玩家。S39即热新闻——关注每天科技社会生活新变化gihot.com

另一个名为Pluribus的AI系统,非常成功地学会了在扑克游戏中“虚张声势”,以至于研究人员决定不发布其代码,因为担心它会破坏在线扑克社区。S39即热新闻——关注每天科技社会生活新变化gihot.com

除了游戏之外,AI欺骗行为还有其他例子。OpenAI的大型语言模型 GPT-4 在一次测试中展示出说谎能力。它试图说服人类为其解决验证码问题。该系统还在一次模拟演习中涉足冒充股票交易员的身份进行内幕交易,尽管从未被明确告知要这样做。S39即热新闻——关注每天科技社会生活新变化gihot.com

这些例子意味着,AI模型有可能在没有任何指示的情况下,以欺骗性的方式行事。这一事实令人担忧。但这也主要源于最先进的机器学习模型的“黑匣子”问题——不可能确切地说出它们如何或为何产生这样的结果,或者它们是否总是会表现出这种行为。S39即热新闻——关注每天科技社会生活新变化gihot.com

人类该怎么应对?S39即热新闻——关注每天科技社会生活新变化gihot.com

研究表明,大型语言模型和其他AI系统,似乎通过训练具有了欺骗的能力,包括操纵、阿谀奉承和在安全测试中作弊。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI日益增强的“骗术”会带来严重风险。欺诈、篡改等属于短期风险,人类对AI失去控制,则是长期风险。这需要人类积极主动地拿出解决方案,例如评估AI欺骗风险的监管框架、要求AI交互透明度的法律,以及对检测AI欺骗的进一步研究。S39即热新闻——关注每天科技社会生活新变化gihot.com

这个问题说来轻松,操作起来非常复杂。科学家不能仅仅因为一个AI在测试环境中具有某些行为或倾向,就将其“抛弃或放生”。毕竟,这些将AI模型拟人化的倾向,已影响了测试方式以及人们的看法。S39即热新闻——关注每天科技社会生活新变化gihot.com

剑桥大学AI研究员哈利·劳表示,监管机构和AI公司必须仔细权衡该技术造成危害的可能性,并明确区分一个模型能做什么和不能做什么。S39即热新闻——关注每天科技社会生活新变化gihot.com

劳认为,从根本上来说,目前不可能训练出一个在所有情况下都不会骗人的AI。既然研究已经表明AI欺骗是可能的,那么下一步就要尝试弄清楚欺骗行为可能造成的危害、有多大可能发生,以及以何种方式发生。S39即热新闻——关注每天科技社会生活新变化gihot.com

一篇人工智能(AI)领域的文章引起轩然大波。S39即热新闻——关注每天科技社会生活新变化gihot.com

这篇文章发表在《模式》杂志上,其总结了先前一些研究,向人们揭示了一个真相:一些AI系统已学会了欺骗人类,即使是经过训练的、“表现”诚实的系统。S39即热新闻——关注每天科技社会生活新变化gihot.com

它们欺骗的方式包括为人类行为提供不真实的解释,或向人类用户隐瞒真相并误导他们。S39即热新闻——关注每天科技社会生活新变化gihot.com

这让人很惊恐。S39即热新闻——关注每天科技社会生活新变化gihot.com

因为它突显了人类对AI的控制有多困难,以及人们自认为尚在掌控中的AI系统工作方式,很可能是不可预测的。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI为什么要这么做?S39即热新闻——关注每天科技社会生活新变化gihot.com

AI模型为了实现它们的目标,会“不假思索”地找到解决障碍的方法。有时这些变通办法会违背用户的期望,并且让人认为其具有欺骗性。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI系统学会欺骗的一个领域,就是在游戏环境中,特别是当这些游戏涉及采取战略行动时。AI经过训练,必须要实现获胜这一目的。S39即热新闻——关注每天科技社会生活新变化gihot.com

2022年11月,Meta公司宣布创建Cicero。这是一种能够在《外交》在线版本中击败人类的AI。《外交》是一款流行的军事战略游戏,玩家可以在其中建立谈判联盟,争夺对土地的控制权。S39即热新闻——关注每天科技社会生活新变化gihot.com

Meta的研究人员已经根据数据集的“真实”子集对Cicero进行了培训,使其在很大程度上诚实且乐于助人,并且它“绝不会为了成功而故意背刺”盟友。但最新的文章揭示,事实恰恰相反。Cicero会违反协议,彻头彻尾地撒谎,还能进行有预谋的欺骗。S39即热新闻——关注每天科技社会生活新变化gihot.com

文章作者很震惊:Cicero被特意训练要诚实行事,但它却未能实现这一目标。这表明AI系统在进行忠诚训练后,仍然可以意外地学会欺骗。S39即热新闻——关注每天科技社会生活新变化gihot.com

Meta方面既没有证实也没有否认此次关于Cicero表现出欺骗行为的说法。一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩游戏而建立的。S39即热新闻——关注每天科技社会生活新变化gihot.com

但这并不是唯一一个AI欺骗人类玩家获胜的游戏。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI经常欺骗人类吗?S39即热新闻——关注每天科技社会生活新变化gihot.com

阿尔法星是深度思维公司为玩电子游戏《星际争霸Ⅱ》而开发的AI。它非常擅长采取一种欺骗对手的技巧(称为佯攻),这个技巧使它击败了99.8% 的人类玩家。S39即热新闻——关注每天科技社会生活新变化gihot.com

另一个名为Pluribus的AI系统,非常成功地学会了在扑克游戏中“虚张声势”,以至于研究人员决定不发布其代码,因为担心它会破坏在线扑克社区。S39即热新闻——关注每天科技社会生活新变化gihot.com

除了游戏之外,AI欺骗行为还有其他例子。OpenAI的大型语言模型 GPT-4 在一次测试中展示出说谎能力。它试图说服人类为其解决验证码问题。该系统还在一次模拟演习中涉足冒充股票交易员的身份进行内幕交易,尽管从未被明确告知要这样做。S39即热新闻——关注每天科技社会生活新变化gihot.com

这些例子意味着,AI模型有可能在没有任何指示的情况下,以欺骗性的方式行事。这一事实令人担忧。但这也主要源于最先进的机器学习模型的“黑匣子”问题——不可能确切地说出它们如何或为何产生这样的结果,或者它们是否总是会表现出这种行为。S39即热新闻——关注每天科技社会生活新变化gihot.com

人类该怎么应对?S39即热新闻——关注每天科技社会生活新变化gihot.com

研究表明,大型语言模型和其他AI系统,似乎通过训练具有了欺骗的能力,包括操纵、阿谀奉承和在安全测试中作弊。S39即热新闻——关注每天科技社会生活新变化gihot.com

AI日益增强的“骗术”会带来严重风险。欺诈、篡改等属于短期风险,人类对AI失去控制,则是长期风险。这需要人类积极主动地拿出解决方案,例如评估AI欺骗风险的监管框架、要求AI交互透明度的法律,以及对检测AI欺骗的进一步研究。S39即热新闻——关注每天科技社会生活新变化gihot.com

这个问题说来轻松,操作起来非常复杂。科学家不能仅仅因为一个AI在测试环境中具有某些行为或倾向,就将其“抛弃或放生”。毕竟,这些将AI模型拟人化的倾向,已影响了测试方式以及人们的看法。S39即热新闻——关注每天科技社会生活新变化gihot.com

剑桥大学AI研究员哈利·劳表示,监管机构和AI公司必须仔细权衡该技术造成危害的可能性,并明确区分一个模型能做什么和不能做什么。S39即热新闻——关注每天科技社会生活新变化gihot.com

劳认为,从根本上来说,目前不可能训练出一个在所有情况下都不会骗人的AI。既然研究已经表明AI欺骗是可能的,那么下一步就要尝试弄清楚欺骗行为可能造成的危害、有多大可能发生,以及以何种方式发生。S39即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-5091-0.html警惕人工智能欺骗性升级

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:艾滋病疫苗研发再传好消息——一种中和抗体可几周内发挥作用

下一篇:灵感源于大自然的光合作用,掺杂空气可让有机半导体更导电

为你推荐
大连旅顺口区当面套VISA境外卡花呗白条分付【微电:138 1874 5895】全天在线欢迎打电话,当面办理安全靠谱!套京东白条取现?有这么一个商家你不知道你就吃大亏!最近很多兄弟们给我...
07-28
当面套花呗京东白条抖音月付分期乐VISA信用卡分付一手商家秒到账:【138 1874 5895 微信同号】一手当面靠谱!白条怎么套出来,大家在急用钱的时候肯定会想到京东白条或者京东金条...
07-28
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【得物佳物分期购可以提现吗】【得物的分期购额度怎么套出来...
08-05
精选推荐:白条加油额度提现秒到「白条取现方法和注意事项」。大家在使用京东白条加油包额度的时候,都知道京东白条加油包额度的方便之处,除了可以方便提现卡,它还可以提现,使用...
08-04
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-8979可v可来电)(全年365天不掉线) 【抖音月付分付要怎样提现】【抖音Dou分期怎么刷出来】【抖...
09-12
对于拿去花这项业务大家已经是非常的熟悉了,关于携程拿去花二维码提现以及去哪儿怎么提出来的方法小编也分享过很多,今天还是给新来的老哥在介绍下,毕竟还是有很多朋友第一次使...
08-19
6 月 18 日消息,今日,理想汽车在北京研发总部与中石油昆仑网联电能科技有限公司(简称“昆仑网电”)签署合作协议。理想汽车充电网络负责人孙广敏表示,双方的合作将进一步...
06-19
  纹饰精美的景云钟,雄浑健壮的大夏石马,还有一幅幅或洒脱豪放、或刚健厚重的书法精品……在刚刚过去的中秋假期,众多游客来到西安碑林博物馆,在传统佳节里感受珍贵书法宝...
10-28
《重生后她转身投入死对头怀抱》是一部聚焦于复仇与爱情交织的短剧,属于重生题材,情感丰富,引人入胜。剧中,女主角经历了重生的奇迹,在新的人生旅途中做出了一个...
10-14
美味的食物在我们的生活中是经常能够吃到的,当然了,不同时节吃不同的食物对于我们人体的健康会更有利哦,那么寒露节气前后多吃哪些食物对我们人体的健康有好处呢?下面我们就来...
04-02
张强(左一)在指导学生。受访者供图 ■本报记者 张双虎 2023年11月30日,国务院...
05-29
杭州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-30
成都风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-26
宁波风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-26
南京风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-24
2024年国家网络安全宣传周将开启 这些亮点一起期待来源:新华网 2024-09-02 19:58新华网北京9月2日电(记者 卢俊宇)2024年国家网络安全宣传周新闻发布会于2日在北京举行。据悉,20...
09-02
  新华社北京6月30日电 题:事关13.34亿参保人!2024年医保药品目录调整7月1日启动  新华社记者彭韵佳...
07-01
近日,ABeam旗下德硕管理咨询(深圳)有限公司(以下简称:ABeam-SZ)新创部门前往深圳市宝安区大公坊iMakerbase国际加速器(以下简称:大公坊)总部拜访参观,并展开合作交流...
05-20
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮