姚期智院士:AI欺骗引发“生存性”风险

10个月前 来源:澎湃新闻 观看:93

 DbV即热新闻——关注每天科技社会生活新变化gihot.com

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”DbV即热新闻——关注每天科技社会生活新变化gihot.com

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。DbV即热新闻——关注每天科技社会生活新变化gihot.com

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者摄

  ?DbV即热新闻——关注每天科技社会生活新变化gihot.com

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。DbV即热新闻——关注每天科技社会生活新变化gihot.com

在他看来,这类生存性风险有两个不同方向。DbV即热新闻——关注每天科技社会生活新变化gihot.com

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。DbV即热新闻——关注每天科技社会生活新变化gihot.com

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。DbV即热新闻——关注每天科技社会生活新变化gihot.com

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?DbV即热新闻——关注每天科技社会生活新变化gihot.com

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。DbV即热新闻——关注每天科技社会生活新变化gihot.com

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。DbV即热新闻——关注每天科技社会生活新变化gihot.com

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。DbV即热新闻——关注每天科技社会生活新变化gihot.com

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。DbV即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓)DbV即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-5544-0.html姚期智院士:AI欺骗引发“生存性”风险

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:解决“挂谷猜想”的王虹,和华人数学家的100年

下一篇:耶鲁调查启示:专业低门槛流动“造福”学生成长

为你推荐
  大众网记者 司心鹏 通讯员 报道  10月15日,山东商业职业技术学院云计算技术与应用产业学院在现代服务业大楼一楼报告厅举行第九届华为ICT大赛宣讲会。会上华为山东...
01-21
近日,人民网辽宁频道、中央广播电视总台辽宁总站、光明日报辽宁记者站、中国日报辽宁记者站、中新社辽宁...
01-21
  储蓄存款全员营销、对公拓户攻坚活动、旺季贵金属销售任务……每次看到行里的营销方案与考...
01-24
  2025年年初,中国钢铁行业面临产量与库存双双走低的局面,创下近八年来农历季节性最低水平。春...
02-11
金牛座的男生通常被认为是稳重、务实和可靠的人。他们对于过日子非常重视,因此选择伴侣...
01-22
冷战是一种常见的情感处理方式,但对于狮子男他们往往更难以忍受这种冷漠的态度。如果你...
01-22
探秘丹妹潮流服饰:引领时尚新风潮近年来,随着时尚行业的发展与变化,越来越多的服饰品牌通过独特的设计与个性化的风格赢得了年轻消费者的青睐。在这样的市场背景下,丹妹潮流服饰...
02-07
探索君杰潮流服饰:引领时尚的新风潮当我们提到潮流服饰,许多人都会想起那些充满个性和活力的品牌。而在这个竞争激烈的市场中,君杰潮流服饰无疑在众多品牌中脱颖而出。作为一个...
02-07
赚钱,无孔不入。1.大小品牌挤进爆火直播间一切生意的本质都是流量,在抖音尤是如此。不知道大家有没有发现,从去年开始,大小品牌开始挤进抖音爆火直播间,通过砸钱给主播送礼物,以此...
02-11
阿里巴巴港股成交额突破440亿港元,创历史天量,盘中股价涨超15%。消息面上,阿里巴巴昨日发布2025财年第三财季业绩公告。财报显示,阿里巴巴第三财季收入2801.54亿元,同比增长8%;经...
02-22
与生猪养殖龙头牧原股份(002714.SZ,下称“牧原”)合作16年的养殖户常先云,准备与牧原对簿公堂,并索赔约686.75万元。常先云是河南省南...
02-07
京东要成为外卖行业的一条鲶鱼。1.京东外卖订单暴涨,一周涌入20万商家京东外卖这颗重磅炸弹,正在外卖市场掀起一场巨大的波澜。上周,京东外卖正式开启“品质堂食餐饮商家”招募...
02-23
【#荣耀申请注册无极引擎商标#】天眼查知识产权信息显示,近日,荣耀终端股份有限公司申请注册一枚“无极引擎”商标,国际分类为科学仪器,当前商标状态为等待实质审查。荣耀终端股...
01-21
近日,圣泰能科顺利完成1.5亿元人民币B轮融资。本次融资由江苏省投资、中信建投资本领投,由江西省金投集团、江西金控投资管理中心、毅达资本、通瀛...
02-07
1月27日消息,RTX 50系列即将上市开卖,RTX 5090/5090D的评测已经出炉,但奇怪的是,这次全球媒体评测的样卡,没有一块和FE公版价格相同的标准版,也就是俗称的“丐版”。...
01-29
1月31日,世嘉宣布与TAKARATOMY与三菱达成合作协议,计划以北美为主要方向全球共同推广游戏以及周边玩具等,敬请期待。 ·三家巨头达成的合作的契机来自于市场分析...
02-04
极目新闻通讯员 凌丽万“巳”大“集”闹新春,非遗技艺过大年。2月3日,正月初六,又恰逢二十四节气之首“立春”,为庆祝首个“非遗版”春节,弘扬中华优秀传统文化,寄托岁首美好期盼,...
02-04
当地时间2月5日下午,法国国民议会举行极左翼政党“不屈法国”提出的两项针对现任政府的不信任动议投票,两项动议均未获通过。当晚,法国总理贝鲁宣布再次使用宪法相关条款授权,直...
02-06
  科技日报记者 宗诗涵  持续跳动的“心脏”、有代谢功能的“肝脏”、会呼吸的“肺”……在...
01-21
AI智能体,或将成为2025年的关键词之一,国内外厂商激战正酣,探索其能为千行百业带来的变化。但对数据安全的忧虑也浮出水面。有多少交互的工作内容会上...
01-21
  从西安市区出发,驱车一个多小时便可来到位于秦岭脚下的鄠邑区栗峪口村。在社交平台上,栗峪口...
02-05
  打赢决胜战,收官“十四五”,必须持续打造一流营商环境。  在营商环境发生重大转变的基础上,今年,我省...
02-13
  近日,杭州的徐先生和赖先生向潮新闻记者反映:他们在知名网购平台“得物APP”上买到的茅台疑似为假。1月19日,投诉者带着得物平台购得的8瓶茅台,在潮新闻记者和该平台工作...
01-21
春节临近,年味渐浓。每到除夕前几天,置办年货成了消费者日常生活中的“头等大事”。年货种类繁多,尤其是食品类年货更是多种多样,其中又以四川特产年货最受全国消费者欢迎。从麻...
01-22
  日前,中国汽车流通协会发布的《2024年12月中国汽车保值率报告》(以下简称《报告》)显示,2024...
01-24
1 月 29 日消息,宝马公司推出了 2026 款 iX 中型 SUV,作为中期改款车型,此次改款不仅对车型阵容进行了调整,还对外观、内饰以及动力系统进行了优化升级。宝马 iX 自 202...
01-29
《葬天境》的播出引起了观众们的极大兴趣,无论是故事情节还是人物演技,都让人沉浸其中。最近网上讨论最多的也是该剧的剧情。主演是王夕和王静,该剧于10:00上...
02-22
在近日的一次直播中,著名演员刘晓庆就自己在某节目中的一句“就不死”引发的热议进行了回应。这句话源自她与向太关于“死亡”话题的讨论,当时向太以幽默的口吻表示希望自己在...
02-23
  记者从国家医保局了解到,12月1日,全国医保正式上线慢性阻塞性肺疾病、类风湿关节炎、冠心病、病毒性肝炎、强直性脊柱炎等5种门...
01-21
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮