姚期智院士:AI欺骗引发“生存性”风险

9个月前 来源:澎湃新闻 观看:88

 Boq即热新闻——关注每天科技社会生活新变化gihot.com

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”Boq即热新闻——关注每天科技社会生活新变化gihot.com

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。Boq即热新闻——关注每天科技社会生活新变化gihot.com

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者摄

  ?Boq即热新闻——关注每天科技社会生活新变化gihot.com

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。Boq即热新闻——关注每天科技社会生活新变化gihot.com

在他看来,这类生存性风险有两个不同方向。Boq即热新闻——关注每天科技社会生活新变化gihot.com

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。Boq即热新闻——关注每天科技社会生活新变化gihot.com

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。Boq即热新闻——关注每天科技社会生活新变化gihot.com

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?Boq即热新闻——关注每天科技社会生活新变化gihot.com

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。Boq即热新闻——关注每天科技社会生活新变化gihot.com

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。Boq即热新闻——关注每天科技社会生活新变化gihot.com

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。Boq即热新闻——关注每天科技社会生活新变化gihot.com

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。Boq即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓)Boq即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-5544-0.html姚期智院士:AI欺骗引发“生存性”风险

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:解决“挂谷猜想”的王虹,和华人数学家的100年

下一篇:耶鲁调查启示:专业低门槛流动“造福”学生成长

为你推荐
辽宁省2024年下半年全国大学英语四、六级考试(CET)和高等学校英语应用能力考试(AB级)将于12月14日和15日举...
01-21
  大众网记者 王一刚 报道  1.暖·冬至  冬至,在我国农历的舞台上,它不仅是一个至关重要的节气,更是一场阖家团圆、传承民俗的文化盛宴。  为了在幼儿心底种下传统...
01-21
  近日,央行披露4家银行大额罚单,包括一家国有大行、三家股份行因涉及多项反洗钱领域违规被处罚...
02-06
  监管部门多次提及的“完善农险经营退出机制”迎来突破性进展。  近日,金融监管总局北京监...
02-08
天秤座的男生注重外貌和气质,他们喜欢温柔、优雅、有内涵的女人。下面就让我们来看看天...
01-22
射手男是一个热爱自由、追求刺激的星座,他们喜欢冒险和探索未知的领域。因此,对于射手男...
01-22
童装新款上市文案? 夏天新款童装文案?一、童装新款上市文案?1、美丽不打折,春款童装全部上新,时光不老,我们不散,繁华落尽,我们一起享受世间美衣,衣服千千万,唯有新款最好看。2、夏装...
02-07
邹开云:打破常规的模特之路,反串时尚引发关注在时尚界,常常会出现一些颠覆传统的现象,今天你是否听说过邹开云?他是一位反串模特,以非凡的才华和独特的风格走入了大众视野。通过反...
02-17
会员数两年增长十倍。1、1688 PLUS会员数已突破千万没想到,阿里1688会这么猛。根据阿里巴巴1688最新的数据,截至2024年12月底,1688PLUS付费会员数量已突破1000万大关。值得注意...
02-07
2月16日消息,时值服饰行业春季上新节点,快手电商男装运动行业联合快手电商中小商家行业、快手商业化男装运动行业发起“早春新风尚-男装运动鞋服焕新季”活动。2月12日-2月28...
02-17
2月19日消息,美团闪购发布2025年情人节鲜花消费报告。2月14日情人节当天,美团鲜花品类销售额年同比增长120%。其中,新中式花束订单量年同比增长1709%,美团闪购所推出的颐和园、...
02-20
2月21日消息,银联国际日前与阿联酋本地转接网络Al Etihad Payments(AEP)签署合作协议,双方将在阿联酋当地共同推动发卡行发行“银联-Jaywan”双品牌卡,提升当地居民日常消费、跨...
02-22
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
【#浙创浙江自贸区股权投资基金登记成立# 出资额10亿】天眼查App显示,近日,浙创(浙江自贸区)股权投资基金合伙企业(有限合伙)成立,执行事务合伙人为北京浙商华盈创业投资管理有限公...
02-09
今日(2月5日),关注焦虑情绪的2D互动叙事游戏《焦虑小狗》Steam页面开放,年内发售,游戏支持简繁体中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《焦虑...
02-06
2月10日,光荣特库摩公布了最新公司人事变动事项,包括新的CEO以及新公司等等。一起来了解下。 ·光荣创始人襟川陽一,由现在的社长转为董事长、夫人襟川恵子由董...
02-11
当地时间2月2日,美国华盛顿消防部门表示,已确定两机相撞事故中55名遇难者的身份。当地时间1月29日,一架美国国内支线客机在罗纳德·里根华盛顿国家机场同一架美军直升机在半空...
02-03
春节期间,国产动画电影《哪吒之魔童闹海》(简称《哪吒2》)持续走红。猫眼专业版数据显示,截至2月5日中午11时52分,票房突破50亿元,观影人次达到1亿,成为中国影史第6部观影人次破1亿...
02-05
时尚行业的核心驱动力在于创意,而创意表达往往具有一定模糊性和容忍度。这一特性使得生成式人工智能(AIGC)在时尚领域的应用潜力显得...
01-24
人形机器人产业作为发展新质生产力的代表领域之一,正在进入发展上升期,成为科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用...
01-27
近日辽宁又一批事业单位发布招聘公告↓↓↓1辽宁石化职业技术学院  招聘岗位  本次公开招聘12个岗...
01-21
  先农坛庆成宫,北京中轴线上的一颗明珠。这是去年中轴线申遗成功后首个焕新亮相的古建筑群。...
02-05
  近些年,不少家长被号称能为孩子进行“天赋基因检测”的宣传所迷惑,在口腔黏膜取些唾液,送至机构检测,便能测出孩子有哪些天赋,从而为“定向”培养孩子提供精准的“科学依...
01-21
在过去的一年,很多人都知道“胖东来”。这个原本扎根在河南许昌、新乡的超市,以细致的服务和严格的品控掳获众多好感,由此被誉为零售...
01-21
1 月 21 日消息,赛力斯今日公告,预计 2024 年度实现营业收入 1442 亿元到 1467 亿元,同比上升 302.32% 到 309.30%。从公告获悉,赛力斯预计 2024 年度实现归属于上市公...
01-22
2 月 2 日消息,继昨日多位博主分享了蔚来 5 年 0 息购车优惠海报后,蔚来官方公布了限时金融优惠更多细节:用户 2025 年 2 月 1 日至 2 月 28 日期间支付定金购买蔚来,可...
02-02
  1、《滤镜》小说原著就叫《滤镜》,这是桐华所著的作品,桐华也是这部剧的总编剧。  2、这是一部充满科幻色彩的现代剧,一共三十集,讲的是由一个神秘的高科技产品“滤镜手...
02-17
  记者 师悦  《哪吒之魔童闹海》热度节节攀升,相关电影周边也卖断了货,可谓一“吒”难求。非...
02-22
21世纪经济报道记者季媛媛 日本报...
02-04
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮