姚期智院士:AI欺骗引发“生存性”风险

3个月前 来源:澎湃新闻 观看:49

 2qo即热新闻——关注每天科技社会生活新变化gihot.com

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”2qo即热新闻——关注每天科技社会生活新变化gihot.com

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。2qo即热新闻——关注每天科技社会生活新变化gihot.com

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者摄

  ?2qo即热新闻——关注每天科技社会生活新变化gihot.com

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。2qo即热新闻——关注每天科技社会生活新变化gihot.com

在他看来,这类生存性风险有两个不同方向。2qo即热新闻——关注每天科技社会生活新变化gihot.com

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。2qo即热新闻——关注每天科技社会生活新变化gihot.com

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。2qo即热新闻——关注每天科技社会生活新变化gihot.com

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?2qo即热新闻——关注每天科技社会生活新变化gihot.com

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。2qo即热新闻——关注每天科技社会生活新变化gihot.com

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。2qo即热新闻——关注每天科技社会生活新变化gihot.com

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。2qo即热新闻——关注每天科技社会生活新变化gihot.com

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。2qo即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓)2qo即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-5544-0.html姚期智院士:AI欺骗引发“生存性”风险

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:解决“挂谷猜想”的王虹,和华人数学家的100年

下一篇:耶鲁调查启示:专业低门槛流动“造福”学生成长

为你推荐
2025年1月辽宁省普通高中学业水平合格性考试报名工作已于2024年11月24日结束。为满足考生需求,结合工作...
01-21
中新网上海1月22日电(记者陈静)记者22日获悉,在中医“瘀血理论”指导下,结...
01-23
广东省人民政府1月21日印发的《关于高质量发展资本市场助力广东现代化建设的若干措施》(下称《措...
01-23
  近期,受美国关税政策影响,市场情绪波动较大,螺纹钢期价呈冲高回落走势,主力合约自高位累计下跌3...
02-13
天秤男和金牛女是十分有吸引力的组合。他们之间的关系充满了浪漫和温馨,但同时也存在一...
01-22
天蝎男是一个充满神秘和矛盾的星座,他们在婚后对待妻子的态度也有着独特的方式。有人说...
01-22
162女适合什么风格穿搭?一、162女适合什么风格穿搭?白色T恤搭配条纹伞裙,红色蓬纱裙,打造文艺气质女神风格。白色T恤搭配灰色大衣在配个贝雷帽。短款羽绒服搭配破洞直筒裤,整体风...
02-07
小小模特的梦想舞台:CIP国际少儿模特T台走秀揭秘在璀璨的时尚界,模特的身影总是让人心驰神往。不过,当我们谈到模特时,脑海中浮现的往往是那些身材高挑的成年模特。在这里,我想分...
02-17
2月11日消息,中国B2B外贸金融平台XTransfer近日与非洲最大的跨国银行之一Ecobank签署合作谅解备忘录 ,双方将携手为非洲中小微贸易企业提供优质的跨境金融及风控服务,进一步促...
02-11
阿里巴巴发布2025财年第三财季业绩公告。财报显示,阿里巴巴第三财季收入2801.54亿元,同比增长8%;经营利润为412.05亿元,同比增长83%;经调整EBITA548.53亿元,同比增长4%;归属于普通...
02-21
2月5日消息,8天假期叠加“请2休11”的拼假策略,带来了春节假期更多元的出游模式。途牛《2025春节出游消费盘点》(以下简称“报告”)数据显示,更多途牛用户选择了5至6天或3至4天的...
02-07
3月2日消息,京东健康旗下“京医千询”医疗大模型近日启动开源,成为国内医疗行业首个全面开源的垂类大模型。同时,在2月24日更新的MedBench评测榜单上,“京医千询”医疗大模型以...
03-03
【#华油集团与五粮液集团合资公司登记成立# 注册资本3亿】天眼查App显示,近日,华油五粮(北京)供应链管理有限责任公司成立,法定代表人为杨金峰,注册资本3亿人民币,经营范围含供应链...
01-21
2025年1月22日,达歌生物(以下简称“达歌”),一家专注于针对不可成药靶点开发分子胶新药的生物技术公司,今日宣布公司于2024年底成功完成了超2000万美元的A+轮融资。本轮融资...
01-23
英伟达最新推出的RTX 50系列显卡,特别是RTX 5090,在全球范围内都是一卡难求,在中国台湾RTX 5090显卡同样也是供不应求。 据媒体报道,在这种供不应求的情况下,黄牛...
02-06
索尼互娱2月9日昨天宣布PSN突然瘫痪,经过紧急修复已经于昨晚8点多恢复, 《怪猎》新作OBT测试再开,玩家们可以继续了。 ·举索尼互娱消息,瘫痪发生于2月8日晚间或...
02-10
中国贸促会新闻发言人就美方宣布对中国输美产品加征10%关税发表谈话美国东部时间2月1日,美方以芬太尼等问题为由,对中国输美产品加征10%关税。中国工商界对此深表遗憾、坚决反...
02-02
记者今天从国家邮政局了解到,今年春节假期,全国邮政快递行业业务量保持良好增长态势,揽收和投递快递包裹超19亿件。国家邮政局数据显示,1月28日至2月4日,全国揽收和投递快递包裹1...
02-05
在北京城市副中心,有一座特别的图书馆——北京城市图书馆。这里不仅有起伏的“知识山丘”,有宽敞明亮的“森林书苑”,还有未来感十足的“元...
01-24
如果把地球的天空看成一个巨幕,那可能上映的是一部从远古播放至今的电影。主角之一——臭氧层的故事,则像是一场跨越数十亿年的宇宙传奇。...
01-24
  近日,全省各地陆续发布2024年经济运行数据。面对多重压力叠加、多重挑战并行的复杂形势,在省委、省政...
01-22
  “跟着电影游中国”活动2月17日在京启动。活动旨在抓住春节档电影全球热映契机,利用当前过境...
02-18
  机票大降再现:春节北京往返三亚跌幅千元,旅客退票再订求性价比  随着春运火车票开售,不少热门目的地机票价格呈现下降趋势,游客出行性价比再度提升。1月19日,有游客向北京...
01-21
  中新经纬1月16日电 据国家医保局微信号消息,近日,国家医保局印发《关于推进基本医保基金即时结算改革的通知》(以下简称《通知》)。  《通知》明确,2025年全国80%左右统...
01-21
  近日,记者从京津冀产业协同暨先进制造业集群发展新闻发布会上获悉,京津冀自动驾驶实现跨域全...
01-21
1 月 31 日消息,据小鹏汽车官方,近日该公司先后在都柏林与赫尔辛基举办发布会,小鹏 G9 在芬兰登场,而小鹏 G6 在芬兰与爱尔兰同时亮相。▲ 图源小鹏汽车公众号在此之前,...
02-01
  记者 林子涵  休息时间,30岁的美国观众普拉德利点开手机上的微短剧APP,追更一部浪漫题材的...
02-20
在娱乐圈这个星光灿烂的舞台上,何炅以其出色的主持能力和温文尔雅的气质,赢得了广大观众的喜爱与尊敬。而近期,这位步入半百之年的知名主持人,再次以惊人的身体状态吸引了公众的...
02-22
  新华社北京12月18日电 12月18日,《新华每日电讯》发表题为《人均预期78.6岁,如何迎接长寿“新常态”?》的报道。 &emsp...
01-21
  科技日报讯 (记者张梦然)爱尔兰戈尔韦大学研究团队开发出一种创新生物打印技术,能够使打印出的组织根据细胞产生的力量而改变形状。这一成果模仿了器官在自然发育过...
01-29
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮