姚期智院士:AI欺骗引发“生存性”风险

8个月前 来源:澎湃新闻 观看:83

 J5M即热新闻——关注每天科技社会生活新变化gihot.com

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”J5M即热新闻——关注每天科技社会生活新变化gihot.com

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。J5M即热新闻——关注每天科技社会生活新变化gihot.com

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者摄

  ?J5M即热新闻——关注每天科技社会生活新变化gihot.com

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。J5M即热新闻——关注每天科技社会生活新变化gihot.com

在他看来,这类生存性风险有两个不同方向。J5M即热新闻——关注每天科技社会生活新变化gihot.com

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。J5M即热新闻——关注每天科技社会生活新变化gihot.com

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。J5M即热新闻——关注每天科技社会生活新变化gihot.com

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?J5M即热新闻——关注每天科技社会生活新变化gihot.com

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。J5M即热新闻——关注每天科技社会生活新变化gihot.com

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。J5M即热新闻——关注每天科技社会生活新变化gihot.com

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。J5M即热新闻——关注每天科技社会生活新变化gihot.com

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。J5M即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓)J5M即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-5544-0.html姚期智院士:AI欺骗引发“生存性”风险

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:解决“挂谷猜想”的王虹,和华人数学家的100年

下一篇:耶鲁调查启示:专业低门槛流动“造福”学生成长

为你推荐
  大众网记者 司心鹏 通讯员 刘振 盛凤娟 报道  近日,2024年职业院校技能大赛各赛项圆满收官,山东水利职业学院在本年度赛事中表现卓越,成绩斐然。在世界职业院校技能大...
01-21
新华社北京1月19日电 近日,中共中央、国务院印发了《教育强国建设规划纲要(2024—2035年)》(以下简称《纲...
01-21
  1月份以来,中邮理财有限责任公司(以下简称“中邮理财”)、中银理财有限责任公司?、建信理财有...
01-22
  1月14日,中国人民银行发布的金融统计数据显示,2024年12月末,社会融资规模同比增长8%,广义货币供...
01-22
在恋爱中,有时候我们会发现水瓶男并不像其他星座的男生那样主动联系。这让很多女生感到...
01-22
天蝎座的男性通常给人一种神秘而深沉的感觉,他们内心充满了激情和热情。当一个天蝎男开...
01-22
领结婚证穿搭男士? 朋友结婚男士穿什么衣服?一、领结婚证穿搭男士? 领证当天男士最好穿白色的衬衫、粉色的衣服、浅蓝色的衣服,一来红底的照片看上去色彩突出明显;二来这些...
02-17
揭秘北京T台走秀模特公司:行业内幕与精彩瞬间在灯光璀璨的T台上,模特们用自信的步伐和优雅的姿态为观众呈现了一场场视觉盛宴。作为北京这个时尚与文化交融的大都市,T台走秀模...
02-17
1月26日消息,国联股份CNAUTO近日携手山港海外发展集团、日照银行,共同推出了“海外仓”产融新模式,此次合作是国联股份在跨境电商领域的又一次重大突破。CNAUTO是国联股份打造...
02-07
黄峥:“在正确的方向上逐步前进,远比在不正确的方向上狂奔要好。”1.拼多多申请“多多剧场”等商标家庭主妇被贬低,转手掏出整套护肤水乳,随便一抹就变身都市丽人;过年被家长安排...
02-09
2月5日消息,为给劳动者带来职场“薪”机会,2月2日起,58同城上线“金蛇贺岁 薪资加倍”招聘专区,携手千万级雇主释放海量优质岗位,同时搭建4大行业分会场、名企直播专区,助力广大奋...
02-07
今年以来,金价屡次刷新历史新高。2月24日,现货黄金盘中价格突破2956美元/盎司,年内第十一次刷新历史新高。金价的上涨使得越来越多的...
03-04
在农村义务教育学生营养改善计划备受瞩目的背景下,来自中粮福临门学生营养餐专用食用植物调和油的好消息让市场看到了团膳定制油方向的广阔空间。数据显示,自2024年8月上市以...
01-22
近日,国内绿色可持续燃料企业上海岚泽能源科技有限公司(简称:“岚泽能源”)宣布完成数亿元的A轮融资。本轮融资由国家绿色发展基金和上海联和投资共同...
02-07
在本月24日举行的Xbox开发者直面会上,光荣公布了《忍者龙剑传2》的复刻版《忍者龙剑传2:黑之章》,采用公布即发售的策略,登陆了PC,PS5和Xbox Series X|S,首发登陆了X...
01-29
近日,中国台湾艺人大S(徐熙媛)因急性疾病在日本去世的传闻引发广泛关注和热议。 根据多家媒体最新报道,大S去世的消息不幸得到了证实,年仅48岁。 2月3日,小S经纪人发...
02-04
央视网消息:中国地震台网正式测定:02月02日15时17分在西藏日喀则市定日县(北纬28.43度,东经87.52度)发生3.2级地震,震源深度10千米。...
02-02
新华社北京2月9日电 日前,中央层面整治形式主义为基层减负专项工作机制办公室会同中央纪委办公厅对3起整治形式主义为基层减负典型问题进行通报。具体如下:1.中国就业培训技术...
02-09
记者从中国载人航天工程办公室获悉,我国2025年计划发射神舟二十号、神舟二十一号两艘载人飞船和天舟九号货运飞船。1月20日,三次飞行任务的任务标识...
01-21
2025年国际消费电子展(以下简称“CES 2025”)于1月7日至10日在美国拉斯维加斯举行。此次展会上,来自全球160多个国家和地区的4500多家企业和团体齐聚...
01-24
  央视网消息:1月22日,文化和旅游部发布2024年度国内旅游数据。2024年,国内出游人次56.15亿,比上...
01-24
  近日,《辽宁省沿海港口布局规划(2024—2035年)》(以下简称《规划》)正式出台。我省是2023年全国港口航道...
02-05
福建即将迎来一所新院校。 近日,据教育部网站消息,拟同意设置北京科技职业大学、淄博职业技术大学、酒泉职业技术大学等14所学校。...
01-21
  “领养条件:成年,经济能力稳定,自己居住或者父母室友房东允许;每个月愿意花三四百元管它吃喝拉撒;支付宝芝麻信用分550分以上;猫咪都是纯种精品健康猫咪,质保180天,终身售后...
01-21
1 月 23 日消息,阿维塔 06 的实车图在网上曝光,这款定位中型车的新车预计将在今年第二季度正式上市。从曝光的照片来看,阿维塔 06 提供了多种大胆的配色方案,包括紫色、...
01-24
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上线超过 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,这距离年初公布的2000 站的建站目标...
01-25
  光明日报北京1月19日电(记者牛梦笛、张进进)中央广播电视总台《2025年春节联欢晚会》19日举行...
01-22
最近热播的《大梁第一女仵作》受到许多观众的喜爱,大家不仅追剧热情高涨,还对情节和人物充满好奇。为了让大家更全面地了解这部电视剧,这里整理了一些相关信息...
02-19
  本报北京1月14日电(记者 白剑峰)国家卫生健康委等6部门日前发布《关于开展儿童友好医院建设的意见》提出,秉持儿童优先理念,从儿童视角出发,为儿童提供有情感、有温度...
01-21
  美国科罗拉多大学博尔德分校一项最新研究表明,与较早经历更年期的女性相比,较晚经历更年期的...
02-11
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮