姚期智院士:AI欺骗引发“生存性”风险

11个月前 来源:澎湃新闻 观看:103

 PcV即热新闻——关注每天科技社会生活新变化gihot.com

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”PcV即热新闻——关注每天科技社会生活新变化gihot.com

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。PcV即热新闻——关注每天科技社会生活新变化gihot.com

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者摄

  ?PcV即热新闻——关注每天科技社会生活新变化gihot.com

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。PcV即热新闻——关注每天科技社会生活新变化gihot.com

在他看来,这类生存性风险有两个不同方向。PcV即热新闻——关注每天科技社会生活新变化gihot.com

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。PcV即热新闻——关注每天科技社会生活新变化gihot.com

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。PcV即热新闻——关注每天科技社会生活新变化gihot.com

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?PcV即热新闻——关注每天科技社会生活新变化gihot.com

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。PcV即热新闻——关注每天科技社会生活新变化gihot.com

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。PcV即热新闻——关注每天科技社会生活新变化gihot.com

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。PcV即热新闻——关注每天科技社会生活新变化gihot.com

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。PcV即热新闻——关注每天科技社会生活新变化gihot.com

(原标题:姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓)PcV即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-8-5544-0.html姚期智院士:AI欺骗引发“生存性”风险

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:解决“挂谷猜想”的王虹,和华人数学家的100年

下一篇:耶鲁调查启示:专业低门槛流动“造福”学生成长

为你推荐
  大众网记者 杨涛报道  日前,“外研社·国才杯”“理解当代中国”全国大学生外语能力演讲大赛(山东赛区高职组)成绩揭晓,青岛港湾职业技术学院的王淑珍同学凭借出色的表...
01-21
  大众网记者 司心鹏 报道  近日,教育部发布了《关于推荐国家特殊教育改革实验区的通知》,旨在适应特殊教育改革发展的新形势新要求,在全国范围内设立一批特殊教育改革...
01-21
  近日,中央金融办、中国证监会、财政部、人力资源和社会保障部、中国人民银行、金融监管总局...
01-24
  本报记者 冷翠华  见习记者 杨笑寒   截至2月13日,已有135家险企(不含再保险公司)披露了20...
02-14
在星座学中,每个星座都有着不同的性格特点和相处方式。因此,与不同星座的人谈恋爱会带来...
01-22
射手男是一个热爱自由、追求刺激的星座,他们喜欢冒险和探索未知的领域。因此,对于射手男...
01-22
小皮皮,潮流服饰界的新宠儿在这个瞬息万变的时尚界,我们常常会被一些新兴品牌所吸引。就像一颗新星――小皮皮潮流服饰,它将个性、时尚与舒适完美结合,成为众多年轻人的心头好。...
02-07
女明星穿搭解析:时尚潮流背后的秘密在这个视觉至上的时代,女明星的穿着打扮不仅仅是一种个人风格的展示,更是引领时尚潮流的一种体现。我们经常在红毯、活动以及社交媒体上看到...
02-17
小米在向华为看齐。二、小米 15 Ultra 更多细节透露元宵节的夜晚,小米创始人雷军再次开启了他的直播之旅。这次直播的场地选在了小米食堂,雷军选择带大家参观小米员工的日常餐...
02-14
阿里电商要增长,扶持商家是第一优先级。据晚点LatePost消息,2月2日(大年初五),阿里电商事业群CEO蒋凡召开小范围高管会,明确了2025年淘宝天猫的第一件大事是通过扶持优质品牌和商...
02-20
2月16日消息,新春期间,快手快聘新春招工会再次引爆蓝领招聘市场,1月15日-2月12日活动期间,用户求职意愿激增,求职人数是去年的284%,超1000万用户通过视频直播求职。同时,平台撮合效...
02-17
2月20日消息,智联招聘发布《2024中国海归就业调查报告》。智联招聘数据显示,2024年,在国内求职的海归人数较2023年增长7%,达到2018年的1.44倍;其中,回国求职的应届留学生人数较202...
02-21
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
近日,上海友趣惠信息科技有限公司(以下简称“友趣惠科技”)已完成A轮2800万元人民币的融资,由中海洋盛佳投资控股有限公司(以下简称“中海洋盛”)投资。...
02-07
《怪物猎人:荒野》目前已经开启了第二次测试。新的测试尽管添加了新的怪物,但在性能优化上并没有太多增强,对于 PC 版的配置要求依然很高。因此,上一次测试中出现...
02-10
2月14日,《如龙8外传》试玩Demo现已正式上线,适用于PS5、Xbox Series X|S和Steam,该体验版在夏威夷街道的基础上,以本作首次登场的秘密孤岛“狂热兰蒂斯”为舞台,供...
02-15
据中国日报等媒体报道,2月4日,美国企业家埃隆·马斯克在社交平台上发文称,按照这种取得成就的速度,特朗普总统应当在总统山有一席之地,并表示自己“想亲自来给他雕刻”。 马斯克...
02-05
2月8日,哈尔滨亚冬会冰壶混双铜牌赛,中国队战胜菲律宾队获得铜牌。这是中国代表团在哈尔滨亚冬会获得的首枚奖牌。...
02-08
新华社合肥1月20日电(记者徐海涛、陈诺)“998、999、1000……”大屏幕上的数字最终定格在1066,原本安静的控制大厅一片欢呼。1月20日,我国...
01-21
1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型...
01-21
  2月4日,春节假期即将落下帷幕。在线旅游平台飞猪发布的《2025年春节假期出游快报》显示,“追着非遗过...
02-05
  2月7日,来自辽宁省邮政管理局的监测数据显示,今年春节假期(1月28日至2月4日),辽宁省快递业务揽收量1578....
02-08
近日,在泰兴市清扬生态果园葡萄基地,务工人员正热火朝天地修剪葡萄树。该果园葡萄种植面积超八十亩,修剪工作已持续一周。果园业主陶伟介绍,修剪是为了让葡萄来年能长出花果,“不...
01-22
  中新经纬1月18日电 (魏薇)“银柳的谐音是‘银留’,有把银子留在家中的寓意,最近比较热销。还有北美冬青,它的花语是生命,寓意红红火火、兴旺昌盛。”云南昆明斗南花卉市场(...
01-21
  原标题:新能源汽车成为中国制造“亮丽名片”多举措保障产业良好发展  在21日国务院新闻办...
01-24
2 月 5 日消息,长城汽车股份有限公司 TANK 品牌执行副总经理谷玉坤今日公布了坦克 700 Hi4-T 汽车第 3 次 OTA 升级内容(版本号:V1.4)。新版本优化了方向盘、座椅的迎宾...
02-06
电视剧《香草的每天》自开拍以来就受到了众多粉丝的关注。这次播出更是让许多粉丝激动不已,尤其是对于第20集的剧情介绍,大家都充满了好奇。在第20集中,白井向...
02-20
《难哄》小说穆承允结局如何?穆承允结局是什么‌《难哄》中穆承允的结局是没有与温以凡在一起‌。穆承允对温以凡有一定的好感,但这种好感并未发展成深刻的喜...
02-20
21世纪经济报道记者 唐唯珂 广州报道Deepseek持续搅动全球AI格局重塑之下,应用产业端连锁反应也在深入。在医疗端应用展开的讨论同样热闹。...
02-08
21世纪经济报道记者武瑛港 实习生张烁 李依浓 北京报道近日多家医疗器械上市公司发布业绩预告,行业的“寒冬”似乎仍在持续。乐普医疗和春...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮