人工智能成功挑战奥数难题

8个月前 来源:参考消息网 观看:58

据美国《纽约时报》网站1月17日报道,在4年时间里,计算机科学家郑潮(音)一直被某件类似于元数学问题的任务弄得心神不宁:如何构建一个可以解答国际数学奥林匹克竞赛中的几何题的人工智能模型。国际奥数竞赛是一年一度全世界最有数学才能的高中生的比赛。nI3即热新闻——关注每天科技社会生活新变化gihot.com

上周,郑潮在纽约大学成功地进行了自己有关该课题的博士学位论文答辩。他在学术期刊《自然》杂志上介绍了自己辛苦研究的成果。这个名为“阿尔法几何”(AlphaGeometry)的系统能够以接近于人类金牌得主的水准解答奥数竞赛中的几何题。nI3即热新闻——关注每天科技社会生活新变化gihot.com

在开发该项目的过程中,郑潮向谷歌公司的两位研究科学家进行了推介,他们举荐他在2021年至2023年间担任了谷歌公司常驻科学家。“阿尔法几何”系统加入了谷歌旗下“深层思维”公司的人工智能系统群体,该群体已经因为解决重大挑战而被人熟知。其中最著名的也许是2017年征服了国际象棋的深度学习算法“阿尔法零”。数学是一类更加困难的问题,因为通往答案的可能路径的数目有时是无限的,而国际象棋的套路总是有限的。nI3即热新闻——关注每天科技社会生活新变化gihot.com

论文第一作者、该项目的主要推手郑潮说:“走在错误的道路上,我曾不断地进入死胡同。”nI3即热新闻——关注每天科技社会生活新变化gihot.com

论文的联合作者包括:郑潮在纽约大学的博士生导师何河、被称为“托尼”的xAI公司联合创始人吴宇怀,以及来自谷歌的主要研究者梁胜(音)和同样来自谷歌的黎国(音)。吴宇怀以前也在谷歌工作,他曾在2019年独立地开始探索一种类似的设想。nI3即热新闻——关注每天科技社会生活新变化gihot.com

郑潮的坚持有了收获。他说:“我们谈不上是循序渐进。我们是在一步登天,即在结果方面取得了重大突破。”“只是不要过分夸大这一点。”nI3即热新闻——关注每天科技社会生活新变化gihot.com

郑潮从2000年至2022年的国际奥数竞赛试卷中抽取30道几何题组成一套试卷,对“阿尔法几何”系统进行测试。该系统解出了25道题;在奥数竞赛史上,同时期的人类金牌得主平均解出25.9道题。郑潮还把这些题目交给上世纪70年代开发出的一个曾被认为是最强几何定理证明器的系统;它解出了10道题。nI3即热新闻——关注每天科技社会生活新变化gihot.com

在过去几年里,谷歌“深层思维”公司开展了若干探索人工智能的数学应用的项目。而在这个研究领域中,更为普遍的做法是把奥数竞赛题作为一种基准:OpenAI和元宇宙AI公司已经取得了一些成果。作为额外要求,还有“国际奥数大挑战题”以及去年11月宣布的一项新挑战——“人工智能数学奥林匹克奖”,该奖项悬赏500万美元以征集第一个可以赢得奥数竞赛金牌的人工智能系统。nI3即热新闻——关注每天科技社会生活新变化gihot.com

介绍“阿尔法几何”系统的论文开门见山提出了证明奥数定理“代表人类级自动推理技术的一个重要里程碑”的论点。nI3即热新闻——关注每天科技社会生活新变化gihot.com

爱丁堡大学数学和科学史学家迈克尔·巴拉尼说,他想知道这是不是一个有意义的数学里程碑。他说:“国际奥数竞赛所考察的东西,与绝大多数数学家心目中的创造性数学是截然不同的。”nI3即热新闻——关注每天科技社会生活新变化gihot.com

加利福尼亚大学洛杉矶分校数学家、12岁时成为史上最年少奥数金牌得主的陶哲轩说,他认为“阿尔法几何”系统“干得不错”,取得了“令人意想不到的厉害结果”。nI3即热新闻——关注每天科技社会生活新变化gihot.com

他说,对某个人工智能系统进行微调以解答奥数题或许不会提升其深度研究技能,但在这个案例中,过程或许被证明比目标更有价值。nI3即热新闻——关注每天科技社会生活新变化gihot.com

正如郑潮认为的,数学推理只是推理的一种类型,但它具有易验证的优势。他说,“数学是真理的语言。如果你想构建某种人工智能,重要的是构建你可以信赖的求真、可靠的人工智能”,尤其是对于“安全性至关重要的应用”。(编译/曹卫国)nI3即热新闻——关注每天科技社会生活新变化gihot.com

据美国《纽约时报》网站1月17日报道,在4年时间里,计算机科学家郑潮(音)一直被某件类似于元数学问题的任务弄得心神不宁:如何构建一个可以解答国际数学奥林匹克竞赛中的几何题的人工智能模型。国际奥数竞赛是一年一度全世界最有数学才能的高中生的比赛。nI3即热新闻——关注每天科技社会生活新变化gihot.com

上周,郑潮在纽约大学成功地进行了自己有关该课题的博士学位论文答辩。他在学术期刊《自然》杂志上介绍了自己辛苦研究的成果。这个名为“阿尔法几何”(AlphaGeometry)的系统能够以接近于人类金牌得主的水准解答奥数竞赛中的几何题。nI3即热新闻——关注每天科技社会生活新变化gihot.com

在开发该项目的过程中,郑潮向谷歌公司的两位研究科学家进行了推介,他们举荐他在2021年至2023年间担任了谷歌公司常驻科学家。“阿尔法几何”系统加入了谷歌旗下“深层思维”公司的人工智能系统群体,该群体已经因为解决重大挑战而被人熟知。其中最著名的也许是2017年征服了国际象棋的深度学习算法“阿尔法零”。数学是一类更加困难的问题,因为通往答案的可能路径的数目有时是无限的,而国际象棋的套路总是有限的。nI3即热新闻——关注每天科技社会生活新变化gihot.com

论文第一作者、该项目的主要推手郑潮说:“走在错误的道路上,我曾不断地进入死胡同。”nI3即热新闻——关注每天科技社会生活新变化gihot.com

论文的联合作者包括:郑潮在纽约大学的博士生导师何河、被称为“托尼”的xAI公司联合创始人吴宇怀,以及来自谷歌的主要研究者梁胜(音)和同样来自谷歌的黎国(音)。吴宇怀以前也在谷歌工作,他曾在2019年独立地开始探索一种类似的设想。nI3即热新闻——关注每天科技社会生活新变化gihot.com

郑潮的坚持有了收获。他说:“我们谈不上是循序渐进。我们是在一步登天,即在结果方面取得了重大突破。”“只是不要过分夸大这一点。”nI3即热新闻——关注每天科技社会生活新变化gihot.com

郑潮从2000年至2022年的国际奥数竞赛试卷中抽取30道几何题组成一套试卷,对“阿尔法几何”系统进行测试。该系统解出了25道题;在奥数竞赛史上,同时期的人类金牌得主平均解出25.9道题。郑潮还把这些题目交给上世纪70年代开发出的一个曾被认为是最强几何定理证明器的系统;它解出了10道题。nI3即热新闻——关注每天科技社会生活新变化gihot.com

在过去几年里,谷歌“深层思维”公司开展了若干探索人工智能的数学应用的项目。而在这个研究领域中,更为普遍的做法是把奥数竞赛题作为一种基准:OpenAI和元宇宙AI公司已经取得了一些成果。作为额外要求,还有“国际奥数大挑战题”以及去年11月宣布的一项新挑战——“人工智能数学奥林匹克奖”,该奖项悬赏500万美元以征集第一个可以赢得奥数竞赛金牌的人工智能系统。nI3即热新闻——关注每天科技社会生活新变化gihot.com

介绍“阿尔法几何”系统的论文开门见山提出了证明奥数定理“代表人类级自动推理技术的一个重要里程碑”的论点。nI3即热新闻——关注每天科技社会生活新变化gihot.com

爱丁堡大学数学和科学史学家迈克尔·巴拉尼说,他想知道这是不是一个有意义的数学里程碑。他说:“国际奥数竞赛所考察的东西,与绝大多数数学家心目中的创造性数学是截然不同的。”nI3即热新闻——关注每天科技社会生活新变化gihot.com

加利福尼亚大学洛杉矶分校数学家、12岁时成为史上最年少奥数金牌得主的陶哲轩说,他认为“阿尔法几何”系统“干得不错”,取得了“令人意想不到的厉害结果”。nI3即热新闻——关注每天科技社会生活新变化gihot.com

他说,对某个人工智能系统进行微调以解答奥数题或许不会提升其深度研究技能,但在这个案例中,过程或许被证明比目标更有价值。nI3即热新闻——关注每天科技社会生活新变化gihot.com

正如郑潮认为的,数学推理只是推理的一种类型,但它具有易验证的优势。他说,“数学是真理的语言。如果你想构建某种人工智能,重要的是构建你可以信赖的求真、可靠的人工智能”,尤其是对于“安全性至关重要的应用”。(编译/曹卫国)nI3即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-2069-0.html人工智能成功挑战奥数难题

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:AGI/通用人工智能

下一篇:是什么让橙子具有橙子味

为你推荐
哈尔滨双城区当面套VISA境外卡花呗白条分付【微电:150 0062 3958】全天在线欢迎打电话,当面办理安全靠谱!京东白条作为消费金融的主力军,具有连接用户、商户、场景的天然优势,是...
08-03
沈阳皇姑区本地花呗京东白条月付一手商家当面微电:138 1874 5895,大额度上门办理,也导致个人的需求在不同时段有所差异,特别是金钱,是不可或缺的,白条提取,收取费用的话每个商家...
07-30
海口风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
08-06
商家因为经营信息不够完善,或者是长期没有交易记录,或者是之前因为违规行为等成为异常商户,微信分付又叫微信花呗,顾明思议分付的使用功能和花呗是一样的,都可以先消费后还款。...
08-06
  中新经纬9月20日电 游戏科学声明称,大量《黑神话:悟空》周边产品未获正版授权。  20日,游戏科学在《黑神话:悟空》官方微博发表声明称,近期发现多个网络销售平台上,出现了大...
09-23
  我国首款猴痘疫苗获批临床,其他企业布局如何?多家回应  全球猴痘疫情让猴痘疫苗备受关注。  9月9日,国药集团中国生物上海生物制品研究所自主研发的MVA株猴痘减毒活疫...
09-12
10 月 9 日消息,广汽集团发布公告,2024 年 9 月汽车产量为 16.12 万辆,同比下降 33.43%;本年累计产量为 133.37 万辆,同比下降 26.08%。今年 9 月,广汽集团汽车销量为 18....
10-12
7 月 7 日消息,吉利旗下品牌雷达宣布,将参加今年 11 月开幕的第 41 届泰国国际汽车博览会。届时该品牌将以全新海外品牌名称“RIDDARA”亮相,正式进军泰国市场。注意到...
07-08
一键解锁:微信分付怎么把钱弄出来,实用教程与心得分享微信分付不可以提现,微信分付是微信官方提供的信用支付产品,类似于花呗分期,可以在不同的场景中使用,比如吃饭购物看电影等...
09-06
横评:总结:微信分付的钱怎么借出来-秒到6种绝对技巧只支持在微信平台上消费使用,用户开通分付可以享受提前消费并且还能叠加优惠权益 微信分付是腾讯旗下信用支付产品,用户可...
09-05
腰部越来越肥胖,可不是一件好事。很多女性在平时因为缺少锻炼,身体积累的脂肪越来越多,进而会导致腰部赘肉越长越多,严重影响美观。有时候逛街的时候,看中一件美丽的衣服,可是无奈...
04-02
寒烟:白条怎么套出来,告诉大家白条怎么套出现金龙奔星的努力,特战队的队员们看在眼里,记在心里。曾和龙奔星同住一个宿舍的战友商策回忆说:“龙奔星的柜子里总是挂着一件没干的...
07-25
  靠谱提客服【微信:1312339978,15873152131】分期乐是乐信旗下品质分期买物商城 ,成立于2013年10月,是中国分期购物电商模式开创者,一直秉持“乐在有度、乐见更好”的品牌理...
07-08
长沙风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
08-27
福州风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
08-27
经典神作《俄罗斯方块》虽然玩法简单,却乐趣无穷,发售至今已经35年之久,日前终于有天才玩家突破极限,彻底打穿NES版《俄罗斯方块》,255关以后变成了0关! ·dogplayi...
10-09
  7月25日,二十届中央政治局常务委员会召开会议,研究部署防汛抗洪救灾工作。习近平总书记主持会议并发...
07-31
  摘要  【国家统计局:2月CPI同比上涨0.7%PPI同比下降2.7%】2024年2月份,全国居民消费价格同...
06-27
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮