人工智能“迎战”奥数难题

4个月前 来源:中国科技网 观看:23

继击败人类围棋大师和战略棋盘游戏顶尖高手之后,谷歌“深度思维”公司人工智能(AI)系统在英国巴斯举行的2024年国际数学奥林匹克竞赛(IMO)上,仅以1分之差与金牌失之交臂,获得了银牌。这是AI选手首次登上IMO领奖台。GtS即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在7月27日的报道中指出,“深度思维”正与其他公司竞相解决数学领域的疑难问题。近年来,IMO被广泛认为是对机器学习的一个挑战,也是衡量AI系统高级数学推理能力的理想基准。AI系统在今年IMO中的精彩表现,标志着其即将再下一城:在解决数学难题方面击败世界顶尖学生。GtS即热新闻——关注每天科技社会生活新变化gihot.com

首登领奖台GtS即热新闻——关注每天科技社会生活新变化gihot.com

“深度思维”公司训练了一个专门用于解答数学奥赛考题的AI系统,成功解答了6道竞赛题中的4道,获得28分(满分42分),达到本次比赛银牌获得者的水平。GtS即热新闻——关注每天科技社会生活新变化gihot.com

该系统包括解答数学推理问题的模型AlphaProof和解答几何问题的模型AlphaGeometry的升级版AlphaGeometry 2。其中,AlphaGeometry 2解决了一个几何问题,而AlphaProof则解答了两个代数问题和一个数论问题。GtS即热新闻——关注每天科技社会生活新变化gihot.com

今年1月份,AlphaGeometry在解决欧几里得几何问题上,就已表现出奖牌级选手的水平。在今年的IMO比赛前,AlphaGeometry 2已经能够解决过去25年里83%的IMO几何问题,而其“前身”仅能解决53%。GtS即热新闻——关注每天科技社会生活新变化gihot.com

“深度思维”公司AI科学副总裁普什米特·科利指出,这是AI系统首次达到获IMO奖牌级别的性能。IMO主席格雷戈尔·多利纳尔也表示,AI最终将能比人类更好地解决大多数数学问题,其进步速度令人惊叹。GtS即热新闻——关注每天科技社会生活新变化gihot.com

几乎同一时间,软件公司Numina的科学家使用语言模型,赢得了AI数学奥林匹克奖(AIMO)的首个“进步奖”。GtS即热新闻——关注每天科技社会生活新变化gihot.com

但Numina团队在获奖后表示,要解决更难的数学问题,仅靠语言模型可能还不够。GtS即热新闻——关注每天科技社会生活新变化gihot.com

与自己对抗GtS即热新闻——关注每天科技社会生活新变化gihot.com

AlphaProof是一个自学习系统,其核心创新在于结合预训练语言模型与AlphaZero强化学习算法的策略。强化学习是机器学习领域一种重要的学习范式,系统可通过多次尝试找到自己的解题方法。GtS即热新闻——关注每天科技社会生活新变化gihot.com

这种方法需要用AI能理解和验证的语言编写大量问题,而大多数IMO问题都是用英语编写的。为解决这个问题,“深度思维”团队托马斯·赫伯特及其同事使用谷歌的大语言模型Gemini,将这些问题翻译成一种名为Lean的编程语言,以供AI进行学习。GtS即热新闻——关注每天科技社会生活新变化gihot.com

AlphaProof使用经过微调的Gemini模型,自动将数学问题转换为Lean语言,从而创建了一个涵盖不同难度级别的大型问题库。在强化学习阶段,系统每验证一个证明,就用它来强化AlphaProof的语言模型,提高其解决后续更具挑战性问题的能力。GtS即热新闻——关注每天科技社会生活新变化gihot.com

赫伯特表示,在挑战围棋游戏时,他们也采用了类似的方法:AI通过与自己对抗,来学习如何更好地玩游戏。结果显示,在某些情况下,AlphaProof能够在无限多的可能性中迈出正确的一步,展现出“灵光一闪”的能力。GtS即热新闻——关注每天科技社会生活新变化gihot.com

仍有改进空间GtS即热新闻——关注每天科技社会生活新变化gihot.com

尽管AlphaProof的表现令人印象深刻,但其速度相对较慢,解决3个问题耗费了3天时间,而人类参赛者仅需4个半小时。此外,它也未能回答两个与组合数学有关的问题。GtS即热新闻——关注每天科技社会生活新变化gihot.com

英国数学家约瑟夫·迈尔斯审查了AI在本次IMO比赛中给出的答案。他指出,AlphaProof采取的这些技术能否予以完善还有待观察。GtS即热新闻——关注每天科技社会生活新变化gihot.com

英国伦敦数学科学研究所何杨辉称,AlphaProof这样的系统对于帮助数学家证明问题很有用,但它无法帮助研究人员确定需要解决和研究的问题。GtS即热新闻——关注每天科技社会生活新变化gihot.com

“深度思维”团队表示,他们正继续探索多种用于推进数学推理的AI方法。未来,数学研究者将与AI合作,验证假说,尝试新方法来解决长期未解决的数学难题。他们也希望AlphaProof能够通过减少错误响应,帮助改进谷歌的大型语言模型。GtS即热新闻——关注每天科技社会生活新变化gihot.com

继击败人类围棋大师和战略棋盘游戏顶尖高手之后,谷歌“深度思维”公司人工智能(AI)系统在英国巴斯举行的2024年国际数学奥林匹克竞赛(IMO)上,仅以1分之差与金牌失之交臂,获得了银牌。这是AI选手首次登上IMO领奖台。GtS即热新闻——关注每天科技社会生活新变化gihot.com

英国《自然》杂志网站在7月27日的报道中指出,“深度思维”正与其他公司竞相解决数学领域的疑难问题。近年来,IMO被广泛认为是对机器学习的一个挑战,也是衡量AI系统高级数学推理能力的理想基准。AI系统在今年IMO中的精彩表现,标志着其即将再下一城:在解决数学难题方面击败世界顶尖学生。GtS即热新闻——关注每天科技社会生活新变化gihot.com

首登领奖台GtS即热新闻——关注每天科技社会生活新变化gihot.com

“深度思维”公司训练了一个专门用于解答数学奥赛考题的AI系统,成功解答了6道竞赛题中的4道,获得28分(满分42分),达到本次比赛银牌获得者的水平。GtS即热新闻——关注每天科技社会生活新变化gihot.com

该系统包括解答数学推理问题的模型AlphaProof和解答几何问题的模型AlphaGeometry的升级版AlphaGeometry 2。其中,AlphaGeometry 2解决了一个几何问题,而AlphaProof则解答了两个代数问题和一个数论问题。GtS即热新闻——关注每天科技社会生活新变化gihot.com

今年1月份,AlphaGeometry在解决欧几里得几何问题上,就已表现出奖牌级选手的水平。在今年的IMO比赛前,AlphaGeometry 2已经能够解决过去25年里83%的IMO几何问题,而其“前身”仅能解决53%。GtS即热新闻——关注每天科技社会生活新变化gihot.com

“深度思维”公司AI科学副总裁普什米特·科利指出,这是AI系统首次达到获IMO奖牌级别的性能。IMO主席格雷戈尔·多利纳尔也表示,AI最终将能比人类更好地解决大多数数学问题,其进步速度令人惊叹。GtS即热新闻——关注每天科技社会生活新变化gihot.com

几乎同一时间,软件公司Numina的科学家使用语言模型,赢得了AI数学奥林匹克奖(AIMO)的首个“进步奖”。GtS即热新闻——关注每天科技社会生活新变化gihot.com

但Numina团队在获奖后表示,要解决更难的数学问题,仅靠语言模型可能还不够。GtS即热新闻——关注每天科技社会生活新变化gihot.com

与自己对抗GtS即热新闻——关注每天科技社会生活新变化gihot.com

AlphaProof是一个自学习系统,其核心创新在于结合预训练语言模型与AlphaZero强化学习算法的策略。强化学习是机器学习领域一种重要的学习范式,系统可通过多次尝试找到自己的解题方法。GtS即热新闻——关注每天科技社会生活新变化gihot.com

这种方法需要用AI能理解和验证的语言编写大量问题,而大多数IMO问题都是用英语编写的。为解决这个问题,“深度思维”团队托马斯·赫伯特及其同事使用谷歌的大语言模型Gemini,将这些问题翻译成一种名为Lean的编程语言,以供AI进行学习。GtS即热新闻——关注每天科技社会生活新变化gihot.com

AlphaProof使用经过微调的Gemini模型,自动将数学问题转换为Lean语言,从而创建了一个涵盖不同难度级别的大型问题库。在强化学习阶段,系统每验证一个证明,就用它来强化AlphaProof的语言模型,提高其解决后续更具挑战性问题的能力。GtS即热新闻——关注每天科技社会生活新变化gihot.com

赫伯特表示,在挑战围棋游戏时,他们也采用了类似的方法:AI通过与自己对抗,来学习如何更好地玩游戏。结果显示,在某些情况下,AlphaProof能够在无限多的可能性中迈出正确的一步,展现出“灵光一闪”的能力。GtS即热新闻——关注每天科技社会生活新变化gihot.com

仍有改进空间GtS即热新闻——关注每天科技社会生活新变化gihot.com

尽管AlphaProof的表现令人印象深刻,但其速度相对较慢,解决3个问题耗费了3天时间,而人类参赛者仅需4个半小时。此外,它也未能回答两个与组合数学有关的问题。GtS即热新闻——关注每天科技社会生活新变化gihot.com

英国数学家约瑟夫·迈尔斯审查了AI在本次IMO比赛中给出的答案。他指出,AlphaProof采取的这些技术能否予以完善还有待观察。GtS即热新闻——关注每天科技社会生活新变化gihot.com

英国伦敦数学科学研究所何杨辉称,AlphaProof这样的系统对于帮助数学家证明问题很有用,但它无法帮助研究人员确定需要解决和研究的问题。GtS即热新闻——关注每天科技社会生活新变化gihot.com

“深度思维”团队表示,他们正继续探索多种用于推进数学推理的AI方法。未来,数学研究者将与AI合作,验证假说,尝试新方法来解决长期未解决的数学难题。他们也希望AlphaProof能够通过减少错误响应,帮助改进谷歌的大型语言模型。GtS即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-35997-0.html人工智能“迎战”奥数难题

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:捕获原子充当晶体管,新型纳米光子电路显示量子网络潜力

下一篇:从亿万年到半小时——我国生物炭高效制备及产业化攻关纪实

为你推荐
西安长安区本地花呗白条当面微电:138-1874-5895 全天在线欢迎来电,还有分付,分期乐,苹果专享额度都可以办理!谈起京东白条怎么刷出来。大家最感兴趣的,恐怕是京东白条的额度提取问...
08-05
上海徐汇区本地当面套花呗京东白条VISA信用卡分付本地一手商家秒到账:【138 1874 5895 微信同号】一手当面靠谱!白条怎么套出来,大家在急用钱的时候肯定会想到京东白条或者京东...
08-04
徐州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-06
千丈之堤,以蝼蚁之穴溃;百尺之室,以突隙之烟焚。——《韩非子》  译:千里大堤,因为有蝼蚁在打洞,可能会因此而塌掉决堤;百尺高楼,可能因为烟囱的缝隙冒出火星引起火灾而...
08-06
(央视财经《经济信息联播》)国庆假期深圳楼市的火热势头仍在延续。国庆后的第一个周末,深圳楼市表现引人关注,多个楼盘迎来热销,有新楼盘开盘即售罄,成为深圳楼市新政后首个“...
10-16
天时不如地利,地利不如人和。  有利于作战的天气、时令,比不上有利于作战的地理形势,有利于作战的地理形势,比不上作战中的人心所向、内部团结。 京东金融旗下有一款名为白...
08-24
  国务院关税税则委员会近期公布了2024年关税调整方案,并于2024年1月1日起正式实施,其中硫酸镍...
01-16
  《2024中国礼・陶瓷季》这档宝藏节目即将诗意回归,11月27日起,每周三21:20在江西卫视上线播出。陶瓷作为非物质文化遗产,是我国文化自信的重要载体,在国家文化发展战略中...
12-03
  近日,  知名歌手王嘉尔在接受采访时称  去年休息是因为“有抑郁症” ,  同受采访的好友也称  去年是他最不开心的时候:  “给了自己太多压力。”  当被问到...
10-28
夏至以后,不管是老人的饮食,还是白领们的饮食都要进行调整一下,合理的饮食才留有健康,而幼儿的饮食更要注重起来,那幼儿夏至的饮食具体要注意哪些方面呢,接下来,苹果绿天然养生专家...
04-02
现在我们已经到了秋季,在这时候的天气变得凉爽起来,所以在这时候就更适合我们进行养生了,特别适合我们进行运动了,可以让我们大家更好的在秋季的时候进行养生,不过在秋季运动也有...
04-02
  大众网记者 王一刚 报道  教师节寄语:  金秋九月,又迎来了教师节。我相信每一位老师都有自己的理想信念和追求,都在为实现自己最美好的人生而努力。让我们一起带着...
09-12
金华风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-12
天津风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-11
兰州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-07
常州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-06
  近期,外国博主Remmyyy在其社交媒体Tiktok账户上发布了一段视频,谈论了中国运动员在药检上遭遇不公平...
08-07
巴黎  一座浪漫与艺术交织的梦幻之都  这座城市即将迎来第33届夏季奥运会  这是巴黎第三次举办夏...
07-20
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮