AI成为数学家得力助手还要多久

7个月前 来源:新华网 观看:92

从计算机科学到医学再到国家安全,数学是众多关键应用的基石,但数学领域的进步可能需要数年时间才能实现。L74即热新闻——关注每天科技社会生活新变化gihot.com

几百年来,数学家使用的工具依然简朴:一张纸、一支笔。他们凭借逻辑与灵感,在符号的迷宫中寻找通往真理的路径。L74即热新闻——关注每天科技社会生活新变化gihot.com

为了打破这一局面,美国国防高级研究计划局今年4月启动了“指数性数学”计划,旨在开发一种能极大提升数学研究效率的人工智能(AI)“合著者”系统。L74即热新闻——关注每天科技社会生活新变化gihot.com

几十年来,数学家借助计算机进行辅助计算或验证命题,如今的AI或许能更上层楼,挑战那些人类长年未解的难题。不过,从能解高中题的AI,到能协助攻克前沿数学难关的AI,中间仍隔着一道鸿沟。L74即热新闻——关注每天科技社会生活新变化gihot.com

解决重大难题仍力不从心L74即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型(LLM)并不擅长数学。它们常常出现“幻觉”,甚至可能被误导相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展现出的进步令数学家眼前一亮。L74即热新闻——关注每天科技社会生活新变化gihot.com

今年,这些模型在美国数学邀请赛中的表现接近优秀高中生水平。不同于过去“一锤定音”式的输出,这些模型开始尝试模拟数学家逐步推理的思考过程。L74即热新闻——关注每天科技社会生活新变化gihot.com

同时,一些将LLM与某种事实核查系统相结合的新型混合模型也取得了突破。例如,谷歌“深度思维”的AlphaProof系统将语言模型与棋类AI——AlphaZero结合,成为首个取得与国际数学奥林匹克竞赛银牌得主成绩相当的系统。今年5月,谷歌的AlphaEvolve模型更进一步,在多个长期未解的数学与计算难题上找到优于人类现有方案的解法。L74即热新闻——关注每天科技社会生活新变化gihot.com

美国《麻省理工科技评论》指出,尽管这些AI成绩亮眼,但专家们普遍认为,它们仍不具备真正的协助科研的能力。竞赛题虽难,却更像是智力游戏,有一定“套路”。真正的数学研究则更开放、更复杂。面对“P vs NP”“黎曼猜想”等重大难题时,AI仍力不从心。L74即热新闻——关注每天科技社会生活新变化gihot.com

为了更准确地评估AI的能力,初创公司Epoch AI去年推出了FrontierMath测试,联合60多位数学家设计出全新高难度题目,避开模型已见过的训练数据,结果LLM几乎集体“交白卷”。L74即热新闻——关注每天科技社会生活新变化gihot.com

这些测试表明,AI在数学道路上虽已迈步,但离“合著者”角色仍有很长一段路要走。L74即热新闻——关注每天科技社会生活新变化gihot.com

需攻克“超长推理链”L74即热新闻——关注每天科技社会生活新变化gihot.com

仔细观察数学问题会发现,它们在某些方面类似:解决问题需完成一系列连续步骤,关键在于找到这些步骤。L74即热新闻——关注每天科技社会生活新变化gihot.com

美国加州理工学院谢尔盖·古科夫指出,困难的差异往往体现在路径的长度上。高中数学可能只需10到40步,而像黎曼猜想这样的难题,路径可能长达百万步。L74即热新闻——关注每天科技社会生活新变化gihot.com

这类“超长路径”极难处理。就像下围棋时寻找一条制胜序列,AI必须在指数级增长的可能路径中找到正确解法。而在数学中,这个复杂度要远超棋类游戏。L74即热新闻——关注每天科技社会生活新变化gihot.com

据物理学家组织网今年2月报道,为应对这一挑战,古科夫团队开发了一种方法,将多个步骤打包成“超级步骤”,相当于穿上“巨人靴”跨越大段路程。他们设计了一个系统,其中强化学习模型负责提出超级步骤,另一个模型负责验证其合理性。L74即热新闻——关注每天科技社会生活新变化gihot.com

该策略在经典未解难题——安德鲁斯-柯蒂斯猜想上取得了突破。虽然尚未证明或推翻该猜想,但借助AI,科学家推翻了一个40年来被广泛引用的“反例”。这曾被视为证明该猜想错误的关键依据。L74即热新闻——关注每天科技社会生活新变化gihot.com

牛津大学数学家马丁·布里森对此表示肯定:“排除错误路径,是科研中非常有价值的一步。”L74即热新闻——关注每天科技社会生活新变化gihot.com

古科夫相信,这种“压缩路径”的思路适用于所有需要推理链条的领域。他希望,这种方法不仅能推动AI跳出固有模式,也为数学研究带来新突破。L74即热新闻——关注每天科技社会生活新变化gihot.com

真正的创新和突破仍属人类L74即热新闻——关注每天科技社会生活新变化gihot.com

跳出思维定式,正是数学家攻克难题的关键。数学常被看作机械推理,而高等数学则更像是一场实验,充满一波三折的试错与灵光乍现的顿悟。L74即热新闻——关注每天科技社会生活新变化gihot.com

这正是AlphaEvolve等AI工具的优势所在。它通过LLM不断生成并改进解题代码,配合第二个模型评估每一轮结果,最终提出比人类更优的解法。这种方法不仅能独立探索,也支持人类随时介入,提供灵感和指令。L74即热新闻——关注每天科技社会生活新变化gihot.com

澳大利亚悉尼大学数学家乔迪·威廉姆森强调,探索性思维是数学的核心。据英国《新科学家》网站报道,他与Meta合作开发了PatternBoost AI系统,可根据一个数学想法生成相似概念,帮助激发灵感。他说:“这就像是这里有一堆有趣的东西,我不知道是怎么回事,但你能再生成一些类似的东西吗?”L74即热新闻——关注每天科技社会生活新变化gihot.com

这种头脑风暴在数学中至关重要,它是新想法产生的源泉。以二十面体为例——古希腊人通过纯粹推理发现了它,其形状并不存在于自然界中,却深刻影响了数学的发展。威廉姆森希望,AI未来也能协助发现类似的“新数学对象”。L74即热新闻——关注每天科技社会生活新变化gihot.com

不过,目前AI仍缺乏真正的创造力。让AI赢棋是一回事,让它发明围棋游戏则是另一回事。像AlphaEvolve和PatternBoost这样的工具或许能作为人类直觉的“侦察兵”,帮助人们发现路径、避开死路,但专家普遍认为,真正的创新与突破,仍然属于人类。L74即热新闻——关注每天科技社会生活新变化gihot.com

从计算机科学到医学再到国家安全,数学是众多关键应用的基石,但数学领域的进步可能需要数年时间才能实现。L74即热新闻——关注每天科技社会生活新变化gihot.com

几百年来,数学家使用的工具依然简朴:一张纸、一支笔。他们凭借逻辑与灵感,在符号的迷宫中寻找通往真理的路径。L74即热新闻——关注每天科技社会生活新变化gihot.com

为了打破这一局面,美国国防高级研究计划局今年4月启动了“指数性数学”计划,旨在开发一种能极大提升数学研究效率的人工智能(AI)“合著者”系统。L74即热新闻——关注每天科技社会生活新变化gihot.com

几十年来,数学家借助计算机进行辅助计算或验证命题,如今的AI或许能更上层楼,挑战那些人类长年未解的难题。不过,从能解高中题的AI,到能协助攻克前沿数学难关的AI,中间仍隔着一道鸿沟。L74即热新闻——关注每天科技社会生活新变化gihot.com

解决重大难题仍力不从心L74即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型(LLM)并不擅长数学。它们常常出现“幻觉”,甚至可能被误导相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展现出的进步令数学家眼前一亮。L74即热新闻——关注每天科技社会生活新变化gihot.com

今年,这些模型在美国数学邀请赛中的表现接近优秀高中生水平。不同于过去“一锤定音”式的输出,这些模型开始尝试模拟数学家逐步推理的思考过程。L74即热新闻——关注每天科技社会生活新变化gihot.com

同时,一些将LLM与某种事实核查系统相结合的新型混合模型也取得了突破。例如,谷歌“深度思维”的AlphaProof系统将语言模型与棋类AI——AlphaZero结合,成为首个取得与国际数学奥林匹克竞赛银牌得主成绩相当的系统。今年5月,谷歌的AlphaEvolve模型更进一步,在多个长期未解的数学与计算难题上找到优于人类现有方案的解法。L74即热新闻——关注每天科技社会生活新变化gihot.com

美国《麻省理工科技评论》指出,尽管这些AI成绩亮眼,但专家们普遍认为,它们仍不具备真正的协助科研的能力。竞赛题虽难,却更像是智力游戏,有一定“套路”。真正的数学研究则更开放、更复杂。面对“P vs NP”“黎曼猜想”等重大难题时,AI仍力不从心。L74即热新闻——关注每天科技社会生活新变化gihot.com

为了更准确地评估AI的能力,初创公司Epoch AI去年推出了FrontierMath测试,联合60多位数学家设计出全新高难度题目,避开模型已见过的训练数据,结果LLM几乎集体“交白卷”。L74即热新闻——关注每天科技社会生活新变化gihot.com

这些测试表明,AI在数学道路上虽已迈步,但离“合著者”角色仍有很长一段路要走。L74即热新闻——关注每天科技社会生活新变化gihot.com

需攻克“超长推理链”L74即热新闻——关注每天科技社会生活新变化gihot.com

仔细观察数学问题会发现,它们在某些方面类似:解决问题需完成一系列连续步骤,关键在于找到这些步骤。L74即热新闻——关注每天科技社会生活新变化gihot.com

美国加州理工学院谢尔盖·古科夫指出,困难的差异往往体现在路径的长度上。高中数学可能只需10到40步,而像黎曼猜想这样的难题,路径可能长达百万步。L74即热新闻——关注每天科技社会生活新变化gihot.com

这类“超长路径”极难处理。就像下围棋时寻找一条制胜序列,AI必须在指数级增长的可能路径中找到正确解法。而在数学中,这个复杂度要远超棋类游戏。L74即热新闻——关注每天科技社会生活新变化gihot.com

据物理学家组织网今年2月报道,为应对这一挑战,古科夫团队开发了一种方法,将多个步骤打包成“超级步骤”,相当于穿上“巨人靴”跨越大段路程。他们设计了一个系统,其中强化学习模型负责提出超级步骤,另一个模型负责验证其合理性。L74即热新闻——关注每天科技社会生活新变化gihot.com

该策略在经典未解难题——安德鲁斯-柯蒂斯猜想上取得了突破。虽然尚未证明或推翻该猜想,但借助AI,科学家推翻了一个40年来被广泛引用的“反例”。这曾被视为证明该猜想错误的关键依据。L74即热新闻——关注每天科技社会生活新变化gihot.com

牛津大学数学家马丁·布里森对此表示肯定:“排除错误路径,是科研中非常有价值的一步。”L74即热新闻——关注每天科技社会生活新变化gihot.com

古科夫相信,这种“压缩路径”的思路适用于所有需要推理链条的领域。他希望,这种方法不仅能推动AI跳出固有模式,也为数学研究带来新突破。L74即热新闻——关注每天科技社会生活新变化gihot.com

真正的创新和突破仍属人类L74即热新闻——关注每天科技社会生活新变化gihot.com

跳出思维定式,正是数学家攻克难题的关键。数学常被看作机械推理,而高等数学则更像是一场实验,充满一波三折的试错与灵光乍现的顿悟。L74即热新闻——关注每天科技社会生活新变化gihot.com

这正是AlphaEvolve等AI工具的优势所在。它通过LLM不断生成并改进解题代码,配合第二个模型评估每一轮结果,最终提出比人类更优的解法。这种方法不仅能独立探索,也支持人类随时介入,提供灵感和指令。L74即热新闻——关注每天科技社会生活新变化gihot.com

澳大利亚悉尼大学数学家乔迪·威廉姆森强调,探索性思维是数学的核心。据英国《新科学家》网站报道,他与Meta合作开发了PatternBoost AI系统,可根据一个数学想法生成相似概念,帮助激发灵感。他说:“这就像是这里有一堆有趣的东西,我不知道是怎么回事,但你能再生成一些类似的东西吗?”L74即热新闻——关注每天科技社会生活新变化gihot.com

这种头脑风暴在数学中至关重要,它是新想法产生的源泉。以二十面体为例——古希腊人通过纯粹推理发现了它,其形状并不存在于自然界中,却深刻影响了数学的发展。威廉姆森希望,AI未来也能协助发现类似的“新数学对象”。L74即热新闻——关注每天科技社会生活新变化gihot.com

不过,目前AI仍缺乏真正的创造力。让AI赢棋是一回事,让它发明围棋游戏则是另一回事。像AlphaEvolve和PatternBoost这样的工具或许能作为人类直觉的“侦察兵”,帮助人们发现路径、避开死路,但专家普遍认为,真正的创新与突破,仍然属于人类。L74即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-2620-0.htmlAI成为数学家得力助手还要多久

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:我国成功组织实施梦舟载人飞船零高度逃逸飞行试验

下一篇:从开源看“智能向善”——人工智能热的冷思考

为你推荐
  科技日报记者 张佳欣  英国杜伦大学研究人员首次利用精确控制的光学陷阱,即“魔法波长光镊...
01-21
1月17日,记者从中国石化新闻办获悉,我国首套采用聚酯中黏工艺技术建设的50万吨/年瓶级切片装置在中国石化仪征化纤公司成功投产,标志着我国在聚酯非纤...
01-21
  辽宁省统计局今天发布2024年全省经济运行情况。数据显示,攻坚之年,辽宁生产需求持续改善,居民收入稳步...
01-21
  首个“非遗版”春节,非遗游、冰雪游、避寒游、文博游、探亲游……大家出游热情高涨,各地深挖...
02-14
  中新经纬1月20日电 题:数字经济将引领产业合作新模式  作者 朱岩 清华大学互联网产业研究院院长  数字经济步入高速发展快车道。2024年7月党的二十届三中全会明确了...
01-21
  加州又起大火:事发全球最大储能电厂,有数万块电池,马斯克急辟谣  澎湃新闻记者 贺梨萍  当地时间1月16日下午,美国加利福尼亚州莫斯兰丁(Moss Landing)储能电厂发生火灾...
01-21
1 月 21 日消息,据 BYDOTA 消息,比亚迪面向 25 款海豹汽车内测车主推送1.1.0 版本 OTA 更新,主要新增城市领航(CNOA)等 16 项功能及 20 项优化。该版本当前处于内测阶段,...
01-21
1 月 27 日消息,山东青岛今天发布青岛市智能网联新能源汽车产业发展行动计划(2025—2027 年),文件提到青岛将打造全国重要的智能网联新能源汽车创新应用高地、新能源商...
01-28
SQL Error: select * from ***_ecms_news5 where id in(,162) limit 2
  11月18日至24日是世界卫生组织确定的“提高抗微生物药物认识周”。当前,抗生素使用情况如何?“新华视点”记者走访多地进行调查...
01-21
21世纪经济报道记者 唐唯珂 广州报道2025年1月24日晚,金域医学发布2024年业绩预告,报告期内预计归母净利润为-3.5亿元到-4.5亿元,与上年同期...
01-27
  大众网记者 王一刚 报道  “秦时明月汉时关,万里长征人未还。”一首《出塞》传诵千年,以举行“赤子心·家国情”主题画展及宣讲为驱动,一堂基于语文课标要求的跨学科...
01-21
作者:张宝歌(宁波大学教师教育学院院长、东海研究院教授)近年来,学生评教制度已逐步成为各高校提升课堂教学...
01-22
  新华财经北京1月21日电(郭洲洋、吴郑思)国内商品期货市场1月21日涨跌互现,其中集运欧线主力合...
01-23
  本报记者 刘琪  1月24日,国家金融监督管理总局(以下简称“国家金融监管总局”)发布消息,为进...
01-28
狮子座男人通常自信、强势和有领导力,但是如果你想吸引他的注意并征服他的心,以下几招可...
01-22
狮子座男生通常具有自信、热情和领导力,他们喜欢被关注和赞美。如果你想吸引一个狮子座...
01-22
冬季男穿搭? 1、英伦绅士风  英伦风打扮的关键特性就是说精美、修身养性。在严寒的冬天,一套打扮得当的英伦风服装,将你的绅士精美反映得酣畅淋漓。  搭配技巧:英伦绅士风...
02-07
女款小立领衬衫怎样搭配外套?立领西服与立领服饰搭配技巧1、 不同场合下正式场合:成熟儒雅――进退有度的气节推荐搭配:深色立领西服套装(立领白衬衫+深色立领西装)黑色为主的...
02-17
1.拼多多加大对短剧领域的投入拼多多向短剧领域发起了春节攻势。据了解,拼多多近期更新并发布了两项针对短剧领域的新政策。一是“新版多多有好剧计划”,作为对旧版计划的升级...
02-07
2月5日消息,微信团队发布2025春节数据报告《微信里的赛博年味儿》,展示基于除夕至初五的多项数据。春节期间,微信里共诞生了1亿+款用户自己创作的红包封面,约有3.9亿人收到含有...
02-07
2月10日消息,快手发布《2025新春团购节老铁消费报告》。数据显示,1月26日至2月4日活动期间,快手本地生活GMV同比增长超117%。“返乡过年”带火了新线城市(三线及以下城市)消费,过...
02-11
2月13日消息,今年元宵节恰逢周三,全国多地中小学已陆续开学,更多游客倾向于在家门口通过轻松、休闲的短途旅行体验节日氛围。途牛数据显示,元宵节当天,近50%的游客选择了周边出游...
02-14
2025年,卖奶茶的拼命IPO。作者 | 萧风来源 | 投资家(ID:touzijias)2025年,卖奶茶的拼命IPO。投资家网获悉,号称“每天一杯喝不腻”的新式茶饮公司古茗已通过港交所聆讯、更新招股...
01-22
作者:三才真人(阴磊)在人类思想的漫长演进中,“道”一直是哲学家、思想家们不断探寻的核心。从老子的“道可道,非常道”到庄子的“道通为一”,道的内涵超越了语言的简单界定...
02-09
著名复古掌机改装大佬 Hairo Satoh 最近成功的将一部 DS 掌机塞进了原版 Game Boy 掌机的外壳当中。 他展示了主机,它不仅能读取正版卡带,而且还有一个藏在主机...
01-28
《天国:拯救2》已正式发售,首发24小时销量就突破100万份。许多玩家对这款中世纪RPG表现出浓厚兴趣。游戏中有许多细节非常真实,比如玩家会因为偷窃被捕,越狱时被守...
02-06
距离除夕只剩几天,“回家”成为大街小巷最热门的话题。窗前的红灯笼、热闹的年货市场、街头巷尾的新春歌曲……处处洋溢着喜庆的氛围。“我恭喜你发财,我恭喜你精彩,最好的请过...
02-02
极目新闻评论员 屈旌2月9日,截至15时,哪吒2票房超78亿,已进入全球影史票房前40,今日或将突破80亿大关。据报道,《哪吒2》片尾出现了138家中国动画公司,导演饺子曾表示,本来寄希望于...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮