中国智算如何实现“DeepSeek式突围”

1年前 来源:科技日报 观看:108

晶上生成式变结构计算可为我国打破算力芯片“制程工艺茧房”开辟新路径,走出一条用“三流材料、二流工艺”达成“一流能力”的系统工程级创新路线。mzy即热新闻——关注每天科技社会生活新变化gihot.com

今年以来,我国以DeepSeek为代表的大模型企业通过算法优化、有针对性的训练和开源生态协作,在使用“缩水版”GPU芯片的情况下,将千亿参数模型训练成本压缩至同类模型的1/10,走出了一条从粗放式算力堆砌向内生式效能提升的新路径。mzy即热新闻——关注每天科技社会生活新变化gihot.com

在全球惊叹中国非对称创新奇迹的同时,也要清醒看到,就人工智能(AI)技术和产业自主可持续发展而言,我国仍未摆脱对高端乃至“缩水版”智算芯片等物理器件的依赖。在可以预见的未来,外部环境可能更趋恶劣,封锁遏制常态化、供应链不确定性等挑战难以回避。我国亟需在智能算力层面实现“DeepSeek式突围”,用超限创新解耦当前硬件算力提升与制程工艺进步强绑定的关系。mzy即热新闻——关注每天科技社会生活新变化gihot.com

换言之,我国要在AI领域获得与竞争对手可博弈的能力,不仅要在算法层面继续革命、突破“算力茧房”,而且要在算法与物理层面深度融合上实现换道超车,破解“制程工艺茧房”。以生成式变结构计算、软件定义晶上系统(Software defined System on Wafer,SDSoW)为主要内容的晶上生成式体系架构,为解决算法模型与算力载体失配难题、增强软硬件协同算力可持续发展提供了新的技术路径。mzy即热新闻——关注每天科技社会生活新变化gihot.com

让计算架构的“鞋”适应算法的“脚”mzy即热新闻——关注每天科技社会生活新变化gihot.com

先进的芯片制程工艺能够提供更高的晶体管密度,提升芯片单位面积计算能力,为大模型训练和推理提供更强大的计算资源支持。然而,基于还原论的工程设计范式,芯片制程工艺艰辛迭代获得的物理算力提升,很难被大规模分布式物理系统上运行的软件算法有效利用。芯片峰值计算能力与算法系统性收益存在结构性错位,加之分布式系统在技术体制上受“大规模、低时延、高带宽”不可能三角问题制约,靠简单堆砌千张、万张乃至十万张以上GPU卡的方式,难以满足“规模定律-Scaling low”驱动的大模型训练之非线性算力增长需求。mzy即热新闻——关注每天科技社会生活新变化gihot.com

简而言之,由于存算分离体制的冯·诺依曼计算架构,硬件系统设计(如芯片制程、内存带宽、并发单元等)与算法模型的运算特征(如计算密度、数据流模式、精度需求等)之间存在系统性错位。即便芯片制程工艺有所进步,带来了性能增益,也会由于“逐级插损”的系统工程范式大打折扣。mzy即热新闻——关注每天科技社会生活新变化gihot.com

突破“制程工艺茧房”,在更高维度上寻求问题的解空间,需要变革传统刚性计算架构及技术物理实现范式。mzy即热新闻——关注每天科技社会生活新变化gihot.com

近80年来,传统计算架构一直沿用运算器、控制器、内存储器、输入输出设备几大件组成的冯·诺依曼计算架构。无论是复杂的AI算法,还是简单的数据处理任务,都被“硬塞”进刚性的计算架构之中,奢望“一劳永逸”地处理千变万化的应用。这就好比不管你脚多大,都必须穿37码的鞋才能走路。然而,鞋不合脚就走不快:小脚穿大鞋会绊脚;大脚穿小鞋则会感到疼,结局往往是“削足适履”。mzy即热新闻——关注每天科技社会生活新变化gihot.com

化解刚性架构算力与多样化算法间结构性矛盾,需要借助物理学增维求解法则,导入自适应计算架构新机理。mzy即热新闻——关注每天科技社会生活新变化gihot.com

2009年,受“自然界伪装大师”拟态章鱼启发,中国科学家在世界上首次提出领域专用软硬件协同变结构计算——拟态计算。如同拟态章鱼,可“随机应变”地隐匿在沙质海底或珊瑚礁等环境之中,拟态计算能让“鞋子”更好地适配穿着它走路的“脚板”。mzy即热新闻——关注每天科技社会生活新变化gihot.com

2018年,计算机体系结构大师、图灵奖得主大卫·帕特森和约翰·轩尼诗预言,基于软硬件协同计算语言的领域专用软硬件协同计算架构,将成为今后十年计算机体系架构黄金发展期的主流发展方向之一。前不久,特斯拉Dojo超算公布了其计算范式变革的解决方案,提出硬件架构像变形金刚般随任务变形,实现从“算法适应硬件”到“算法定义硬件”的范式转换。mzy即热新闻——关注每天科技社会生活新变化gihot.com

用二流零部件构建一流系统mzy即热新闻——关注每天科技社会生活新变化gihot.com

生成式变结构计算的核心在于按算法需求动态重构计算架构,要求算力的硬件载体能够实现以软件驱动物理结构变化,大幅度提升特定计算结构对特定算法的执行效能。SDSoW就是要推动计算架构从“刚性流水线”向“软件可塑形”跃迁,打通生成式变结构计算从理论到技术物理实现的闭环,使得基于二流器件或部件构建一流系统成为可能。mzy即热新闻——关注每天科技社会生活新变化gihot.com

具体来说,SDSoW具备五大能力。mzy即热新闻——关注每天科技社会生活新变化gihot.com

一是系统破局能力。SDSoW摆脱“核心器件决定论”思维,改变“芯粒、芯片、模组、机匣、机架、系统”的逐级堆砌、逐级插损式工程技术路线,通过晶圆级异构集成实现功能解构—晶上重组,达成功能等价、系统最优的目标,将制程工艺短板通过系统工程方法转化为非主要矛盾。mzy即热新闻——关注每天科技社会生活新变化gihot.com

二是整体增效能力。借助晶圆级高密度互连、超短距离、异质异构封装,获得高带宽、低延迟、低功耗的系统增益,SDSoW系统的带宽可提升一个数量级,时延可缩小一个数量级,功耗可降低一个数量级,系统效能可提升三个量级。mzy即热新闻——关注每天科技社会生活新变化gihot.com

三是通专融合能力。基于晶圆级系统硬件可编程/重定义架构,可通过软件实时配置或由AI大模型生成SDSoW功能和性能。在同一物理载体上,能根据不同应用需求或使用场景,实现“一平台、多样性”生成式变结构计算,既可满足专用场景特殊算力需求,又能兼顾领域内相对灵活的通用算力要求。mzy即热新闻——关注每天科技社会生活新变化gihot.com

四是开源协同能力。通过建立SDSoW开源社区,发布基础互连协议、动态控制器及生成式变结构计算工具链等,SDSoW可构建“中国引领、全球参与”的生态环境,以开放破垄断,形成相对Chiplet(小芯片)路线的比较优势。mzy即热新闻——关注每天科技社会生活新变化gihot.com

五是内生安全能力。SDSoW可从源头上应对开放生态带来的新域新质安全挑战,通过引入内生安全架构实现开放可控,即便供应链欠安全,仍能保证开放条件下该系统具有“开箱即用、默认安全”的网络弹性。mzy即热新闻——关注每天科技社会生活新变化gihot.com

总之,晶上生成式变结构计算可为我国打破算力芯片“制程工艺茧房”开辟新路径,走出一条用“三流材料、二流工艺”达成“一流能力”的系统工程级创新路线。通过应用与设计、算法与算力的垂直整合,解耦当前我国算力基础设施产品对芯片先进制程工艺的强依赖关系,最大程度获取体系结构与工艺进步的综合增益。晶上生成式变结构计算也能为全球智算普惠提供中国方案。mzy即热新闻——关注每天科技社会生活新变化gihot.com

基于晶圆级集成/封装的生成式变结构计算,开辟了算法架构突破与物理载体革命、算法工程实现与计算范式创新深度耦合的新方向。目前,应尽快推动根理论突破,重点攻关晶上热力学、异构集成理论、可重构架构数学描述等底层理论;持续加强根技术攻坚,突破晶圆级键合、3D互连、晶圆级操作系统、生成式结构计算语言/编译器等关键技术,实现从架构设计、物理实现到技术应用自主生态;多维推进根产业培育,以智能驾驶、具身智能、工业数字孪生、AI一体机等新兴市场需求为牵引,通过“场景开放+体系创新+生态聚合”三位一体模式,以超限创新、超常规举措突破“小院高墙”“遏制封锁”,蹚出一条中国特色技术平权和产业可持续发展之路。mzy即热新闻——关注每天科技社会生活新变化gihot.com

晶上生成式变结构计算可为我国打破算力芯片“制程工艺茧房”开辟新路径,走出一条用“三流材料、二流工艺”达成“一流能力”的系统工程级创新路线。mzy即热新闻——关注每天科技社会生活新变化gihot.com

今年以来,我国以DeepSeek为代表的大模型企业通过算法优化、有针对性的训练和开源生态协作,在使用“缩水版”GPU芯片的情况下,将千亿参数模型训练成本压缩至同类模型的1/10,走出了一条从粗放式算力堆砌向内生式效能提升的新路径。mzy即热新闻——关注每天科技社会生活新变化gihot.com

在全球惊叹中国非对称创新奇迹的同时,也要清醒看到,就人工智能(AI)技术和产业自主可持续发展而言,我国仍未摆脱对高端乃至“缩水版”智算芯片等物理器件的依赖。在可以预见的未来,外部环境可能更趋恶劣,封锁遏制常态化、供应链不确定性等挑战难以回避。我国亟需在智能算力层面实现“DeepSeek式突围”,用超限创新解耦当前硬件算力提升与制程工艺进步强绑定的关系。mzy即热新闻——关注每天科技社会生活新变化gihot.com

换言之,我国要在AI领域获得与竞争对手可博弈的能力,不仅要在算法层面继续革命、突破“算力茧房”,而且要在算法与物理层面深度融合上实现换道超车,破解“制程工艺茧房”。以生成式变结构计算、软件定义晶上系统(Software defined System on Wafer,SDSoW)为主要内容的晶上生成式体系架构,为解决算法模型与算力载体失配难题、增强软硬件协同算力可持续发展提供了新的技术路径。mzy即热新闻——关注每天科技社会生活新变化gihot.com

让计算架构的“鞋”适应算法的“脚”mzy即热新闻——关注每天科技社会生活新变化gihot.com

先进的芯片制程工艺能够提供更高的晶体管密度,提升芯片单位面积计算能力,为大模型训练和推理提供更强大的计算资源支持。然而,基于还原论的工程设计范式,芯片制程工艺艰辛迭代获得的物理算力提升,很难被大规模分布式物理系统上运行的软件算法有效利用。芯片峰值计算能力与算法系统性收益存在结构性错位,加之分布式系统在技术体制上受“大规模、低时延、高带宽”不可能三角问题制约,靠简单堆砌千张、万张乃至十万张以上GPU卡的方式,难以满足“规模定律-Scaling low”驱动的大模型训练之非线性算力增长需求。mzy即热新闻——关注每天科技社会生活新变化gihot.com

简而言之,由于存算分离体制的冯·诺依曼计算架构,硬件系统设计(如芯片制程、内存带宽、并发单元等)与算法模型的运算特征(如计算密度、数据流模式、精度需求等)之间存在系统性错位。即便芯片制程工艺有所进步,带来了性能增益,也会由于“逐级插损”的系统工程范式大打折扣。mzy即热新闻——关注每天科技社会生活新变化gihot.com

突破“制程工艺茧房”,在更高维度上寻求问题的解空间,需要变革传统刚性计算架构及技术物理实现范式。mzy即热新闻——关注每天科技社会生活新变化gihot.com

近80年来,传统计算架构一直沿用运算器、控制器、内存储器、输入输出设备几大件组成的冯·诺依曼计算架构。无论是复杂的AI算法,还是简单的数据处理任务,都被“硬塞”进刚性的计算架构之中,奢望“一劳永逸”地处理千变万化的应用。这就好比不管你脚多大,都必须穿37码的鞋才能走路。然而,鞋不合脚就走不快:小脚穿大鞋会绊脚;大脚穿小鞋则会感到疼,结局往往是“削足适履”。mzy即热新闻——关注每天科技社会生活新变化gihot.com

化解刚性架构算力与多样化算法间结构性矛盾,需要借助物理学增维求解法则,导入自适应计算架构新机理。mzy即热新闻——关注每天科技社会生活新变化gihot.com

2009年,受“自然界伪装大师”拟态章鱼启发,中国科学家在世界上首次提出领域专用软硬件协同变结构计算——拟态计算。如同拟态章鱼,可“随机应变”地隐匿在沙质海底或珊瑚礁等环境之中,拟态计算能让“鞋子”更好地适配穿着它走路的“脚板”。mzy即热新闻——关注每天科技社会生活新变化gihot.com

2018年,计算机体系结构大师、图灵奖得主大卫·帕特森和约翰·轩尼诗预言,基于软硬件协同计算语言的领域专用软硬件协同计算架构,将成为今后十年计算机体系架构黄金发展期的主流发展方向之一。前不久,特斯拉Dojo超算公布了其计算范式变革的解决方案,提出硬件架构像变形金刚般随任务变形,实现从“算法适应硬件”到“算法定义硬件”的范式转换。mzy即热新闻——关注每天科技社会生活新变化gihot.com

用二流零部件构建一流系统mzy即热新闻——关注每天科技社会生活新变化gihot.com

生成式变结构计算的核心在于按算法需求动态重构计算架构,要求算力的硬件载体能够实现以软件驱动物理结构变化,大幅度提升特定计算结构对特定算法的执行效能。SDSoW就是要推动计算架构从“刚性流水线”向“软件可塑形”跃迁,打通生成式变结构计算从理论到技术物理实现的闭环,使得基于二流器件或部件构建一流系统成为可能。mzy即热新闻——关注每天科技社会生活新变化gihot.com

具体来说,SDSoW具备五大能力。mzy即热新闻——关注每天科技社会生活新变化gihot.com

一是系统破局能力。SDSoW摆脱“核心器件决定论”思维,改变“芯粒、芯片、模组、机匣、机架、系统”的逐级堆砌、逐级插损式工程技术路线,通过晶圆级异构集成实现功能解构—晶上重组,达成功能等价、系统最优的目标,将制程工艺短板通过系统工程方法转化为非主要矛盾。mzy即热新闻——关注每天科技社会生活新变化gihot.com

二是整体增效能力。借助晶圆级高密度互连、超短距离、异质异构封装,获得高带宽、低延迟、低功耗的系统增益,SDSoW系统的带宽可提升一个数量级,时延可缩小一个数量级,功耗可降低一个数量级,系统效能可提升三个量级。mzy即热新闻——关注每天科技社会生活新变化gihot.com

三是通专融合能力。基于晶圆级系统硬件可编程/重定义架构,可通过软件实时配置或由AI大模型生成SDSoW功能和性能。在同一物理载体上,能根据不同应用需求或使用场景,实现“一平台、多样性”生成式变结构计算,既可满足专用场景特殊算力需求,又能兼顾领域内相对灵活的通用算力要求。mzy即热新闻——关注每天科技社会生活新变化gihot.com

四是开源协同能力。通过建立SDSoW开源社区,发布基础互连协议、动态控制器及生成式变结构计算工具链等,SDSoW可构建“中国引领、全球参与”的生态环境,以开放破垄断,形成相对Chiplet(小芯片)路线的比较优势。mzy即热新闻——关注每天科技社会生活新变化gihot.com

五是内生安全能力。SDSoW可从源头上应对开放生态带来的新域新质安全挑战,通过引入内生安全架构实现开放可控,即便供应链欠安全,仍能保证开放条件下该系统具有“开箱即用、默认安全”的网络弹性。mzy即热新闻——关注每天科技社会生活新变化gihot.com

总之,晶上生成式变结构计算可为我国打破算力芯片“制程工艺茧房”开辟新路径,走出一条用“三流材料、二流工艺”达成“一流能力”的系统工程级创新路线。通过应用与设计、算法与算力的垂直整合,解耦当前我国算力基础设施产品对芯片先进制程工艺的强依赖关系,最大程度获取体系结构与工艺进步的综合增益。晶上生成式变结构计算也能为全球智算普惠提供中国方案。mzy即热新闻——关注每天科技社会生活新变化gihot.com

基于晶圆级集成/封装的生成式变结构计算,开辟了算法架构突破与物理载体革命、算法工程实现与计算范式创新深度耦合的新方向。目前,应尽快推动根理论突破,重点攻关晶上热力学、异构集成理论、可重构架构数学描述等底层理论;持续加强根技术攻坚,突破晶圆级键合、3D互连、晶圆级操作系统、生成式结构计算语言/编译器等关键技术,实现从架构设计、物理实现到技术应用自主生态;多维推进根产业培育,以智能驾驶、具身智能、工业数字孪生、AI一体机等新兴市场需求为牵引,通过“场景开放+体系创新+生态聚合”三位一体模式,以超限创新、超常规举措突破“小院高墙”“遏制封锁”,蹚出一条中国特色技术平权和产业可持续发展之路。mzy即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1526-0.html中国智算如何实现“DeepSeek式突围”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:全球首个通用智能人“通通”迭代升级

下一篇:微型磁控机器人可模拟外科医生灵巧动作

为你推荐
记者从中国载人航天工程办公室获悉,我国2025年计划发射神舟二十号、神舟二十一号两艘载人飞船和天舟九号货运飞船。1月20日,三次飞行任务的任务标识...
01-21
不久前,国家卫生健康委、国家中医药局、国家疾控局联合发布《卫生健康行业人工智能应用场景参考指引》,列出药物研发等84种具体应用场景,为人工智能(AI...
01-21
  记者1月15日获悉,辽宁邮政快递业迎来2025年“开门红”:1月1日-13日,辽宁省快递业务量和投递量较去年同...
01-21
  近日,《辽宁省加大存量商品房收购力度 进一步提升住房保障能力的若干措施》(以下简称《若干措施》)正...
02-07
财联社1月21日讯(记者 王宏)昨日晚间离岸人民币兑美元持续拉升,接连收复7.31、7.30、7.29、7.28、7.27关口,日内涨近750点。业内分析指出,当前特朗普对贸易政策的最新表态有所缓...
01-21
  中新经纬1月16日电 商务部流通发展司司长李佳路表示,手机等3类数码产品的补贴为购新补贴,不是以旧换新,不以“交旧”为前提。  16日,商务部召开手机等数码产品购新补贴组...
01-21
  据外媒报道,加拿大政府日前表示,一旦可用资金耗尽,将“暂停”其零排放车辆补贴计划,取消对符合...
01-21
  近日,记者从京津冀产业协同暨先进制造业集群发展新闻发布会上获悉,京津冀自动驾驶实现跨域全...
01-21
  1、《难哄》桑延和《偷偷藏不住》的桑延本质上是同一个人,但是剧里面是由不同的演员饰演的。  2、桑延在《偷偷藏不住》剧中由马伯骞饰演,在《难哄》里是白敬亭饰演的...
02-17
最近,由几位优秀演员出演的电视剧《继承者游戏》播出后,获得了不错的收视率和热度。剧情和人物塑造都相当出色,值得一看。该剧上线时间为14:00,题材为男频复仇...
02-21
21世纪经济报道记者 韩利明 上海报道 丙类药品目录的落地,已是箭在弦上。1月17日上午,在国家医保局“保障人民健康,赋能经济发展”的主题...
01-21
21世纪经济报道记者 韩利明 上海报道随着日前四价HPV疫苗佳达修®的多项新适应证获得国家药品监督管理局的上市批准,成为中国境内首个且目...
01-25
  大众网记者 秦瑾 通讯员 吴悦 报道  12月19日,2024年度山东省数据要素发展大会暨可信数据空间建设启动会在山东大厦举行。齐鲁师范学院人工智能教育研究院研发的“...
01-21
  2025年1月14日,西安市职业教育与成人教育协会2024年度工作总结大会成功召开。来自省、市职业教育界的专家、领导及协会各成员校的负责人共同回顾和展望西安职业教育的发...
01-21
  两年三度冲刺港交所上市,宜宾银行(02596.HK)终于圆梦,但并未引起资本市场过多兴趣。  第一财...
01-22
  摘要  【开年显著回升!PX能否扭转颓势?】PX作为聚酯产业链中关键的原料之一,在整个产业链中...
01-28
双鱼座的男生通常以他们的热情和温柔而闻名。他们善于表达自己的感情,对待朋友和爱人总...
01-22
天蝎男和射手女是两个星座中性格截然不同的代表,他们之间的配对一直备受关注。那么,究竟...
01-22
光彩夺目的时尚盛宴:揭开模特T台走秀的神秘面纱在每一场时装周上,T台走秀总是那个最引人注目的焦点。随着聚光灯的闪烁,模特们如同仙女下凡般走上T台,然而,你是否想过,这背后隐藏...
02-07
古代女性肚兜穿搭? 男生腿短怎么穿搭英伦风?一、古代女性肚兜穿搭?在古代,女性出门时一般会穿上肚兜,以保暖和保护隐私。根据不同地域、年代和社会阶层的不同,肚兜的样式也会有差...
02-12
2月6日消息,名创优品创始人、董事会主席兼CEO叶国富发表新春开工寄语。图源:名创优品集团公众号叶国富称,在过去一年,尽管外部环境面临诸多变化和挑战,名创优品总体业绩依然跑赢...
02-07
2月16日消息,苏宁易购零售云携手海尔,于2月13日-14日期间,在济南、福州、成都三地举办“穿越云海,共赢未来”春季冰洗旺销启动会。在以旧换新国补的带动下,双方将通过丰富产品布...
02-17
2月9日消息,中国动画电影《哪吒2》总票房(含点映及预售)已突破70亿元。四川宜宾、江油等“含吒量”较高的旅游目的地,成为这波流量红利的受益者。同程旅行数据显示,自《哪吒2》电...
02-09
3月5日消息,抖音生活服务南部大区日前推出“萤光计划”,2025年将投入亿级流量、百万货补,帮助中小商家快速掌握运营技能、降低经营成本、获得交易增长。该计划将从资源激励、产...
03-05
2025年,卖奶茶的拼命IPO。作者 | 萧风来源 | 投资家(ID:touzijias)2025年,卖奶茶的拼命IPO。投资家网获悉,号称“每天一杯喝不腻”的新式茶饮公司古茗已通过港交所聆讯、更新招股...
01-22
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
由Mega Cat Studios进行开发、Retroware负责发行的喷神James宇宙平台冒险游戏《Angry Video Game Nerd 8-bit》。现已上线Steam平台。 本作以知名游戏评论节...
01-24
Capcom宣布将于北京时间2月5日早晨6点举行Capcom Spotlight发布会直播,紧接着将是《怪物猎人:荒野》的专场发布会。 视频: 这场35分钟的Spotlight直播将发布Capc...
02-01
2025年春节是“春节——中国人庆祝传统新年的社会实践”列入联合国教科文组织人类非物质文化遗产代表作名录后的首个春节。文化和旅游部组织开展“欢欢喜喜过大年”春节主题...
02-05
极目新闻评论员 屈旌2月9日,截至15时,哪吒2票房超78亿,已进入全球影史票房前40,今日或将突破80亿大关。据报道,《哪吒2》片尾出现了138家中国动画公司,导演饺子曾表示,本来寄希望于...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮