当红炸子鸡DeepSeek,为何花心思自研存储?

1个月前 来源:央广网 观看:12

这两天DeepSeek开源3FS并行文件系统的消息,犹如向AI基础设施领域投下一枚深水炸弹。3FS每秒能搬运6.6TB数据,相当于1秒钟传输完700部4K高清电影。还能自动调资源,国产芯片用了它,跟国际大牌的差距直接缩小到15%。ore即热新闻——关注每天科技社会生活新变化gihot.com

这并非简单的技术迭代——当Llama3 70B模型单次训练需吞掉15PB数据(相当于连续播放250万小时4K视频)时,全球AI实验室突然意识到:决定大模型训练效率的不仅是GPU算力,存储系统正成为影响进度的一大瓶颈。ore即热新闻——关注每天科技社会生活新变化gihot.com

当AI算力狂飙时,存储正在成为隐形战场ore即热新闻——关注每天科技社会生活新变化gihot.com

2024年,某头部AI公司曾因存储带宽不足,导致2000张A100显卡的算力利用率长期低于40%,单日经济损失超百万美元。这暴露了AI时代的“木桶效应”——当GPU计算速度进入微秒级时,一次突发的存储抖动就可能导致整个训练任务崩溃,让数周的计算成果瞬间蒸发。这或许也是DeepSeek自研存储的原因。ore即热新闻——关注每天科技社会生活新变化gihot.com

数据显示,存储优化可直接将175B参数模型的训练周期压缩30%,对应百万美元级的成本被填平。而在推理端,当10%的异常请求遭遇存储延迟波动时,P99响应时间会瞬间突破SLA红线,这正是某自动驾驶公司在线服务突发降级的根本诱因。ore即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek之所以选择自研3FS的本质,正是发现了存储架构在AI应用中的重要性。《金融行业先进AI存力报告》中提到,在同样的GPU算力规模下,存储性能的高低可能造成模型训练周期数倍的差异。在算力竞赛的背后,一场关于存储性能密度的暗战悄然升级,自研存储显得尤为重要。ore即热新闻——关注每天科技社会生活新变化gihot.com

5家头部厂商角逐AI存储,国产能否拔得头筹ore即热新闻——关注每天科技社会生活新变化gihot.com

相比于传统AI的需求,大模型对存力需求场景具有数据量大、参数规模大、训练周期长等特点。ore即热新闻——关注每天科技社会生活新变化gihot.com

为了提升大模型训练速度,需要对大规模数据集进行快速加载,且一般采用数百甚至上万张GPU构成计算集群进行高效的并行计算,需要高并发输入/输出(I/O)处理,而训练数据集呈现海量小文件的特点,文件量在几亿到几十亿量级,对应的带宽需求可能每秒要达到上TB,这就要求存储系统具备强大的数据管理能力,业界能达到该能力的仅寥寥几家。ore即热新闻——关注每天科技社会生活新变化gihot.com

从国内外优秀的并行存储产品具体能力对比来看,IBM作为老牌存储品牌,其产品从HPC场景成功向AI场景演进。在全球AI场景得到广泛应用的DDN,多个读、写带宽等关键性能指标上表现突出,但DDN由于技术封闭性、专有化硬件等原因,导致用户建设成本过高。ore即热新闻——关注每天科技社会生活新变化gihot.com

国产厂商DeepSeek 3FS虽然是开源的新产品,但相对老牌存储也有不错的表现,在读带宽能力上表现优异,单集群6.6TB/s,平均单节点36.7GB/s的读带宽。ore即热新闻——关注每天科技社会生活新变化gihot.com

另一家国产厂商京东云云海,在这个专业领域同样表现出色,以单节点95GB/s的读带宽、60GB/s的写带宽,进一步拉低了国产存储与国际老牌厂商的差距。相较于DeepSeek的3FS,京东云云海在提供高性能的同时适用性更广,可以同时满足DeepSeek、ChatGPT、LLaMA等20余种主流大模型的存力需求。ore即热新闻——关注每天科技社会生活新变化gihot.com

综上来看,随着大模型快速向纵深场景演进,对存储的要求也越来越高,DeepSeek 3FS、京东云云海等国产存储,显示出在处理大规模数据集时的优越性能。未来国产存储能否拔得头筹,让我们拭目以待。ore即热新闻——关注每天科技社会生活新变化gihot.com

这两天DeepSeek开源3FS并行文件系统的消息,犹如向AI基础设施领域投下一枚深水炸弹。3FS每秒能搬运6.6TB数据,相当于1秒钟传输完700部4K高清电影。还能自动调资源,国产芯片用了它,跟国际大牌的差距直接缩小到15%。ore即热新闻——关注每天科技社会生活新变化gihot.com

这并非简单的技术迭代——当Llama3 70B模型单次训练需吞掉15PB数据(相当于连续播放250万小时4K视频)时,全球AI实验室突然意识到:决定大模型训练效率的不仅是GPU算力,存储系统正成为影响进度的一大瓶颈。ore即热新闻——关注每天科技社会生活新变化gihot.com

当AI算力狂飙时,存储正在成为隐形战场ore即热新闻——关注每天科技社会生活新变化gihot.com

2024年,某头部AI公司曾因存储带宽不足,导致2000张A100显卡的算力利用率长期低于40%,单日经济损失超百万美元。这暴露了AI时代的“木桶效应”——当GPU计算速度进入微秒级时,一次突发的存储抖动就可能导致整个训练任务崩溃,让数周的计算成果瞬间蒸发。这或许也是DeepSeek自研存储的原因。ore即热新闻——关注每天科技社会生活新变化gihot.com

数据显示,存储优化可直接将175B参数模型的训练周期压缩30%,对应百万美元级的成本被填平。而在推理端,当10%的异常请求遭遇存储延迟波动时,P99响应时间会瞬间突破SLA红线,这正是某自动驾驶公司在线服务突发降级的根本诱因。ore即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek之所以选择自研3FS的本质,正是发现了存储架构在AI应用中的重要性。《金融行业先进AI存力报告》中提到,在同样的GPU算力规模下,存储性能的高低可能造成模型训练周期数倍的差异。在算力竞赛的背后,一场关于存储性能密度的暗战悄然升级,自研存储显得尤为重要。ore即热新闻——关注每天科技社会生活新变化gihot.com

5家头部厂商角逐AI存储,国产能否拔得头筹ore即热新闻——关注每天科技社会生活新变化gihot.com

相比于传统AI的需求,大模型对存力需求场景具有数据量大、参数规模大、训练周期长等特点。ore即热新闻——关注每天科技社会生活新变化gihot.com

为了提升大模型训练速度,需要对大规模数据集进行快速加载,且一般采用数百甚至上万张GPU构成计算集群进行高效的并行计算,需要高并发输入/输出(I/O)处理,而训练数据集呈现海量小文件的特点,文件量在几亿到几十亿量级,对应的带宽需求可能每秒要达到上TB,这就要求存储系统具备强大的数据管理能力,业界能达到该能力的仅寥寥几家。ore即热新闻——关注每天科技社会生活新变化gihot.com

从国内外优秀的并行存储产品具体能力对比来看,IBM作为老牌存储品牌,其产品从HPC场景成功向AI场景演进。在全球AI场景得到广泛应用的DDN,多个读、写带宽等关键性能指标上表现突出,但DDN由于技术封闭性、专有化硬件等原因,导致用户建设成本过高。ore即热新闻——关注每天科技社会生活新变化gihot.com

国产厂商DeepSeek 3FS虽然是开源的新产品,但相对老牌存储也有不错的表现,在读带宽能力上表现优异,单集群6.6TB/s,平均单节点36.7GB/s的读带宽。ore即热新闻——关注每天科技社会生活新变化gihot.com

另一家国产厂商京东云云海,在这个专业领域同样表现出色,以单节点95GB/s的读带宽、60GB/s的写带宽,进一步拉低了国产存储与国际老牌厂商的差距。相较于DeepSeek的3FS,京东云云海在提供高性能的同时适用性更广,可以同时满足DeepSeek、ChatGPT、LLaMA等20余种主流大模型的存力需求。ore即热新闻——关注每天科技社会生活新变化gihot.com

综上来看,随着大模型快速向纵深场景演进,对存储的要求也越来越高,DeepSeek 3FS、京东云云海等国产存储,显示出在处理大规模数据集时的优越性能。未来国产存储能否拔得头筹,让我们拭目以待。ore即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1074-0.html当红炸子鸡DeepSeek,为何花心思自研存储?

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:“七星连珠”为何并非“罕见奇观”

下一篇:多地积极布局智慧养老 养老机器人已“上岗”

为你推荐
  科技日报讯(记者 崔爽)记者8月30日从国家区块链技术创新中心获悉,我国首个区块链专用计算硬件...
01-21
据物理学家组织网14日报道,美国国家航空航天局(NASA)和意大利航天局携手研制的月球GNSS(全球导航卫星系统)接收器实验(LuGRE)有效载荷即将发射升空。LuGRE...
01-21
    消费升腾跳动,城市脉搏跃动,新春的广州一片火热。  刚过去的蛇年春节假期,广州各大商圈...
02-06
  预计今天(2月14日)开始,西南地区东部、江南、江淮、华南等地又将迎来一次明显降水过程,局地或现...
02-14
现代快报讯(记者刘伟娟文/摄)票价8.5元,行程4小时41分钟,你会从南京硬坐到上海吗?1月21日,现代快报记者从铁路12306获悉,部分硬座票“骨折价”,引起网友关注。铁路12306显示,南京到上...
01-22
  0元领养宠物,背后却是套路贷?  中国新闻周刊记者:李权云  缅因、英短、布偶、暹罗,北京三里屯的一家大型宠物店里,几十只热门品种猫被分置在宠物柜里对外展示,柜门上标注...
01-21
摘要【商务部等8部门印发关于开展汽车流通消费改革试点工作的通知】力争到2027年,在汽车流通消费...
01-27
2 月 2 日消息,比亚迪宣布旗下海豹05 DM-i汽车将于2月10日正式上市,该车已于1月7日开启预售,预售价为 8.98-10.98万元。据从工信部申报信息获悉,海豹 05 DM-i 将配备与...
02-02
《余烬之上》廖知白被谁杀了?廖知白最后真的死了嘛?在《余烬之上》中,廖知白并非被他人所杀,而是自己策划了死亡。廖知白为了揪出幕后黑手,将自己尸体公之于众,引...
02-21
《难哄》是双男女主吗小说?难哄小说女主描述的是什么?《难哄》不是双女主小说,而是一部以温以凡和桑延为主角的现代言情小说。单女主设定:女主温以凡因家庭变故...
02-21
21世纪经济报道记者 唐唯珂 广州报道社会办医的洗牌期仍在继续。2025年1月,新华医疗挂牌转让旗下山东新华昌国医院投资管理有限公司55%股权...
01-25
21世纪经济报道记者 韩利明 上海报道2024年,对于中国生物医药企业而言,似乎尚未走出“资本寒冬”。医药魔方数据显示,中国医疗健康领域一级市...
02-06
大连理工大学认真贯彻落实党的二十大、二十届三中全会和全国教育大会精神,在教育强国建设新征程上,紧紧围...
01-21
1月21日,记者从厦门大学了解到,该校能源学院卜令正副教授、郑志锋教授团队...
01-22
  中央经济工作会议提出,要稳妥处置地方中小金融机构风险。近期金融监管总局召开的年度监管工...
01-23
  本报记者 冷翠华  近年来,在重疾险新单保费增长乏力的情况下,人身险行业正在努力探寻“第二...
02-06
每个人都有自己心仪的对象,而星座往往成为我们选择伴侣的参考因素之一。在星座中,有一种...
01-22
天蝎座的男生通常被认为是深情而又神秘的存在。他们对感情非常认真,一旦决定与某人交往...
01-22
如何通过色彩搭配提升模特T台走秀的视觉效果在时尚界,**色彩搭配**的重要性不言而喻,尤其是在模特的T台走秀中。每一场走秀都是设计师创意的体现,但背后的色彩选择和搭配更是决...
02-12
石家庄时尚盛宴:揭秘模特T台走秀的光彩时刻当我走进石家庄的时尚中心,目光所及之处尽是华丽的灯光、绚烂的服饰,以及那些熠熠生辉的模特。在这个为期数天的T台走秀活动中,观众们...
02-12
抖音电商势不可挡。据36氪消息,2024年,抖音电商的商品交易总额(GMV)约为3.5万亿元,同比增幅达30%,2025年目标为4.2万亿元。截至发稿,此数据尚未获得抖音电商相关负责人回应。另据了...
02-15
2月19日消息,小红书电商日前正式启动运营服务商招募,通过运营服务商的专业化能力和经验,为商家提供账号定位、内容打造、直播操盘、店铺运营、投流推广、货盘供应等服务,加速潜...
02-20
2025年春节,在北京工作的95后女孩小苗没有回老家。大年初一这天晚上,她和母亲一起在云南大理古城参加篝火晚会,手牵手围着“科技篝火...
02-07
3月2日消息,携程旅游网络技术(上海)有限公司近日获第二届“上海慈善奖”捐赠企业奖。图源:携程黑板报公众号据介绍,在乡村振兴方面,携程全力打造“乡村旅游振兴”战略,通过规模化赋...
03-03
1月21日,赛力斯披露2024年年报业绩预盈公告,公司预计2024年度实现营业收入1442亿元到1467亿元,同比增长302.32%到309.30%;预计2024年实现归属上市公司股东的净利润为55亿元...
01-23
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
近日在四川内江资中,一名小孩往下水道投放鞭炮,瞬间引发剧烈爆炸。 据国内媒体报道称,四川资中县一男孩将鞭炮扔进下水道引发化粪池内沼气爆燃,事故现场多辆停放在...
02-02
《天国:拯救2》已正式发售,首发24小时销量就突破100万份。许多玩家对这款中世纪RPG表现出浓厚兴趣。游戏中有许多细节非常真实,比如玩家会因为偷窃被捕,越狱时被守...
02-06
北京时间2月1日,国际乒联在官网公布了2025澳门单打世界杯的参赛名额选拔办法。48个名额将分别由洲际杯赛和世界排名决定,其中每个大洲的洲际杯赛会产生4个名额(共20个名额),其余2...
02-02
人民日报记者2日从2025年综合运输春运工作专班获悉:预计2月2日(春运第20日,农历正月初五),全社会跨区域人员流动量31932万人次,其中,铁路客运量1450万人次,公路人员流动量30102万人...
02-02
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮