当红炸子鸡DeepSeek,为何花心思自研存储?

1年前 来源:央广网 观看:128

这两天DeepSeek开源3FS并行文件系统的消息,犹如向AI基础设施领域投下一枚深水炸弹。3FS每秒能搬运6.6TB数据,相当于1秒钟传输完700部4K高清电影。还能自动调资源,国产芯片用了它,跟国际大牌的差距直接缩小到15%。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

这并非简单的技术迭代——当Llama3 70B模型单次训练需吞掉15PB数据(相当于连续播放250万小时4K视频)时,全球AI实验室突然意识到:决定大模型训练效率的不仅是GPU算力,存储系统正成为影响进度的一大瓶颈。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

当AI算力狂飙时,存储正在成为隐形战场0Ic即热新闻——关注每天科技社会生活新变化gihot.com

2024年,某头部AI公司曾因存储带宽不足,导致2000张A100显卡的算力利用率长期低于40%,单日经济损失超百万美元。这暴露了AI时代的“木桶效应”——当GPU计算速度进入微秒级时,一次突发的存储抖动就可能导致整个训练任务崩溃,让数周的计算成果瞬间蒸发。这或许也是DeepSeek自研存储的原因。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

数据显示,存储优化可直接将175B参数模型的训练周期压缩30%,对应百万美元级的成本被填平。而在推理端,当10%的异常请求遭遇存储延迟波动时,P99响应时间会瞬间突破SLA红线,这正是某自动驾驶公司在线服务突发降级的根本诱因。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek之所以选择自研3FS的本质,正是发现了存储架构在AI应用中的重要性。《金融行业先进AI存力报告》中提到,在同样的GPU算力规模下,存储性能的高低可能造成模型训练周期数倍的差异。在算力竞赛的背后,一场关于存储性能密度的暗战悄然升级,自研存储显得尤为重要。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

5家头部厂商角逐AI存储,国产能否拔得头筹0Ic即热新闻——关注每天科技社会生活新变化gihot.com

相比于传统AI的需求,大模型对存力需求场景具有数据量大、参数规模大、训练周期长等特点。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

为了提升大模型训练速度,需要对大规模数据集进行快速加载,且一般采用数百甚至上万张GPU构成计算集群进行高效的并行计算,需要高并发输入/输出(I/O)处理,而训练数据集呈现海量小文件的特点,文件量在几亿到几十亿量级,对应的带宽需求可能每秒要达到上TB,这就要求存储系统具备强大的数据管理能力,业界能达到该能力的仅寥寥几家。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

从国内外优秀的并行存储产品具体能力对比来看,IBM作为老牌存储品牌,其产品从HPC场景成功向AI场景演进。在全球AI场景得到广泛应用的DDN,多个读、写带宽等关键性能指标上表现突出,但DDN由于技术封闭性、专有化硬件等原因,导致用户建设成本过高。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

国产厂商DeepSeek 3FS虽然是开源的新产品,但相对老牌存储也有不错的表现,在读带宽能力上表现优异,单集群6.6TB/s,平均单节点36.7GB/s的读带宽。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

另一家国产厂商京东云云海,在这个专业领域同样表现出色,以单节点95GB/s的读带宽、60GB/s的写带宽,进一步拉低了国产存储与国际老牌厂商的差距。相较于DeepSeek的3FS,京东云云海在提供高性能的同时适用性更广,可以同时满足DeepSeek、ChatGPT、LLaMA等20余种主流大模型的存力需求。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

综上来看,随着大模型快速向纵深场景演进,对存储的要求也越来越高,DeepSeek 3FS、京东云云海等国产存储,显示出在处理大规模数据集时的优越性能。未来国产存储能否拔得头筹,让我们拭目以待。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

这两天DeepSeek开源3FS并行文件系统的消息,犹如向AI基础设施领域投下一枚深水炸弹。3FS每秒能搬运6.6TB数据,相当于1秒钟传输完700部4K高清电影。还能自动调资源,国产芯片用了它,跟国际大牌的差距直接缩小到15%。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

这并非简单的技术迭代——当Llama3 70B模型单次训练需吞掉15PB数据(相当于连续播放250万小时4K视频)时,全球AI实验室突然意识到:决定大模型训练效率的不仅是GPU算力,存储系统正成为影响进度的一大瓶颈。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

当AI算力狂飙时,存储正在成为隐形战场0Ic即热新闻——关注每天科技社会生活新变化gihot.com

2024年,某头部AI公司曾因存储带宽不足,导致2000张A100显卡的算力利用率长期低于40%,单日经济损失超百万美元。这暴露了AI时代的“木桶效应”——当GPU计算速度进入微秒级时,一次突发的存储抖动就可能导致整个训练任务崩溃,让数周的计算成果瞬间蒸发。这或许也是DeepSeek自研存储的原因。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

数据显示,存储优化可直接将175B参数模型的训练周期压缩30%,对应百万美元级的成本被填平。而在推理端,当10%的异常请求遭遇存储延迟波动时,P99响应时间会瞬间突破SLA红线,这正是某自动驾驶公司在线服务突发降级的根本诱因。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek之所以选择自研3FS的本质,正是发现了存储架构在AI应用中的重要性。《金融行业先进AI存力报告》中提到,在同样的GPU算力规模下,存储性能的高低可能造成模型训练周期数倍的差异。在算力竞赛的背后,一场关于存储性能密度的暗战悄然升级,自研存储显得尤为重要。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

5家头部厂商角逐AI存储,国产能否拔得头筹0Ic即热新闻——关注每天科技社会生活新变化gihot.com

相比于传统AI的需求,大模型对存力需求场景具有数据量大、参数规模大、训练周期长等特点。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

为了提升大模型训练速度,需要对大规模数据集进行快速加载,且一般采用数百甚至上万张GPU构成计算集群进行高效的并行计算,需要高并发输入/输出(I/O)处理,而训练数据集呈现海量小文件的特点,文件量在几亿到几十亿量级,对应的带宽需求可能每秒要达到上TB,这就要求存储系统具备强大的数据管理能力,业界能达到该能力的仅寥寥几家。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

从国内外优秀的并行存储产品具体能力对比来看,IBM作为老牌存储品牌,其产品从HPC场景成功向AI场景演进。在全球AI场景得到广泛应用的DDN,多个读、写带宽等关键性能指标上表现突出,但DDN由于技术封闭性、专有化硬件等原因,导致用户建设成本过高。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

国产厂商DeepSeek 3FS虽然是开源的新产品,但相对老牌存储也有不错的表现,在读带宽能力上表现优异,单集群6.6TB/s,平均单节点36.7GB/s的读带宽。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

另一家国产厂商京东云云海,在这个专业领域同样表现出色,以单节点95GB/s的读带宽、60GB/s的写带宽,进一步拉低了国产存储与国际老牌厂商的差距。相较于DeepSeek的3FS,京东云云海在提供高性能的同时适用性更广,可以同时满足DeepSeek、ChatGPT、LLaMA等20余种主流大模型的存力需求。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

综上来看,随着大模型快速向纵深场景演进,对存储的要求也越来越高,DeepSeek 3FS、京东云云海等国产存储,显示出在处理大规模数据集时的优越性能。未来国产存储能否拔得头筹,让我们拭目以待。0Ic即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1074-0.html当红炸子鸡DeepSeek,为何花心思自研存储?

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:“七星连珠”为何并非“罕见奇观”

下一篇:多地积极布局智慧养老 养老机器人已“上岗”

为你推荐
新华社合肥1月20日电(记者徐海涛、陈诺)“998、999、1000……”大屏幕上的数字最终定格在1066,原本安静的控制大厅一片欢呼。1月20日,我国...
01-21
  科技日报记者 雍黎  人工智能浪潮正席卷全球,重庆应该如何加速培育壮大人工智能产业?在重庆...
01-23
  日前,在辽宁省政府新闻办举行的2024年全省经济运行情况系列第一场新闻发布会上获悉,2024年,辽宁GDP增...
01-22
  潮玩、手办等各渠道售罄,有的商品预售发货时间已排到6月底……  一“吒”难求!《哪吒2》周...
02-14
  “索要千万逼死丈夫”案的翟欣欣因涉嫌犯敲诈勒索罪,案件将于今日开庭。  苏享茂的哥哥苏享龙此前也曾对外发布消息,说已接法院通知,翟欣欣涉嫌敲诈勒索一案,定于2025...
01-21
  中新经纬1月17日电(李晓萱)“教育、数字贸易和跨境电商、海外仓及可再生能源是未来最具潜力的领域。”近日,巴西中国浙江商会会长郑侠茂在接受中新经纬采访时说。巴西中...
01-21
1 月 22 日消息,据特斯拉官方新闻稿,特斯拉宣布其官方出品的2024款Model S / X车型的汽车模型目前已在其“Tesla App”开售,定价均为1499元,其中Model S可选灰 / 黑 / ...
01-23
2 月 2 日消息,比亚迪腾势销售事业部总经理赵长江今日发布视频分享了腾势 N9 新车“九大爆料”,其中提到了该车的上市时间、发布节奏,以及部分车型的续航能力。整理赵...
02-02
  1、《难哄》和《偷偷藏不住》是同一个作者所著姊妹篇,两部作品的人物角色和故事情节都有重合跟关联。  2、《难哄》是以桑延和温以凡为主角创作的,桑延是《偷偷藏不住...
02-14
近期,《白色橄榄树》风靡全网,播出后反响热烈。网友们对这部剧的讨论热度不断攀升,纷纷在各大论坛上展开热议,许多人想了解其中的具体内容和剧情细节。今天将详...
02-19
  2024年10月,国家医保局出台护理类立项指南(试行)和优化调整护理价格政策通知,“免陪照护服务”成为新增项目,国内多家医院开始试点“无陪护病房”。随着“无陪护病房”...
02-07
  在探索生命奥秘的领域,干细胞研究取得了令人瞩目的成就。自1932年干细胞相关研究问世以来,历...
02-14
  1月16日,在得知37656.7元义卖捐款将送到西藏灾区后,西安航天基地富力城黄河小学的师生家长深感欣慰。  近日,西藏日喀则市定日县地震牵动着每个人的心。在听闻受灾地区...
01-21
近期,阜新市第一职专刘艳霞名班主任工作室阶段汇报会在学校一楼礼堂举行。会议由工作室成员冯宇老师主持...
01-21
  摘要  【氧化铝大涨又大跌后市怎么走?】氧化铝价格大跌后反弹,此前一月内现货报价下跌1400...
01-21
  原油期货在上周走高后本周维持震荡,从当前市场逻辑来看,分析人士认为,短期原油价格向上驱动不...
01-24
天秤男,作为十二星座中最具魅力和温柔的代表之一,总能吸引众多女性的目光。他们善于处理...
01-22
在星座学中,人们常常相信星座之间存在着某种神秘的联系和吸引力。其中,双鱼男和射手女之...
01-22
休闲男装搭配? 男装休闲搭配?休闲男装搭配?01.条纹衬衫+牛仔裤这一身穿搭单品款式上组合看起来不仅休闲感满满,而且还透露出非常清爽的感觉,经典怀旧的牛仔休闲裤,跟上衣浅粉条纹...
02-07
男生穿搭显高推荐? 男生怎么穿搭显瘦显高?一、男生穿搭显高推荐?九分裤是现在很流行的一款裤子,设计非常的时尚,而且很好搭配,最重要的是它能够很好的修饰身材比例,让腿看起来更长,...
02-17
张一鸣:做不好就别做,要做就必须做到非常好。红果免费短剧月活飙升至1.58亿近一两年,除了AI,短剧可谓是另一个炙手可热的赛道。一时之间,资本争相涌入,就连周鸿祎也亲自下场做短剧...
02-19
2月20日消息,展辰集团董事、工业漆事业部总经理张君一行近日到访涂多多。国联股份高级副总裁、涂多多CEO刘斋,涂多多高级副总裁、跨境产发部总经理邵春生代表公司热情接待来访...
02-20
2月4日消息,途家民宿数据显示,截至2月4日,春节期间持非中国护照游客的民宿预订量同比增长3.7倍,有51个乡镇第一次迎来了外国人的订单。从平台民宿预订情况看,大理连续三年蝉联第...
02-07
2月23日消息,在线旅游预订公司Booking公布2024年第四季度和全年业绩。财报显示,2024年第四季度,Booking客房预订夜数增长13%至2.61亿;总预订额同比增长约17%至372亿美元;收入同比...
02-24
金陵华软科技股份有限公司(以下简称“华软科技”)于2025年1月18日发布了2024年度业绩预告。尽管公司预计2024年净利润仍为负值,但从整体情况来看,华软科技正在逐步摆脱困境,展现...
01-21
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
《狙击精英》系列最新作《狙击精英:抵抗》已于1月30日正式发售,Steam国区定价168元,豪华版268元。截至目前,该作在Steam上仅收获了698个评价,好评率也不高,仅68%,为褒...
02-03
四川资中一小孩因燃放鞭炮引起的沼气燃爆,致使8辆汽车受损一事,引起网友热议。 因为受损车辆包括林肯、雷克萨斯、奥迪、保时捷等豪华品牌,事件发生后,网上出现多...
02-03
人民日报记者2日从2025年综合运输春运工作专班获悉:预计2月2日(春运第20日,农历正月初五),全社会跨区域人员流动量31932万人次,其中,铁路客运量1450万人次,公路人员流动量30102万人...
02-02
记者从国家医保局获悉,今年1月,有专家认为某些集采药品可能存在“血压不降、麻药不睡、泻药不泻”质量风险,有关部门派员调研了解情况。日前,参与调研的医保、药监部门接受了记...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮