DeepSeek打响头炮!国产芯片开打辅助:卷适配、卷落地、卷性价比

1年前 来源: 观看:168

“忙不过来了。”从春节到元宵,AI芯片和算力厂商的工程师们没有停过一刻忙碌。lfo即热新闻——关注每天科技社会生活新变化gihot.com

奔忙的背后是为了一条名为DeepSeek的“鲇鱼”,其低算力、高性能、开源等特性,使原本卡在算力“瓶颈”中的国产AI再一次拉满想象力。lfo即热新闻——关注每天科技社会生活新变化gihot.com

从大年初四到大年初十,十多家国产AI芯片和算力企业相继加入DeepSeek“朋友圈”,彼时工程师们忙的是DeepSeek模型的适配和服务上架;而如今,要问这些企业在忙什么,得到的回复可能会很统一——部署。lfo即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前行业正从DeepSeek的适配过渡向部署和应用,企业一方面迎来大量用户咨询,全力响应用户需求,另一方面也正在打造DeepSeek版智算一体机,加速AI应用落地。“DeepSeek真正能成为生产力工具、满足应用落地需求的大模型,可以预期,2025年大模型的应用落地会爆发起来。”业内人士称。lfo即热新闻——关注每天科技社会生活新变化gihot.com

过去两年多,ChatGPT带飞了算力产业,并将英伟达送上“国王宝座”。国产算力厂们苦寻出路。如今,DeepSeek凿开了一个口子,天光已现,但国产算力能否一飞冲天,还有待考验。lfo即热新闻——关注每天科技社会生活新变化gihot.com

有业内人士分析,DeepSeek带来推理算力需求激增,行业可能迎来新一轮的洗牌,未来或是性价比之争。lfo即热新闻——关注每天科技社会生活新变化gihot.com

2月13日,DeepSeek概念股午后再度拉升走高,宏景科技20cm涨停,优刻得(688158.SH)、弘信电子(300657.SZ)、并行科技(839493.BJ)涨超10%。lfo即热新闻——关注每天科技社会生活新变化gihot.com

图源:图虫创意lfo即热新闻——关注每天科技社会生活新变化gihot.com

紧急“适配”lfo即热新闻——关注每天科技社会生活新变化gihot.com

事实上,国产算力厂商的“适配潮”仍在继续。
lfo即热新闻——关注每天科技社会生活新变化gihot.com

例如,早在2月4日,华为就宣布联合硅基流动首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。但直到2月12日,华为云才再次发文宣布,DeepSeek V3/R1满血版上线。lfo即热新闻——关注每天科技社会生活新变化gihot.com

截至目前,虽已有超15家芯片厂商适配了DeepSeek模型,但据时代财经不完全统计,明确宣布适配DeepSeek R1及V3原版模型的不到一半。lfo即热新闻——关注每天科技社会生活新变化gihot.com

图源:时代财经不完全统计梳理lfo即热新闻——关注每天科技社会生活新变化gihot.com

多数企业宣称能在“几小时内”“一天内”可以快速完成适配的,但大部分仅是DeepSeek R1的系列蒸馏模型,而原版或称“满血版”的模型适配仍在进行中。lfo即热新闻——关注每天科技社会生活新变化gihot.com

云天励飞(688343.SH)副总裁、芯片业务线总经理李爱军告诉时代财经,在适配上线过程中,DeepSeek的模型可分为两类,其一是基于DeepSeek R1蒸馏了一些参数小的模型,包含1.5B、7B、14B以及70B等大模型,这些蒸馏模型的原始模型是通义千问和LLAMA,那么原本能够支持通义千问和LLAMA模型的平台,基本上就能适配这些DeepSeek的蒸馏模型,这一块的工作量相对较小,企业一般花费一周左右就能适配完成。lfo即热新闻——关注每天科技社会生活新变化gihot.com

另一类则是DeepSeek V3和DeepSeek R1的原版模型,这是DeepSeek自研的原生态MOE大模型,其参数量达到了671B,里面囊括了MLA等新的算子,考验着芯片适应超大规模MOE架构、支持新型算子、稀疏MoE模型的执行效率等的能力。lfo即热新闻——关注每天科技社会生活新变化gihot.com

而其中最大的难点在于模型本身的参数量大。“目前,国产HBM(高带宽存储器)芯片的容量不大,在用于推理的人工智能计算场景中,16GB、32GB乃至64GB的HBM容量已经被认为是较大的配置了。但即使是使用64GB的芯片来运行671B参数的大模型,要把参数加载到芯片中,也至少需要11张×64GB的芯片才能勉强放下这个模型。这也意味着单卡无法解决问题,牵涉到卡与卡之间的互联能力和效率。”李爱军谈到,因此,适配的时长取决于各家的基础。基础好、投入大的,一到两周就能完成适配,技术次于此的,可能在两三周左右能够适配完,或者更长时间,有的甚至无法适配。lfo即热新闻——关注每天科技社会生活新变化gihot.com

昆仑芯科技也表示,理论上,各类大模型的常规模型、常规组网能直接跑通,然而难免会出现特殊算子、特殊规模,需要投入人力进行针对性调试。跑通只是基础,后期涉及后端硬件不同、算子实现不同、对应软件版本不同等因素,精度对齐、性能对齐也都需要人力介入进行针对性适配。lfo即热新闻——关注每天科技社会生活新变化gihot.com

不过,也有行业人士向时代财经透露,由于DeepSeek本身开源,适配过程中并不需要授权,尽管目前众多平台都在适配该模型,但这种适配可能并非真正意义上的“接入”。“真正意义上的接入是DeepSeek利用某个智算中心提供云服务,但是目前真正和DeepSeek达成这种合作的厂商非常少,可能只有一两家。”lfo即热新闻——关注每天科技社会生活新变化gihot.com

lfo即热新闻——关注每天科技社会生活新变化gihot.com

部署和落地lfo即热新闻——关注每天科技社会生活新变化gihot.com

适配之外,更关键的是部署。lfo即热新闻——关注每天科技社会生活新变化gihot.com

近期,并行科技(839493.BJ)、壁仞科技、摩尔线程和昆仑芯科技等多家企业均向时代财经透露,他们正在忙于为客户做DeepSeek模型的部署。lfo即热新闻——关注每天科技社会生活新变化gihot.com

“部署是大模型转化为生产力的必要步骤。”中存算半导体董事长陈巍解释,部署相当于在用户的生产环境里进行模型的安装设置和做与客户成产环境的连接。lfo即热新闻——关注每天科技社会生活新变化gihot.com

时代财经在某国产算力运营商的产品交流群中观察到,不少用户在询问如何导入和设置API、如何集成相关服务,还有人咨询DeepSeek模型接入后为何运行速度较慢等。lfo即热新闻——关注每天科技社会生活新变化gihot.com

“行业确实正处于模型应用落地的关键阶段。”2月12日,摩尔线程相关技术负责人向时代财经表示。lfo即热新闻——关注每天科技社会生活新变化gihot.com

时代财经了解到,在近期行业密集适配DeepSeek系列模型后,不少厂商开始寻求落地应用,智算一体机这种硬件部署形式于是浮出了水面。lfo即热新闻——关注每天科技社会生活新变化gihot.com

摩尔线程表示,公司正与雪浪云联合打造了“软硬件紧耦合”大模型训推一体机——雪浪MindCenter X100,就已成功部署DeepSeek-R1-Distill-Qwen(适配1.5B、7B、14B、32B)推理服务。lfo即热新闻——关注每天科技社会生活新变化gihot.com

“一体机生意会是今年的大机会,离线需求太多了。”有业内人士感慨道。lfo即热新闻——关注每天科技社会生活新变化gihot.com

“前段时间大家都在适配,适配了之后呢?我们希望能够在一些领域能够实现真正的应用。”壁仞科技相关负责人告诉时代财经,壁仞科技联合中兴通讯、浙江大学上海高等研究院和一蓦科技推出了智海AI教育一体机。该产品实现了国产算力与DeepSeek的适配及知识课程、实训课题、智能体等教学工具的设计开发,并形成了包含AI通识课、专业课、实践实训在内的一体化解决方案。lfo即热新闻——关注每天科技社会生活新变化gihot.com

2月11日,中国电信(601728.SH)和中国移动(600941.SH)两大电信运营商也分别推出了天翼云和移动云智算一体机-DeepSeek版。lfo即热新闻——关注每天科技社会生活新变化gihot.com

据移动云官方消息,智算一体机简单来说就是基于移动云边缘智能小站算力底座打造的小型专属云,专门为企业量身定制。它复用了边缘智能小站的产品技术,还有统一运维、快速交付这些服务,解决了企业在 AI 应用落地时对数据安全的担忧,还能提高AI应用开发的效率。lfo即热新闻——关注每天科技社会生活新变化gihot.com

图源:移动云官方公众号lfo即热新闻——关注每天科技社会生活新变化gihot.com

此外,京东云、联想(0992.HK)、科华数据(002335.SZ)、浪潮云、中国长城(000066.SZ)、天融信(002212.SZ)等企业均官宣发布了DeepSeek智算一体机。lfo即热新闻——关注每天科技社会生活新变化gihot.com

lfo即热新闻——关注每天科技社会生活新变化gihot.com

行业或迎洗牌?lfo即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek火了,顺带捧红了国产算力,但也带出了一系列疑问。DeepSeek时代需要怎样的算力?DeepSeek又将如何改变如今算力市场的战局?lfo即热新闻——关注每天科技社会生活新变化gihot.com

此前,DeepSeek似乎已经出现算力吃紧的现象。2月6日,DeepSeek暂停API(接口)充值服务,DeepSeek官方解释为服务器资源紧张。2月9日,DeepSeek调整收费标准,每百万输入tokens的价格为0.5元(针对缓存命中情况)和2元(针对缓存未命中情况),而输出tokens的价格则定为每百万8元。在优惠期内,DeepSeek-V3对于输入tokens的收费是每百万0.1元(缓存命中)和1元(缓存未命中),输出tokens则是每百万2元。lfo即热新闻——关注每天科技社会生活新变化gihot.com

图源:图虫创意lfo即热新闻——关注每天科技社会生活新变化gihot.com

李爱军认为,在DeepSeek模型的性能足够强,而其未来很可能继续延续开源的策略的情况下,企业能够直接使用它进行应用落地,而非自己再重新训练出一个基础模型。由此,未来推理侧的算力需求将大规模爆发。lfo即热新闻——关注每天科技社会生活新变化gihot.com

他表示,在模型训练环节追求的是极致的性能,哪怕GPU价格非常高,企业也不吝购买。一旦到了推理环节,行业的关注点就会变成性价比,因为推理时时刻刻都要使用,GPU芯片在推理时代性价比不突出,专门针对推理场景设计的ASIC芯片会大有机会。lfo即热新闻——关注每天科技社会生活新变化gihot.com

“训练芯片和推理芯片在思路逻辑上有较大区别,训练芯片多选择兼容CUDA架构,走的是GPU架构,推理芯片如云天励飞等,多走的是神经网络处理架构。从训练芯片向推理芯片的转换,市场对芯片的要求、商业模式会有较大的变化。”李爱军推测,未来芯片行业可能将面临新一轮洗牌。lfo即热新闻——关注每天科技社会生活新变化gihot.com

摩尔线程相关技术负责人则认为,从训练侧来看,Scaling Law规模定律仍然有效,模型迭代会加快,对于国产优质训练算力的需求不会降低。长期看,模型参数规模扩大(如GPT-5)和训练方法革新(如MoE)仍会推动训练算力需求增长;从推理侧来看,随着生成式AI应用落地,落地应用(如AIGC、智能体、垂直行业模型)将带来海量碎片化推理需求,市场规模有可能超过训练。lfo即热新闻——关注每天科技社会生活新变化gihot.com

该技术负责人表示,短期内,国产GPU厂商应保持训练芯片的持续迭代,比如最好支持FP8,确保技术不脱节,同时通过推理芯片快速切入商业化场景。从长期上,瞄准“训推一体”架构,通过统一计算平台降低客户切换成本,最终在自主生态中实现训练与推理的协同增长。lfo即热新闻——关注每天科技社会生活新变化gihot.com

至于DeepSeek的冲击波能否影响到大洋彼岸的英伟达,陈巍表示,没有看到deepseek对英伟达的直接利空,但如果DeepSeek引发更大范围更严格的禁运,那么可能使得英伟达GPU销量减少。lfo即热新闻——关注每天科技社会生活新变化gihot.com

“事实上,每一代模型的进步,都意味着同等算力下模型精度更改。在以往模型的进步并未引起英伟达市值下跌。对于deepseek这类大模型,由于参数量巨大,需要更低的存力成本。降本增效是摆在各厂家面前的关键。”陈巍说道。lfo即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-524-0.htmlDeepSeek打响头炮!国产芯片开打辅助:卷适配、卷落地、卷性价比

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:节后6连板!浙数文化3度公告与DeepSeek无关联,仍遭机构爆炒

下一篇:京东0佣金强攻外卖,餐饮商家:会考虑进驻,但更关心后续流量扶持

为你推荐
从“缴纳猫税”(海外用户发布宠物照片)到互相请教数学/英语,再到对工作时间、生活方式的提问,小红书无疑是国内外这几天最受关注的几...
01-21
记者1月18日从中国铁建股份有限公司了解到,由中铁十七局承建的雄商高铁全线控制性工程建设取得新进展,雄商高铁阳谷特大桥跨三干渠连续梁顺利合龙。...
01-21
  一家四口假期出游,提前在线上预订酒店,却订到房型根本不存在的“虚假房”,最后不仅订单被取消,...
01-21
2月7日,记者从辽宁交投集团高速运营公司及建管公司获悉,根据京哈高速绥中(冀辽界)至盘锦段改扩建工程第四...
02-09
1月21日晚间,美股三大指数集体高开。截至发稿,道指涨0.59%,纳指涨幅回落,标普500指数涨0.41%。黄金白银上涨。COMEX期金一度向上触及2750美元/盎司。热门中概股跳水。纳斯达克中...
01-22
  国补开启首日:支付系统“挤崩了”,平板与手机线上销量增长翻倍  伴随着春节行情的开启,各大手机厂商和渠道平台在“国补首日”就抢起了声量,试图从此轮补贴战役中获得“开...
01-21
1 月 24 日消息,比亚迪近日宣布,计划于 2025 年首次在日本推出插电式混合动力汽车,以扩大其在日本市场的影响力。该市场长期以来由本土汽车制造商主导。据日经亚洲报道...
01-25
1 月 24 日消息,汽车媒体 Car Magazine 于 1 月 22 日发布博文,报道称奥迪 RS 7 将告别 V8 引擎,采用 V6 插电混动系统,预计输出功率接近 725 马力。新款奥迪 RS 7 将拥...
01-25
  1、《难哄》电视剧在优酷视频播出,剧集定档2月18日上线优酷的生花剧场全网独播。  2、桑延和温以凡曾是高中同学,缘分安排让他们在工作后重逢,阴差阳错下两人还合租到了...
02-14
近日,娱乐圈内一对知名夫妇——刘诗诗与吴奇隆的生活状态,通过圈内人士刘大锤的社交平台分享,再次吸引了公众的广泛关注。此次爆料不仅揭示了两人独特的家庭分工模式,还意外引发...
02-23
21世纪经济报道记者武瑛港 北京报道近日,羟基磷灰石的使用问题在医美行业内快速升温。记者获悉,2025年1月21日,深圳市市场监督管理局、深圳市...
01-23
21世纪经济报道记者 唐唯珂 广州报道“一到冬天就食欲大增,公司年会将近,想到要穿晚礼服就头大……现在打完一周之后,体重从76.6公斤掉到了74...
01-29
  大众网记者 司心鹏 通讯员 报道  10月15日,山东商业职业技术学院云计算技术与应用产业学院在现代服务业大楼一楼报告厅举行第九届华为ICT大赛宣讲会。会上华为山东...
01-21
  11月8日,备受关注的《学前教育法》正式通过,并将于明年6月1日开始实施。这是我国首次针对3到6岁孩子...
01-21
  经济日报记者 杨然  监管评级结果是衡量保险公司风险程度的主要依据。国家金融监督管理总...
01-28
  中国网财经2月8日讯 日前,国家金融监督管理总局上海监管局核准高建辉中海信托股份有限公司总...
02-11
双子座的男生一向以机智聪慧、善于交际而闻名,他们天生具备吸引人的魅力。当一个双子男...
01-22
天秤男是十二星座中最温和、善良的一位。他们注重平衡和和谐,追求公正和公平。然而,当天...
01-22
aono童装怎么拿货? aono是什么童装?一、aono童装怎么拿货?aono童装可以通过以下途径拿货:1. 直接联系aono童装官方销售代表,了解他们的销售政策和拿货流程。可以通过官方网站或者...
02-07
双人模特T台走秀:打造完美合拍的魅力瞬间T台是时尚界闪耀的舞台,而模特们的走秀动作更是其中的灵魂所在。当我第一次站在T台上,心中充满了既兴奋又紧张的感觉。不仅要展现个人...
02-07
马云再度现身阿里园区,阿里股价创新高马云又开始频繁活跃了,作为商界大佬,其一举一动都是各界关注的焦点。在元宵节的前一天马云突然现身阿里巴巴西溪园区,看起来像是刚理过发,身...
02-13
2月15日消息,快手电商女装亲子行业近日开启“春日焕新季”。活动分三个阶段,第一阶段从2月13日至19日,将为商家带来商家端和用户端补贴、流量激励、新品扶持、磁力金牛对投、短...
02-16
一路狂飙的山姆,又出事了,这直接反映出山姆在中国市场并不是没有焦虑。沃尔玛财报显示,2024年三季度沃尔玛中国市场净销售额达到49亿...
02-07
统一茶里王 图源:统一官网 统一企业(中国)(00220.HK)(下称“统...
03-09
北大博雅(新疆)教育科技有限公司(以下简称“北大博雅”)在2025年2月6日宣布,已完成1500万人民币的A轮融资,投资方为深圳市天皓实业投资控股有限公司。此...
02-07
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
02-09
Midnight Society是由颇具争议的主播Dr Disrespect联合创立的游戏工作室。在进行大规模裁员四个月后,该工作室即将关门大吉。与此同时,谷歌宣布解除对Dr Disresp...
02-03
期待多时的RTX 5090/5080已经正式开卖,而国行对应的则是RTX 5090D。 作为国内特供版,RTX 5090D在硬件上与RTX 5090相似,拥有相同的核心数量和显存配置,甚至PCB设计...
02-03
据网络平台数据截至2月2日17时16分2025年春节档(1月28日—2月4日)档期电影总票房(含预售)突破70亿!再创新高!此外2025年中国电影市场累计票房超北美票房成绩位列全球第一《哪吒之...
02-02
近日,山西大同古城某商户因未按要求亮灯,遭多名工作人员撬锁并强制开灯一事,引发广泛关注。2月7日,山西大同平城区古城街道发布致歉信。致歉信称,因古城街道工作方法失当,引起“破...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮