DeepSeek打响头炮!国产芯片开打辅助:卷适配、卷落地、卷性价比

1年前 来源: 观看:174

“忙不过来了。”从春节到元宵,AI芯片和算力厂商的工程师们没有停过一刻忙碌。wCd即热新闻——关注每天科技社会生活新变化gihot.com

奔忙的背后是为了一条名为DeepSeek的“鲇鱼”,其低算力、高性能、开源等特性,使原本卡在算力“瓶颈”中的国产AI再一次拉满想象力。wCd即热新闻——关注每天科技社会生活新变化gihot.com

从大年初四到大年初十,十多家国产AI芯片和算力企业相继加入DeepSeek“朋友圈”,彼时工程师们忙的是DeepSeek模型的适配和服务上架;而如今,要问这些企业在忙什么,得到的回复可能会很统一——部署。wCd即热新闻——关注每天科技社会生活新变化gihot.com

据了解,目前行业正从DeepSeek的适配过渡向部署和应用,企业一方面迎来大量用户咨询,全力响应用户需求,另一方面也正在打造DeepSeek版智算一体机,加速AI应用落地。“DeepSeek真正能成为生产力工具、满足应用落地需求的大模型,可以预期,2025年大模型的应用落地会爆发起来。”业内人士称。wCd即热新闻——关注每天科技社会生活新变化gihot.com

过去两年多,ChatGPT带飞了算力产业,并将英伟达送上“国王宝座”。国产算力厂们苦寻出路。如今,DeepSeek凿开了一个口子,天光已现,但国产算力能否一飞冲天,还有待考验。wCd即热新闻——关注每天科技社会生活新变化gihot.com

有业内人士分析,DeepSeek带来推理算力需求激增,行业可能迎来新一轮的洗牌,未来或是性价比之争。wCd即热新闻——关注每天科技社会生活新变化gihot.com

2月13日,DeepSeek概念股午后再度拉升走高,宏景科技20cm涨停,优刻得(688158.SH)、弘信电子(300657.SZ)、并行科技(839493.BJ)涨超10%。wCd即热新闻——关注每天科技社会生活新变化gihot.com

图源:图虫创意wCd即热新闻——关注每天科技社会生活新变化gihot.com

紧急“适配”wCd即热新闻——关注每天科技社会生活新变化gihot.com

事实上,国产算力厂商的“适配潮”仍在继续。
wCd即热新闻——关注每天科技社会生活新变化gihot.com

例如,早在2月4日,华为就宣布联合硅基流动首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。但直到2月12日,华为云才再次发文宣布,DeepSeek V3/R1满血版上线。wCd即热新闻——关注每天科技社会生活新变化gihot.com

截至目前,虽已有超15家芯片厂商适配了DeepSeek模型,但据时代财经不完全统计,明确宣布适配DeepSeek R1及V3原版模型的不到一半。wCd即热新闻——关注每天科技社会生活新变化gihot.com

图源:时代财经不完全统计梳理wCd即热新闻——关注每天科技社会生活新变化gihot.com

多数企业宣称能在“几小时内”“一天内”可以快速完成适配的,但大部分仅是DeepSeek R1的系列蒸馏模型,而原版或称“满血版”的模型适配仍在进行中。wCd即热新闻——关注每天科技社会生活新变化gihot.com

云天励飞(688343.SH)副总裁、芯片业务线总经理李爱军告诉时代财经,在适配上线过程中,DeepSeek的模型可分为两类,其一是基于DeepSeek R1蒸馏了一些参数小的模型,包含1.5B、7B、14B以及70B等大模型,这些蒸馏模型的原始模型是通义千问和LLAMA,那么原本能够支持通义千问和LLAMA模型的平台,基本上就能适配这些DeepSeek的蒸馏模型,这一块的工作量相对较小,企业一般花费一周左右就能适配完成。wCd即热新闻——关注每天科技社会生活新变化gihot.com

另一类则是DeepSeek V3和DeepSeek R1的原版模型,这是DeepSeek自研的原生态MOE大模型,其参数量达到了671B,里面囊括了MLA等新的算子,考验着芯片适应超大规模MOE架构、支持新型算子、稀疏MoE模型的执行效率等的能力。wCd即热新闻——关注每天科技社会生活新变化gihot.com

而其中最大的难点在于模型本身的参数量大。“目前,国产HBM(高带宽存储器)芯片的容量不大,在用于推理的人工智能计算场景中,16GB、32GB乃至64GB的HBM容量已经被认为是较大的配置了。但即使是使用64GB的芯片来运行671B参数的大模型,要把参数加载到芯片中,也至少需要11张×64GB的芯片才能勉强放下这个模型。这也意味着单卡无法解决问题,牵涉到卡与卡之间的互联能力和效率。”李爱军谈到,因此,适配的时长取决于各家的基础。基础好、投入大的,一到两周就能完成适配,技术次于此的,可能在两三周左右能够适配完,或者更长时间,有的甚至无法适配。wCd即热新闻——关注每天科技社会生活新变化gihot.com

昆仑芯科技也表示,理论上,各类大模型的常规模型、常规组网能直接跑通,然而难免会出现特殊算子、特殊规模,需要投入人力进行针对性调试。跑通只是基础,后期涉及后端硬件不同、算子实现不同、对应软件版本不同等因素,精度对齐、性能对齐也都需要人力介入进行针对性适配。wCd即热新闻——关注每天科技社会生活新变化gihot.com

不过,也有行业人士向时代财经透露,由于DeepSeek本身开源,适配过程中并不需要授权,尽管目前众多平台都在适配该模型,但这种适配可能并非真正意义上的“接入”。“真正意义上的接入是DeepSeek利用某个智算中心提供云服务,但是目前真正和DeepSeek达成这种合作的厂商非常少,可能只有一两家。”wCd即热新闻——关注每天科技社会生活新变化gihot.com

wCd即热新闻——关注每天科技社会生活新变化gihot.com

部署和落地wCd即热新闻——关注每天科技社会生活新变化gihot.com

适配之外,更关键的是部署。wCd即热新闻——关注每天科技社会生活新变化gihot.com

近期,并行科技(839493.BJ)、壁仞科技、摩尔线程和昆仑芯科技等多家企业均向时代财经透露,他们正在忙于为客户做DeepSeek模型的部署。wCd即热新闻——关注每天科技社会生活新变化gihot.com

“部署是大模型转化为生产力的必要步骤。”中存算半导体董事长陈巍解释,部署相当于在用户的生产环境里进行模型的安装设置和做与客户成产环境的连接。wCd即热新闻——关注每天科技社会生活新变化gihot.com

时代财经在某国产算力运营商的产品交流群中观察到,不少用户在询问如何导入和设置API、如何集成相关服务,还有人咨询DeepSeek模型接入后为何运行速度较慢等。wCd即热新闻——关注每天科技社会生活新变化gihot.com

“行业确实正处于模型应用落地的关键阶段。”2月12日,摩尔线程相关技术负责人向时代财经表示。wCd即热新闻——关注每天科技社会生活新变化gihot.com

时代财经了解到,在近期行业密集适配DeepSeek系列模型后,不少厂商开始寻求落地应用,智算一体机这种硬件部署形式于是浮出了水面。wCd即热新闻——关注每天科技社会生活新变化gihot.com

摩尔线程表示,公司正与雪浪云联合打造了“软硬件紧耦合”大模型训推一体机——雪浪MindCenter X100,就已成功部署DeepSeek-R1-Distill-Qwen(适配1.5B、7B、14B、32B)推理服务。wCd即热新闻——关注每天科技社会生活新变化gihot.com

“一体机生意会是今年的大机会,离线需求太多了。”有业内人士感慨道。wCd即热新闻——关注每天科技社会生活新变化gihot.com

“前段时间大家都在适配,适配了之后呢?我们希望能够在一些领域能够实现真正的应用。”壁仞科技相关负责人告诉时代财经,壁仞科技联合中兴通讯、浙江大学上海高等研究院和一蓦科技推出了智海AI教育一体机。该产品实现了国产算力与DeepSeek的适配及知识课程、实训课题、智能体等教学工具的设计开发,并形成了包含AI通识课、专业课、实践实训在内的一体化解决方案。wCd即热新闻——关注每天科技社会生活新变化gihot.com

2月11日,中国电信(601728.SH)和中国移动(600941.SH)两大电信运营商也分别推出了天翼云和移动云智算一体机-DeepSeek版。wCd即热新闻——关注每天科技社会生活新变化gihot.com

据移动云官方消息,智算一体机简单来说就是基于移动云边缘智能小站算力底座打造的小型专属云,专门为企业量身定制。它复用了边缘智能小站的产品技术,还有统一运维、快速交付这些服务,解决了企业在 AI 应用落地时对数据安全的担忧,还能提高AI应用开发的效率。wCd即热新闻——关注每天科技社会生活新变化gihot.com

图源:移动云官方公众号wCd即热新闻——关注每天科技社会生活新变化gihot.com

此外,京东云、联想(0992.HK)、科华数据(002335.SZ)、浪潮云、中国长城(000066.SZ)、天融信(002212.SZ)等企业均官宣发布了DeepSeek智算一体机。wCd即热新闻——关注每天科技社会生活新变化gihot.com

wCd即热新闻——关注每天科技社会生活新变化gihot.com

行业或迎洗牌?wCd即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek火了,顺带捧红了国产算力,但也带出了一系列疑问。DeepSeek时代需要怎样的算力?DeepSeek又将如何改变如今算力市场的战局?wCd即热新闻——关注每天科技社会生活新变化gihot.com

此前,DeepSeek似乎已经出现算力吃紧的现象。2月6日,DeepSeek暂停API(接口)充值服务,DeepSeek官方解释为服务器资源紧张。2月9日,DeepSeek调整收费标准,每百万输入tokens的价格为0.5元(针对缓存命中情况)和2元(针对缓存未命中情况),而输出tokens的价格则定为每百万8元。在优惠期内,DeepSeek-V3对于输入tokens的收费是每百万0.1元(缓存命中)和1元(缓存未命中),输出tokens则是每百万2元。wCd即热新闻——关注每天科技社会生活新变化gihot.com

图源:图虫创意wCd即热新闻——关注每天科技社会生活新变化gihot.com

李爱军认为,在DeepSeek模型的性能足够强,而其未来很可能继续延续开源的策略的情况下,企业能够直接使用它进行应用落地,而非自己再重新训练出一个基础模型。由此,未来推理侧的算力需求将大规模爆发。wCd即热新闻——关注每天科技社会生活新变化gihot.com

他表示,在模型训练环节追求的是极致的性能,哪怕GPU价格非常高,企业也不吝购买。一旦到了推理环节,行业的关注点就会变成性价比,因为推理时时刻刻都要使用,GPU芯片在推理时代性价比不突出,专门针对推理场景设计的ASIC芯片会大有机会。wCd即热新闻——关注每天科技社会生活新变化gihot.com

“训练芯片和推理芯片在思路逻辑上有较大区别,训练芯片多选择兼容CUDA架构,走的是GPU架构,推理芯片如云天励飞等,多走的是神经网络处理架构。从训练芯片向推理芯片的转换,市场对芯片的要求、商业模式会有较大的变化。”李爱军推测,未来芯片行业可能将面临新一轮洗牌。wCd即热新闻——关注每天科技社会生活新变化gihot.com

摩尔线程相关技术负责人则认为,从训练侧来看,Scaling Law规模定律仍然有效,模型迭代会加快,对于国产优质训练算力的需求不会降低。长期看,模型参数规模扩大(如GPT-5)和训练方法革新(如MoE)仍会推动训练算力需求增长;从推理侧来看,随着生成式AI应用落地,落地应用(如AIGC、智能体、垂直行业模型)将带来海量碎片化推理需求,市场规模有可能超过训练。wCd即热新闻——关注每天科技社会生活新变化gihot.com

该技术负责人表示,短期内,国产GPU厂商应保持训练芯片的持续迭代,比如最好支持FP8,确保技术不脱节,同时通过推理芯片快速切入商业化场景。从长期上,瞄准“训推一体”架构,通过统一计算平台降低客户切换成本,最终在自主生态中实现训练与推理的协同增长。wCd即热新闻——关注每天科技社会生活新变化gihot.com

至于DeepSeek的冲击波能否影响到大洋彼岸的英伟达,陈巍表示,没有看到deepseek对英伟达的直接利空,但如果DeepSeek引发更大范围更严格的禁运,那么可能使得英伟达GPU销量减少。wCd即热新闻——关注每天科技社会生活新变化gihot.com

“事实上,每一代模型的进步,都意味着同等算力下模型精度更改。在以往模型的进步并未引起英伟达市值下跌。对于deepseek这类大模型,由于参数量巨大,需要更低的存力成本。降本增效是摆在各厂家面前的关键。”陈巍说道。wCd即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-524-0.htmlDeepSeek打响头炮!国产芯片开打辅助:卷适配、卷落地、卷性价比

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:节后6连板!浙数文化3度公告与DeepSeek无关联,仍遭机构爆炒

下一篇:京东0佣金强攻外卖,餐饮商家:会考虑进驻,但更关心后续流量扶持

为你推荐
  科技日报记者 宗诗涵  持续跳动的“心脏”、有代谢功能的“肝脏”、会呼吸的“肺”……在...
01-21
  近日,随着鞍山台安500兆瓦风电项目、锦州常兴300兆瓦风电项目全容量并网,我省最大发电企业——国家电...
02-05
  新华社西安2月16日电(记者杨一苗)近期,有网民在社交平台发帖,称在西安博物院参观时,有导游讲解中...
02-18
临近年关,广西贺州钟山县年味渐浓,百姓走上街头,买年货、添新衣。在县城以北的广西(钟山)东融电子信息产业园内,企业依然是一派热火朝天的生产景象。走进广西科奈信精密技术有限公...
01-22
[本站 资讯] 日前,比亚迪官方宣布,2025款汉家族OTA升级内测,本次升级包含5项新增功能和6项优化体验。值得一提的是,本次OTA升级,涉及不同款型配置,以实际收到的OTA推送内容...
01-24
1 月 26 日消息,日前特斯拉 Autopilot 高级软件工程师 Phil Duan 针对用户对特斯拉 FSD 技术的质疑作出回应,暗示公司在该领域取得了显著进展。一位长期持有特斯拉股...
01-27
  1、《难哄》何炅客串的是温以凡和桑延高中时的老师,何炅在剧中戴着眼镜出现,可谓是本色出演。  2、何炅客串的老师在预告中就出现过了,开学第一天,他还把温以凡认成了桑...
02-17
  1、《难哄》向朗在剧中没有官配,他是温以凡的发小好友,也是十分优秀又温柔强大的海归精英。  2、小说中向朗没有爱情线,他跟温以凡是纯粹的友情,对温以凡好是出于朋友之...
02-19
  近年来,公众对颈动脉斑块的关注度越来越高,有些患者甚至主动要求检查是否存在颈动脉斑块。 ...
02-07
21世纪经济报道记者 闫硕 北京报道“国际医疗部的费用真的有点夸张,但体验也真是好。”“国际医疗部的号源相对宽裕,提前1-3天约就可以了。...
02-07
  大众网记者 秦瑾 通讯员 吴悦 报道  12月19日,2024年度山东省数据要素发展大会暨可信数据空间建设启动会在山东大厦举行。齐鲁师范学院人工智能教育研究院研发的“...
01-21
1月22日,香港科技大学上海中心在徐汇滨江成立,港科大将与上海合作打造人才...
01-23
  8起违法违纪案件被通报,累计被罚超5800万,内控合规风险依然突出,营收净利双降的交通银行如何来...
01-24
  原标题:1月份信托产品发行规模超300亿,基础产业类及金融类非标信托产品热度提升  财联社2月...
02-11
狮子座男人通常自信、强势和有领导力,但是如果你想吸引他的注意并征服他的心,以下几招可...
01-22
在星座学中,每个星座都有其独特的性格特点和相处方式。而天蝎男作为十二星座中的一员,也...
01-22
优质男喜欢女生什么穿搭?一、优质男喜欢女生什么穿搭?喜欢穿有品味的衣服,合适自己身材的衣服,所以女生懂得搭配衣服真的很重要,因为女生如果懂得搭配的话,就可以把自己最美的一面...
02-12
会议正装男士穿搭? 40岁男士夏季穿搭商务休闲文化?一、会议正装男士穿搭?1.西服套装和西装套裙,一般搭配浅色、纯色或纯白色的衬衣,脚下穿简约款皮鞋,鞋子的颜色与服装匹配,不要过...
02-17
2月14日消息,苏宁易购与美的召开2025年度战略合作会议,加力投入以旧换新。锚定年度200亿战略目标,双方将深化联合创新、服务体验、终端运营等方面合作,上新超70款新品。抢滩春季...
02-15
2月15日消息,段永平在美国管理的一个投资账户“H&H International Investment”提交的最新数据显示,截至2024年四季度,段永平持有8只美股,持仓市值145.16亿美元,约合人民币1053亿...
02-16
新春将至,年末大扫除又来了。作为确保家居环境清洁与安全的清洁剂,哪些品牌曾被监管部门抽检出不合格?大家对家居清洁剂的了解有多少...
02-07
3月3日,美的发布了DeepSeek智能空调——美的鲜净感空气机T6,宣称“迈入空气思考时代”。据现场体验视频,当厨房TVOC超标时,系统会快速...
03-05
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
【#小米汽车登记智能屏界面设计作品著作权#】天眼查App显示,近日,小米汽车科技有限公司登记“智能屏界面设计”作品著作权,作品类别为类似摄制电影方法创作的作品。该公司成立...
02-09
《漫威蜘蛛侠2》Steam版现已推出第二个热修复补丁。 此热修复补丁——在《漫威蜘蛛侠2》于Valve平台收获“褒贬不一”评价之际发布——包含“多项崩溃修复与改...
02-04
《天国:拯救2》虽然有一些争议,但这并没有阻止游戏深受广大玩家的喜爱。该作首发24小时销量破百万,仅用了一天时间就收回了4100万美元的成本。 更能说明的是,《天...
02-10
中央气象台今早6点继续发布大风黄色预警和寒潮蓝色预警。大风黄色预警:预计今天8点到明天8点,华北、内蒙古中部、宁夏、陕西北部、黄淮等地的部分地区有5~6级、阵风7~8级的偏...
02-06
记者从国家医保局获悉,今年1月,有专家认为某些集采药品可能存在“血压不降、麻药不睡、泻药不泻”质量风险,有关部门派员调研了解情况。日前,参与调研的医保、药监部门接受了记...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮