DeepSeek成功的底层逻辑及产业影响

1年前来源：新华网观看：162

仿佛是一夜之间，DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮，而且给全球的算力资本市场带来了重大冲击。究其原因，DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新，而且打破了AI领域许多的传统叙事逻辑。简而言之，DeepSeek正在改变游戏规则。

DeepSeek最新推理模型R1的横空出世，带来了一个非常大的惊喜，仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景，更增添了神秘色彩。那么，DeepSeek在技术上究竟有哪些创新，成功的背后有哪些深层次的原因？这一切将对中美下一个十年的科技竞争产生哪些影响？

工程创新

成就与众不同

DeepSeek不仅引发了全球新一轮的AI应用热潮，而且对全球的算力资本市场产生重大冲击。究其原因，DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。

成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多，包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化，在层级叠加效应下却产生了非常惊人的效果。

DeepSeek其实一共发布了两个模型，分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是，R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT（监督微调优化），从而产生了R1。R1的强化学习功能可以实现自动化，是比较容易去scale的。这样一来，该模型未来的想象空间接近无限。

颠覆性改变

打破传统叙事逻辑

DeepSeek之所以备受关注，本质在于打破了很多AI领域的传统叙事逻辑，例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……

首先，AI圈公认这种推理模型的实现难度是极大的。此前，比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来，Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替，甚至部分能力还要强于o1。进一步来看，R1不仅免费还开源，训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值，但DeepSeek-R1的出现以及开源的举措，让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1，击碎了华尔街对于所有大模型公司的估值逻辑。

其次，DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时，答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用，都第一时间进行了DeepSeek模型的部署，而且设置了推荐第一优先级。此外，Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变，同步影响了云服务的市场格局。国内大量从事应用开发的企业，在DeepSeek-R1出现之前不得不使用微软云（为了便捷使用GPT-4的API）；现在，使用阿里云上部署的Deep-Seek成为可选项。

再其次，DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层（例如PTX层），通过微调底层代码来优化性能，从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为，目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看，这一差距继续缩小的概率大于扩大的概率。

最后，开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源，应该是OpenAI最早的初心和使命。市场永远不会说谎，谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候，国际主流媒体主要关注其“成本低廉”；当Deep-Seek-R1发布时，情况则截然不同，因为“滔天的流量”来了。作为一个开源模型，DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”，免费且24小时随时在线。

工程创新

成就与众不同

颠覆性改变

打破传统叙事逻辑

点击展开全文

本文链接：http://www.gihot.com/news-2-674-0.htmlDeepSeek成功的底层逻辑及产业影响

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：中央网信办部署推进2025年信息化重点工作

下一篇：小心AI伴侣背后的“温柔陷阱”

为你推荐

β-胡萝卜素遏制口腔癌的作用机制揭示

多年来，大量临床经验显示，β-胡萝卜素可预防口腔癌前病变、抑制口腔癌发展。很多口腔科医生也会建议相关患者，多摄入β-胡萝卜素以减缓癌变进...

01-24

灵感源于人体蛋白质，人工电机可模仿“驱动生命”的自然机制

英国曼彻斯特大学和法国斯特拉斯堡大学组成研究团队共同创造了一种新的人工微型电机。它的设计灵感来源于人体内的蛋白质，通过模仿“驱动生命”的自...

01-24

注意！辽宁高速公路入口全部关闭

　　受降雪影响，截至1月27日6时33分，辽宁高速公路入口全部关闭，出口只有葫芦岛1个开通。　　（沈阳发布）...

01-27

文化潮起来消费旺起来

　　　　消费升腾跳动，城市脉搏跃动，新春的广州一片火热。　　刚过去的蛇年春节假期，广州各大商圈...

02-06

拍摄员工如厕并贴墙曝光，公司管理不能侵犯隐私 | 新京报快评

▲员工因躲在厕所里抽烟打游戏被公司行政人员拍照曝光，引发了舆论关注。图/网络视频截图员工蹲厕所被拍照，还贴公司墙上曝光？这事还真有。1月18日，有网友发帖爆料，深圳立讯电声科...

01-21

2025年湖南商务工作计划单出炉

会议现场红网时刻新闻1月21日讯（记者陈奥男刘志雄）今天，2025年全省商务工作会议暨扩消费工作推进会在长沙召开。记者从会上获悉，2025年湖南力争社会消费品零售总额增长5.5%...

01-22

瞄准投保难题！我国首个新能源车险指导意见出招

　　新能源车险投保难、投保贵问题将迎来“破局”。　　1月24日，金融监管总局等四部门联合发布《...

01-27

比亚迪 1 月销售新车超 30 万辆，乘用车同比增长 47.5%

2 月 2 日消息，比亚迪今日公布 1 月销售新车300538 辆，乘用车销售 296446 辆，同比增长 47.5%。其中，乘用车海外销售 66336 辆，同比增长 83.4%。此外，比亚迪新能源累销超 1...

02-03

《难哄》苏浩安是什么角色苏浩安第几篇出场？

《难哄》苏浩安是什么角色？苏浩安第几篇出场？苏浩安是男主桑延的好兄弟，与桑延从初中就相识，后来还考上了同一所高中，也是女主温以凡的朋友。他是一个富二代，有着...

02-19

《余烬之上》故事简介余烬之上在哪个台播出

《余烬之上》故事简介，余烬之上在哪个台播出？‌《余烬之上》主要讲述了主角廖思远在十年前的一场火灾中家破人亡，并因此催生出双重人格。十年后，他意外卷入一宗...

02-21

我国发现一起猴痘病毒Ib亚分支聚集性疫情，传染源为1位外籍人员

　　近日，我国发现一起猴痘病毒Ⅰb亚分支聚集性疫情，传染源为1位外籍人员，有刚果（金）旅居史。发现疫情后，国家及浙江、广东、北京、天津等省（市）迅速启动联防联控机制，开展流调...

01-21

“血压不降、麻药不睡、泻药不泻”？医保、药监回应

　　――医保、药监部门就集采药品问题答记者问　　本报记者孙秀艳　　今年1月，有专家认为某些集采药品可能存在“血压不降、麻药不睡、泻药不泻”质量风险，有关部门迅...

02-11

第三届全国职业技能大赛化学实验室技术赛项山东省选拔赛在山东化工技师学院圆满收官

　　大众网记者司心鹏报道　　12月24日至12月26日，第三届全国职业技能大赛化学实验室技术赛项山东省选拔赛在山东化工技师学院世界技能大赛化学实验室技术项目中国集训...

01-21

喜讯！沈阳工业大学获批首个辽宁省劳模创新工作室

日前，辽宁省总工会公布了《关于2024年辽宁省劳模创新工作室和职工创新工作室有关事项的通报》，沈阳工业大...

01-21

折价10%仍难出手，贵州花溪农商行4.77%股权三次流拍

　　1月21日上午10点，贵州亨特房地产开发有限公司（简称“亨特地产”）持有的贵州花溪农村商业银行股...

01-23

恒丰银行13个月被罚逾两千万元

　　近日，恒丰银行股份有限公司（简称“恒丰银行”）因8项违法行为被警告并罚款1060.68万元。《经济...

02-13

双鱼男试探女生的表现，双鱼对待自己喜欢的人

双鱼座的男生通常是非常敏感和浪漫的，他们对待自己喜欢的人也有着独特的方式。当双鱼男...

01-22

双鱼男不喜欢你的暗示，会有什么表现

在爱情中，我们常常会遇到一些困惑和疑问。特别是当我们对一个人产生了好感，却无法确定对...

01-22

162女适合什么风格穿搭？

162女适合什么风格穿搭？一、162女适合什么风格穿搭？白色T恤搭配条纹伞裙，红色蓬纱裙，打造文艺气质女神风格。白色T恤搭配灰色大衣在配个贝雷帽。短款羽绒服搭配破洞直筒裤，整体风...

02-07

穿搭化妆风格？菲律宾穿搭风格？

穿搭化妆风格？菲律宾穿搭风格？一、穿搭化妆风格？每个人的气质不同，在穿搭上有很多种风格，所以，妆容方面也是有很多风格的。那么，接下来我们一起来看看妆容有哪些风格吧！感兴趣的朋...

02-07

一亩田获2024全国农产品产销对接优秀助农奖

1月22日消息，全国农产品流通企业助农联合体第三次工作会议近日召开，一亩田荣获“2024优秀助农奖”。中国蔬菜流通协会会长戴中九介绍，助农联合体的企业都是国内农产品流通各个...

02-07

永辉超市试点24小时配送服务

2月13日消息，永辉超市的线上App永辉生活现在支持24小时配送了。图源：海峡都市报公众号对此，永辉生活相关工作人员表示，在深入开展市场调研并广泛收集用户反馈后，了解到不少居民在...

02-14

天猫养车与昱希汽车科技达成合作聚焦新能源汽车改装

2月15日消息，天猫养车近日与昱希汽车科技正式签署战略协议，双方将围绕新能源汽车改装领域展开深度合作，共同推动新能源汽后市场服务升级。根据协议，昱希汽车科技将为天猫养车 X ...

02-16

马蜂窝魅力小城报告：区县旅游出行人数同比增长76.4%

2月27日消息，中国旅游研究院（文化和旅游部数据中心）日前与马蜂窝联合召开“旅游目的地发展创新研究合作及成果发布会”，会上发布旅游目的地系列研究首份成果——《中国魅力小城...

03-01

浙大天才，震惊全球

2024年末，一位科技创业者火了。作者 | 王思琪来源 | 投资家（ID：touzijias）2024年末，一位科技创业者火了。2025年初，这位创业者再度爆火。近日，中国科技行业因一位85后年轻人现身《...

01-24

悦点科技完成数千万元天使轮投资

12月3日消息，悦点科技宣布公司完成数千万人民币的天使轮融资。此次融资由云启资本独家投资，本轮融资将主要用于悦点科技在企业级GenAI应用平台的进...

02-07

AI驱动的太空RPG《遥远行星建造师》Steam页面支持简繁体中文

今日（1月27日），AI驱动的太空RPG《遥远行星建造师》Steam页面，游戏支持简繁体中文，年内发售，感兴趣的玩家可以点击此处进入商店页面。游戏截图：《遥远行星建造师...

01-29

流媒体平台迪士尼+出现《漫威争锋》单独分区

根据 Culture Crave 报道，流媒体平台迪士尼+上出现了最近热门的团队英雄动作射击游戏《漫威争锋》的独立分区。该分区以“出现在《漫威争锋》的角色为特色”，...

02-11

外交部：中方不会要求企业或个人以违法的形式采集或存储数据

2月6日，外交部发言人郭嘉昆主持例行记者会。有记者提问，据报道，韩国的一些政府部门已经屏蔽对DeepSeek的访问，之前意大利、澳大利亚、印度、美国、日本等国家也传出禁止或限制使...

02-06

整治形式主义为基层减负中央层面通报3起典型问题

新华社北京2月9日电　日前，中央层面整治形式主义为基层减负专项工作机制办公室会同中央纪委办公厅对3起整治形式主义为基层减负典型问题进行通报。具体如下：1．中国就业培训技术...

02-09

全部导航

DeepSeek成功的底层逻辑及产业影响

五部门加强集中用餐单位食堂承包经营食品安全管理

世界气象组织：7月极端高温影响全球数亿人

因奖金纠纷，前夏普 CEO 戴正吴起诉富士康及其创始人郭台铭

去年我国油气产量当量首超4亿吨

vivo的2024：回归常识走出属于自己的路

研究揭秘人体如何应对高海拔环境

国内首个12兆瓦级陆上风电机组成功下线

2.71亿元！国美电器三日新增16条被执行人信息，昔日家电零售巨头资产负债率超148%，仍在自救