DeepSeek成功的底层逻辑及产业影响

1年前 来源:新华网 观看:128

仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?fiW即热新闻——关注每天科技社会生活新变化gihot.com

工程创新fiW即热新闻——关注每天科技社会生活新变化gihot.com

成就与众不同fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。fiW即热新闻——关注每天科技社会生活新变化gihot.com

成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。fiW即热新闻——关注每天科技社会生活新变化gihot.com

颠覆性改变fiW即热新闻——关注每天科技社会生活新变化gihot.com

打破传统叙事逻辑fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……fiW即热新闻——关注每天科技社会生活新变化gihot.com

首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。fiW即热新闻——关注每天科技社会生活新变化gihot.com

其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。fiW即热新闻——关注每天科技社会生活新变化gihot.com

再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。fiW即热新闻——关注每天科技社会生活新变化gihot.com

最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。fiW即热新闻——关注每天科技社会生活新变化gihot.com

仿佛是一夜之间,DeepSeek迎来了“滔天的流量”。它不仅在全球引发了新一轮的AI应用热潮,而且给全球的算力资本市场带来了重大冲击。究其原因,DeepSeek不仅在训练成本及使用成本、模型训练及优化方式等领域实现了大量的工程创新,而且打破了AI领域许多的传统叙事逻辑。简而言之,DeepSeek正在改变游戏规则。fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最新推理模型R1的横空出世,带来了一个非常大的惊喜,仅用6天就发展了1亿用户。“用好奇心来揭开AGI的神秘面纱”这一愿景,更增添了神秘色彩。那么,DeepSeek在技术上究竟有哪些创新,成功的背后有哪些深层次的原因?这一切将对中美下一个十年的科技竞争产生哪些影响?fiW即热新闻——关注每天科技社会生活新变化gihot.com

工程创新fiW即热新闻——关注每天科技社会生活新变化gihot.com

成就与众不同fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek不仅引发了全球新一轮的AI应用热潮,而且对全球的算力资本市场产生重大冲击。究其原因,DeepSeek在训练成本及使用成本、模型训练及优化方式方面均实现了大量工程创新。fiW即热新闻——关注每天科技社会生活新变化gihot.com

成本是最大的亮点。DeepSeek-R1的整体训练成本比OpenAI少了一个数量级以上。R1在整个训练过程中的工程优化和创新亮点非常多,包括“Multi-Head Latent Attention——多头隐形注意力机制”“Multi-token predication——多token预测”“有选择性地使用8个浮点数精度FP8来替代FP16甚至FP31”等。这些优化其实都不容易实现。每一个看似不显著的优化,在层级叠加效应下却产生了非常惊人的效果。fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek其实一共发布了两个模型,分别是R1和R1-zero。DeepSeek基于V3这个基础模型聚焦强化学习获得了R1-zero。但是,R1-zero在回答一些问题的时候容易产生包括“多语言混杂”在内的诸多问题。Deep-Seek又对这个模型进行了SFT(监督微调优化),从而产生了R1。R1的强化学习功能可以实现自动化,是比较容易去scale的。这样一来,该模型未来的想象空间接近无限。fiW即热新闻——关注每天科技社会生活新变化gihot.com

颠覆性改变fiW即热新闻——关注每天科技社会生活新变化gihot.com

打破传统叙事逻辑fiW即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek之所以备受关注,本质在于打破了很多AI领域的传统叙事逻辑,例如OpenAI对于推理模型的算力堆叠霸权逻辑、AI应用圈的OpenAI寡头垄断格局逻辑、美国对中国的高制程芯片封锁逻辑以及AI大模型的开源闭源逻辑……fiW即热新闻——关注每天科技社会生活新变化gihot.com

首先,AI圈公认这种推理模型的实现难度是极大的。此前,比较好的推理模型只有OpenAI的GPT o1。Anthropic做不出来,Google“卡”了很久才推出表现一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力还要强于o1。进一步来看,R1不仅免费还开源,训练成本和使用成本均实现了指数级下降。原先o1凭借领先性可以“收割”相当长一段时间的价值,但DeepSeek-R1的出现以及开源的举措,让绝大多数开发者以及聚焦应用的创业公司都能够以更低的门槛去做开发。更加便宜且更容易私有化部署的R1,击碎了华尔街对于所有大模型公司的估值逻辑。fiW即热新闻——关注每天科技社会生活新变化gihot.com

其次,DeepSeek的出现打破了AI应用圈原有的竞争枷锁。就算是美国的顶尖应用公司选择DeepSeek和ChatGPT时,答案也很清楚。Cursor、Perplexity这些AI领域的超级明星应用,都第一时间进行了DeepSeek模型的部署,而且设置了推荐第一优先级。此外,Google、Amazon、NV等平台也都部署了Deep-Seek模型。这些改变,同步影响了云服务的市场格局。国内大量从事应用开发的企业,在DeepSeek-R1出现之前不得不使用微软云(为了便捷使用GPT-4的API);现在,使用阿里云上部署的Deep-Seek成为可选项。fiW即热新闻——关注每天科技社会生活新变化gihot.com

再其次,DeepSeek带来了芯片封锁逻辑的崩塌。DeepSeek在辉达CUDA生态的更底层(例如PTX层),通过微调底层代码来优化性能,从而解决“连接通信能力和调度能力被阉割”的问题。专家普遍认为,目前中美AI大模型领域的技术差距约为4个月。从技术能力发展的趋势来看,这一差距继续缩小的概率大于扩大的概率。fiW即热新闻——关注每天科技社会生活新变化gihot.com

最后,开源让DeepSeek在舆论战中至少“不落下风”。在AGI的道路上做出最强大的模型并开源,应该是OpenAI最早的初心和使命。市场永远不会说谎,谁的模型能力强谁就能掌握最终的话语权。2024年12月DeepSeek V3发布的时候,国际主流媒体主要关注其“成本低廉”;当Deep-Seek-R1发布时,情况则截然不同,因为“滔天的流量”来了。作为一个开源模型,DeepSeek让所有用户在任何领域都增加了一个“顶尖专家”,免费且24小时随时在线。fiW即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-674-0.htmlDeepSeek成功的底层逻辑及产业影响

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:中央网信办部署推进2025年信息化重点工作

下一篇:小心AI伴侣背后的“温柔陷阱”

为你推荐
被誉为“AI六小虎”之一北京智谱华章科技有限公司(以下简称智谱)被拉入实体清单了。当地时间1月15日,美国商务部工业和安全局(BIS)修订...
01-21
美国加州大学伯克利分校和韩国高丽大学科学家携手,从变色龙身上获得灵感,研制出一种新型电磁材料。这种材料能够模仿变色龙的变色机制,按需在吸收、传...
01-24
  蛇年新春进入倒计时,年轻人的时尚消费热情也被浓郁的“年味”燃起。记者留意到,2025年伊始,新...
01-24
针对即将到来的寒潮大风天气为保障海上人命安全1月24日天津海事局、辽宁海事局河北海事局、山东海事局...
01-27
泰国旅游安全信心下降之际,从旅游业内到社媒大众都在推测:三亚旅游将迎“泼天富贵”。 喧嚣背后,近期三亚旅游热度究竟如何?时代周报...
01-21
  中新经纬1月21日电 “中国品牌大事记”是品牌联盟发展研究中心的常规研究项目。自2008年1月起,品牌联盟开始对当月发生的中国品牌大事进行观察、梳理和总结,并于下月初发...
01-21
  2024年已经尘埃落定,各大汽车制造商竞相揭晓年度销量成绩单,但多数报告倾向于报喜不报忧。在...
01-24
开年见喜,吉利银河E5推出新春大礼包,立享至高价值1.5万元,包含新春保险大礼、新春保养大礼、新春贴膜大礼、新春焕新大礼,四重好礼惠及消费者,一站式福利待领取,省钱又省心。凡2月...
02-05
  1、《难哄》何炅客串的是温以凡和桑延高中时的老师,何炅在剧中戴着眼镜出现,可谓是本色出演。  2、何炅客串的老师在预告中就出现过了,开学第一天,他还把温以凡认成了桑...
02-17
《180天重启计划》播出后受到了观众的喜爱和追捧。剧中第5集的剧情引起了广泛讨论,以下是该集的主要内容。吴俪梅叫醒顾云苏,让她好好打扮去见一个重要的人。...
02-21
  11月18日至24日是世界卫生组织确定的“提高抗微生物药物认识周”。当前,抗生素使用情况如何?“新华视点”记者走访多地进行调查...
01-21
作者:衣晓蕾 上海市第六人民医院超声医学科公益科普支持:广东省二十一世纪教育基金会 “医生,我最近喉咙疼,还发热,是不是甲流啊?我好害怕啊!”“...
02-07
日前,辽宁省总工会公布了《关于2024年辽宁省劳模创新工作室和职工创新工作室有关事项的通报》,沈阳工业大...
01-21
上海市科学学研究所研究员李辉为华东师范大学应用伦理专业研究生授课。受访者供图“只有完善多学科协同...
01-22
  中国网财经1月15日讯 持牌消金进入纵深发展阶段后,在重塑业务模式的过程中,消费金融公司们既...
01-22
  1月13日,四川日报刊登《中国长城资产管理股份有限公司四川省分公司与四川天府银行股份有限公...
01-22
射手座的男生通常是开朗、乐观、热情的,他们喜欢自由和冒险,对于感情也是如此。如果你想...
01-22
狮子座男生通常都是阳光、自信、热情洋溢的,当他们喜欢上一个人时,会展现出一系列特殊的...
01-22
男士礼物排行榜?1,欧莱雅男士专用洗面奶欧莱雅男士专用洗面奶,这个算是男生日常必备了吧,便宜又好用,深受广大男同胞的喜欢。深度清洁,改善痘痘肌肤还是不错的。使用过后能感觉皮...
02-12
男士衬衫搭配什么颜色的外套好看有图?首先推荐同时容易上身又好打理的单色衬衫一般有,牛津纺衬衫,青年布衬衫和牛仔衬衫。这三种面料够厚实不会软塌塌,单穿外搭都可以。最简单的...
02-17
阿里AI,蓄势待发。阿里巴巴再添AI猛将2025开年,阿里巴巴迎来一位AI牛人。据界面新闻,全球顶尖人工智能科学家许主洪(Steven Hoi)正式加入阿里巴巴,出任阿里集团副总裁,负责AI To C...
02-07
张一鸣:“做不好的就别做了,要做就必须做到非常好。”1.抖音电商跃居行业第三2024年,电商市场步入存量时代,竞争愈发白热化。那么,经过一整年的激烈厮杀,电商平台们的表现如何呢?据...
02-18
2月8日消息,据Tech星球消息,美团近期启动个人摄影师招募计划,现阶段招募的是人像摄影师,服务类型包含婚恋类、宴会类和景点跟拍类等,摄影师向平台交付2000元押金后,无需营业执照,即...
02-09
全国两会期间,全国人大代表、飞鹤乳业董事长冷友斌最关注的领域是“国人精准营养、定制化营养”。 预计到2035年,我国60岁以上人口...
03-09
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
快科技2月1日消息,毫无疑问DeepSeek的出现,让美国科技巨头们感到了恐慌,毕竟低算力需求下也能带来如此强大的AI大模型。 对于一些诋毁DeepSeek的声音,周鸿祎认为,美...
02-02
近日,PlayStation Network(PSN)遭遇严重宕机,至今已超过24小时未恢复正常服务,导致全球玩家无法访问在线内容,甚至连单人数字游戏也受到影响。这一事件迅速在社交媒...
02-10
△以色列外交部长萨尔(资料图)以色列外交部长萨尔5日说,以色列将不参加联合国人权理事会。萨尔当天在社交媒体上说,以色列欢迎美国总统特朗普关于美国退出联合国人权理事会的决...
02-06
2月9日,哈尔滨亚冬会速度滑冰男子5000米决赛,中国队包揽金银铜牌。吴宇夺得金牌,刘瀚彬获得银牌,哈那哈提·木哈买提获得铜牌。...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮