DeepSeek何以创造了“行业奇迹” | 新京报专栏

11个月前 来源: 观看:113

▲坚持长期视角,专注底层创新,探索新的路径。图/DeepSeek界面截图
n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

一家此前不在多数媒体的“明星企业”列表中的“小企业”,一家走开源路线而非走闭源或率先开发应用的“创新组织”,却意外在2025年开年成为了中国大模型领域科技创新的全球代表。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

据多家媒体报道,这家名为DeepSeek(深度求索)的中国大模型企业,最近发布的大模型,在多项性能测试中已经达到了OpenAI的最新大模型o1水平,部分项目还实现了超越。由此引发了全球科技行业的热烈讨论,有媒体形容“DeepSeek朝硅谷‘开了一枪’”,甚至“震动美国科技界”。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

底层创新提升算力效率n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek当前所创造的“神话”,主要是两类叙事。第一类,是DeepSeek的算力成本投入与表现出来的性能对比,超出了行业的一般认知。据部分行业媒体报道,DeepSeek r1的训练成本仅为ChatGPT o1的零头。第二类神话则是,DeepSeek的成功证明了开源路线的逆袭胜利,对大公司、巨头的闭源路线进行了一次底层颠覆。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

这两类看法被灌注到社交平台上进行广泛讨论后,事实上都或多或少因人们的真诚期待而略有扭曲。例如,DeepSeek r1的真实算力成本投入远不止600万美元,且最早报道的媒体混淆了DeepSeek在论文中提及的训练成本。根据原文,550万美元是DeepSeek v3在正式训练阶段的成本,不包括前期研究、实验的成本。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

并且,从行业发展的逻辑看,探索与迭代、追赶所需的算力成本,也不应该放在一起对比。OpenAI在ChatGPT o1的研发探索,与v3在前序产品基础上的迭代,成本无法简单对比。创新和探索必然伴随着算力和各项成本的浪费,在确定性的路径上优化所付出的代价,与探索未知所付出的代价,互相之间不宜简单对比。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

而从大模型现阶段的发展看,准确地说,一家企业的阶段性产品的成功,还不能定义为闭源与开源路线的成败。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

综合以上,比较严谨地看待DeepSeek带给我们的惊喜,应该是:DeepSeek展示了模型架构底层创新的价值,不断提升了算力效率。并且,这一家架构的底层创新,推动了开源大模型产品在能力上的超越,从而将进一步提升行业整体的应用研发水平。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

更重要的仍是“创新”本身n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

尽管比起人们热爱的传奇故事,上面的这个故事显得有些过于审慎无聊。但事实上,这样一个严谨的故事,更值得我们去探讨本文开篇的两句话:为什么是一家资金量不占优势的、专注于底层创新而非商业化的开源企业,创造了中国企业在大模型领域的一次“弯道超车”?n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

2024年8月,在接受媒体专访时,DeepSeek创始人梁文锋提及了团队的研发思路,“如果目标是做应用,那沿用LLaMA模型(LLaMA,是元宇宙平台公司,即Meta公开发布的产品)短平快上产品也是合理的,但我们的目的地是AGI(通用人工智能),这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力”。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

这句话揭示了“奇迹”诞生的出发点:因为目标不同,所以方法不同,面对差距的态度也不同。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

就在DeepSeek创造“行业奇迹”不久前,国内大模型行业的共识几乎仍然是“要做应用”,因为做通用大模型的机会已经没有了。一些明星创业企业更是放弃了对通用AGI的探索,转而借助现有的模型去研发应用。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

在这种行业共识之下,我们所接触到的多数国产大模型企业,津津乐道的多数都是具体且仍不成熟的应用。如,多如牛毛的陪伴型AI聊天机器人,或是文生图、文生视频等“奇观展示”。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

这并非刻意贬低应用层的研发努力,面对差距做策略性的舍弃,是正常的科技与商业选择。就连梁文锋自己也在访谈中承认,在模型结构和训练动力学上,国内的最高水平比起国外最高水平可能有一倍的差距,与此同时,数据效率上国内比起海外可能也有一倍的差距,两者相加,相当于国内要用四倍的算力才能取得同样的效果。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

再加上复杂宏观环境下算力本身的成本差距。在这种现实下,多数企业选择了绕开这些差距,确实是一个直觉上可以理解的选项。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

但DeepSeek选择的方向却显得反直觉和常识。既然资源差距大,那就干脆回到模型架构底层去创新和优化。而事实证明,这条路最终反而能更快地达成目标。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

事实上,AGI的长期发展固然与算力成本息息相关,但AGI本身仍然处在不断迭代的过程之中。在科技创新之中,决定长期结果的固然是宏观环境、经济投入等底层基础,但在动态的创新发生过程中,更重要的或许仍旧是“创新”本身。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

大模型已经火热许久,但时至今日,仍然不是简单的资源加总游戏,不是简单地囤更多算力就能快速实现突破,也不是谁更早拥有更多用户,有更多商业化的场景和赚钱的能力,就能笑到最后。而这正是那些曾经风光无二但却迅速退潮的企业所没有想明白的基础逻辑。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

从这个更严谨的行业发展故事来看,DeepSeek的最大启发,是我们仍旧处在充满不确定性的创新探索周期里。而短视,恰恰是创新的最大敌人。坚持长期视角,专注底层创新,探索新的路径,比起融资、囤卡和商业化,更有可能获得最终的胜利。n2i即热新闻——关注每天科技社会生活新变化gihot.com


n2i即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)n2i即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 马小龙n2i即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 赵琳n2i即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-1125-0.htmlDeepSeek何以创造了“行业奇迹” | 新京报专栏

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:相信春天的力量 | 新京报春节社论

下一篇:“比手腕还粗”的网红烟花,还是别买了|新京报快评

为你推荐
  中新经纬1月17日电 题:外贸“三量”齐升下有哪些商机?  作者 张建平 商务部国际贸易经济合作研究院学术委员会副主任  2024年,我国外贸实现了总量、增量、质量的“三量...
01-21
  (新春走基层)山东企业生产忙 年货经济带动消费热潮  中新网济南1月17日电 (吕妍)进入腊月,年味渐浓,家家户户开始置办年货。山东各地企业订单不断,纷纷开足马力忙生产,保...
01-21
[本站 资讯] 1月18日,海通国际发布研究报告“预测小米可能会收购蔚来,并使蔚来的换电技术得到更广泛的应用,甚至可能在专利保护下开放给其他汽车制造商使用,还预测小米、...
01-21
1 月 23 日消息,雷丁汽车宣布旗下 2025 款雷丁芒果 Pro 微型车现已经上市,仅提供“220 基础版(实际续航 201 公里)”,指导价为 5.39 万元。该车整体小巧,造型方正,前脸配备...
01-24
《揽月抱遗珠之八零好日子》是近期热门的电视剧之一,吸引了大量观众。该剧在剧情和演员表现方面都取得了成功,成为一部佳作。这部剧于10:00上线,属于女频穿越...
02-22
随着电视剧的热播,《狂医魔徒》逐渐吸引了广大粉丝的关注。该剧播出后,凭借精彩的剧情、精良的制作和出色的表演,赢得了观众的一致好评,并迅速登顶收视榜首,成为...
02-22
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向今年的医保目录调整时间将提前1月17日,国家医...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局药审中心发布《地中海贫血基因治...
02-10
  大众网记者 杨涛报道  9月22日,2024金砖国家职业技能大赛增材制造赛项全国选拔赛暨国内总决赛传来消息,青岛港湾职业技术学院参赛学生冯洋(指导老师曾显波)获得一等奖,...
01-21
  大众网记者 杨涛报道  近日,2024年山东省“技能兴鲁”职业技能大赛暨第五届山东省汽车服务行业职业技能竞赛在青岛港湾职业技术学院成功举行。“技能兴鲁”职业技能...
01-21
  安徽农信系统反腐工作正在持续深入推进。2025年伊始,安徽省纪检监察网站通报了两起农信系统...
01-22
  即便是在周末前往新奥尔良观看超级碗的路上,也不耽误美国总统特朗普舞起新的关税大棒,对钢铁...
02-13
天蝎座的男生在感情中常常表现得非常专注和执着,一旦爱上一个人,很难忘记。因此,有时候我...
01-22
天秤座的男生一向以温和、善良而受人喜爱。然而,当他们陷入爱情并感到威胁时,他们也会展...
01-22
饰品创业计划书模板:轻松开启你的创业之旅在当今的市场环境中,饰品行业因其产品多样性和高利润率吸引了众多创业者的关注。如果你也想要在这个领域展开自己的创业冒险,撰写一份...
02-07
男生穿搭显高推荐? 男生怎么穿搭显瘦显高?一、男生穿搭显高推荐?九分裤是现在很流行的一款裤子,设计非常的时尚,而且很好搭配,最重要的是它能够很好的修饰身材比例,让腿看起来更长,...
02-17
1.拼多多加大对短剧领域的投入拼多多向短剧领域发起了春节攻势。据了解,拼多多近期更新并发布了两项针对短剧领域的新政策。一是“新版多多有好剧计划”,作为对旧版计划的升级...
02-07
2月9日消息,从年初五到开工第一周,天猫上开运工位装饰用品同比增长超50%,迎来正式开工的年轻职场人把办公桌变成了许愿池,乐高招财猫、故宫金桂盆景香氛、朱炳仁聚宝盆等“祈福...
02-09
2月10日消息,四川省发展改革委(省数据局)公布2024年度四川省数字化转型促进中心名单,共有18家申报单位获得批复认定,四川合纵药易购医药股份有限公司入选名单。这是四川省新修订...
02-11
2月16日消息,亚冬会近日在哈尔滨举行,吸引入境宾客在哈尔滨畅游畅买,也给文旅消费增添了新活力。支付宝数据显示,亚冬会期间(2月7日-14日),入境宾客用支付宝消费金额同比去年同期增...
02-17
1月20日晚,游族网络发布2024年年度业绩预告,报告显示,2024年度预计营收13.8-14.6亿元 。报告期内,游族网络持续深耕全球化游戏研发与发行,保持在营产品长线运营的基础上,积极推动...
01-21
近日,流程工业一体化方案解决商广东智子智能技术有限公司(以下称“智子智能”)完成近亿元融资,由达晨财智领投,苏创投·国发创投跟投。据了解,本轮融资...
02-07
弥助是《刺客信条:影》双主角之一,他违背了系列的一个重要传统——他不是刺客,也没有刺客通常拥有的能力,比如潜行或暗杀。 近日《刺客信条:影》副总监Simon Lemay...
01-27
《狙击精英》系列最新作《狙击精英:抵抗》已于1月30日正式发售,Steam国区定价168元,豪华版268元。截至目前,该作在Steam上仅收获了698个评价,好评率也不高,仅68%,为褒...
02-03
来自2025年综合运输春运工作专班数据显示,2025年2月4日(春运第22日,农历正月初七),全社会跨区域人员流动量预计34611万人次。其中,铁路客运量1690万人次,公路人员流动量32556万人次...
02-04
美国宾夕法尼亚大学工程与应用学院研究团队开发出一种新型基因编辑平台——“最小通用遗传扰动技术(mvGPT)”。这一平台集成了基因精确编...
01-24
据《光子能源杂志》最新发表的一项研究称,以色列内盖夫本-古里安大学科学家开发出一种将液晶和纳米多孔微粒相结合的新方法,从而创造出一种能同时控...
01-24
  “今年是我在双台镇过冬的第6年,准备住到5月份再回去。”1月16日一大早,59岁的张贺强就前往辽...
01-21
  从来,“年”都是有情的日子。  从“灯前小草写桃符”的除夕夜开始,到“花市灯如昼”的元宵...
02-14
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮