DeepSeek何以创造了“行业奇迹” | 新京报专栏

1年前 来源: 观看:126

▲坚持长期视角,专注底层创新,探索新的路径。图/DeepSeek界面截图
DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

一家此前不在多数媒体的“明星企业”列表中的“小企业”,一家走开源路线而非走闭源或率先开发应用的“创新组织”,却意外在2025年开年成为了中国大模型领域科技创新的全球代表。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

据多家媒体报道,这家名为DeepSeek(深度求索)的中国大模型企业,最近发布的大模型,在多项性能测试中已经达到了OpenAI的最新大模型o1水平,部分项目还实现了超越。由此引发了全球科技行业的热烈讨论,有媒体形容“DeepSeek朝硅谷‘开了一枪’”,甚至“震动美国科技界”。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

底层创新提升算力效率DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek当前所创造的“神话”,主要是两类叙事。第一类,是DeepSeek的算力成本投入与表现出来的性能对比,超出了行业的一般认知。据部分行业媒体报道,DeepSeek r1的训练成本仅为ChatGPT o1的零头。第二类神话则是,DeepSeek的成功证明了开源路线的逆袭胜利,对大公司、巨头的闭源路线进行了一次底层颠覆。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

这两类看法被灌注到社交平台上进行广泛讨论后,事实上都或多或少因人们的真诚期待而略有扭曲。例如,DeepSeek r1的真实算力成本投入远不止600万美元,且最早报道的媒体混淆了DeepSeek在论文中提及的训练成本。根据原文,550万美元是DeepSeek v3在正式训练阶段的成本,不包括前期研究、实验的成本。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

并且,从行业发展的逻辑看,探索与迭代、追赶所需的算力成本,也不应该放在一起对比。OpenAI在ChatGPT o1的研发探索,与v3在前序产品基础上的迭代,成本无法简单对比。创新和探索必然伴随着算力和各项成本的浪费,在确定性的路径上优化所付出的代价,与探索未知所付出的代价,互相之间不宜简单对比。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

而从大模型现阶段的发展看,准确地说,一家企业的阶段性产品的成功,还不能定义为闭源与开源路线的成败。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

综合以上,比较严谨地看待DeepSeek带给我们的惊喜,应该是:DeepSeek展示了模型架构底层创新的价值,不断提升了算力效率。并且,这一家架构的底层创新,推动了开源大模型产品在能力上的超越,从而将进一步提升行业整体的应用研发水平。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

更重要的仍是“创新”本身DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

尽管比起人们热爱的传奇故事,上面的这个故事显得有些过于审慎无聊。但事实上,这样一个严谨的故事,更值得我们去探讨本文开篇的两句话:为什么是一家资金量不占优势的、专注于底层创新而非商业化的开源企业,创造了中国企业在大模型领域的一次“弯道超车”?DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

2024年8月,在接受媒体专访时,DeepSeek创始人梁文锋提及了团队的研发思路,“如果目标是做应用,那沿用LLaMA模型(LLaMA,是元宇宙平台公司,即Meta公开发布的产品)短平快上产品也是合理的,但我们的目的地是AGI(通用人工智能),这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力”。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

这句话揭示了“奇迹”诞生的出发点:因为目标不同,所以方法不同,面对差距的态度也不同。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

就在DeepSeek创造“行业奇迹”不久前,国内大模型行业的共识几乎仍然是“要做应用”,因为做通用大模型的机会已经没有了。一些明星创业企业更是放弃了对通用AGI的探索,转而借助现有的模型去研发应用。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

在这种行业共识之下,我们所接触到的多数国产大模型企业,津津乐道的多数都是具体且仍不成熟的应用。如,多如牛毛的陪伴型AI聊天机器人,或是文生图、文生视频等“奇观展示”。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

这并非刻意贬低应用层的研发努力,面对差距做策略性的舍弃,是正常的科技与商业选择。就连梁文锋自己也在访谈中承认,在模型结构和训练动力学上,国内的最高水平比起国外最高水平可能有一倍的差距,与此同时,数据效率上国内比起海外可能也有一倍的差距,两者相加,相当于国内要用四倍的算力才能取得同样的效果。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

再加上复杂宏观环境下算力本身的成本差距。在这种现实下,多数企业选择了绕开这些差距,确实是一个直觉上可以理解的选项。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

但DeepSeek选择的方向却显得反直觉和常识。既然资源差距大,那就干脆回到模型架构底层去创新和优化。而事实证明,这条路最终反而能更快地达成目标。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

事实上,AGI的长期发展固然与算力成本息息相关,但AGI本身仍然处在不断迭代的过程之中。在科技创新之中,决定长期结果的固然是宏观环境、经济投入等底层基础,但在动态的创新发生过程中,更重要的或许仍旧是“创新”本身。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

大模型已经火热许久,但时至今日,仍然不是简单的资源加总游戏,不是简单地囤更多算力就能快速实现突破,也不是谁更早拥有更多用户,有更多商业化的场景和赚钱的能力,就能笑到最后。而这正是那些曾经风光无二但却迅速退潮的企业所没有想明白的基础逻辑。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

从这个更严谨的行业发展故事来看,DeepSeek的最大启发,是我们仍旧处在充满不确定性的创新探索周期里。而短视,恰恰是创新的最大敌人。坚持长期视角,专注底层创新,探索新的路径,比起融资、囤卡和商业化,更有可能获得最终的胜利。DQ9即热新闻——关注每天科技社会生活新变化gihot.com


DQ9即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)DQ9即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 马小龙DQ9即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 赵琳DQ9即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-1125-0.htmlDeepSeek何以创造了“行业奇迹” | 新京报专栏

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:相信春天的力量 | 新京报春节社论

下一篇:“比手腕还粗”的网红烟花,还是别买了|新京报快评

为你推荐
春节临近,年味渐浓。每到除夕前几天,置办年货成了消费者日常生活中的“头等大事”。年货种类繁多,尤其是食品类年货更是多种多样,其中又以四川特产年货最受全国消费者欢迎。从麻...
01-22
新闻通讯员 木子春运承载着亿万游子对家乡的眷恋与期盼,春节的脚步近了,归心似箭的人们纷纷踏上返乡之路。据交通运输等部门预计,今年春运全社会跨区域人员流动量将达到90亿人...
01-22
1 月 22 日消息,据特斯拉官方微博,特斯拉现已在其Tesla App官方商城中上架椒盐瓶套组 / 蛇年双肩背包 / 高尔夫伞等配件,整理具体商品如下:特斯拉椒盐瓶套组定价:239元官...
01-23
2 月 3 日消息,特斯拉官网显示,特斯拉现已在美国上线推出针对FSD用户的保险优惠政策,车主在车辆激活FSD系统并保持90分以上安全驾驶评分的前提下,最高可获得 7 折-8 折...
02-04
  1、《掌心》礼宗旭是坏人,他是十恶不赦的大反派,表面上是大善人,私下里做尽龌龊勾当。  2、礼宗旭因童年目睹母亲被家暴的阴影,而养成了扭曲的心理,被他凌虐荼毒的无辜少...
02-15
最近正在热播的《陌上又花开》吸引了许多观众,不仅因为演员的颜值和演技,还有引人入胜的剧情。剧中关于偷酱牛肉的情节引起了广泛讨论。故事发生在一家名为陌...
02-22
21世纪经济报道记者 韩利明 上海报道当地时间2月12日,艾伯维(NYSE:ABBV)与Xilio Therapeutics(NASDAQ:XLO)宣布达成一项合作和选择性许可协议,双方...
02-14
  本报北京2月13日电(记者白剑峰)国家卫生健康委决定2025年在全国卫生健康系统组织实施一批为民服务实事项目,用心用情做好8件为民服务健康实事,让人民群众有更多的获得...
02-14
  我是莆田阅读推广的追梦人,揣着一份“让阅读滋养人们心灵、让教育生活因书而美好”的炽热梦...
01-21
  大众网记者 杨涛报道  近日,在第十六届山东省大学生科技节——山东省大学生消防安全技能大赛中,青岛港湾职业技术学院应急管理学院23级建筑消防技术与应急救援技术专...
01-21
春节临近,各地返乡客流与出游人群交织,北京、深圳等城市的地铁站里人潮涌动,成为人们出行的关键枢...
01-27
  四家上市险企业绩预增  股债共振推动利润预期改善  □记者 张小洁 北京报道  中国太...
02-05
双子座的男生聪明、机智,善于交际,对新鲜事物充满好奇。如果你想让他爱上你,就需要用一些...
01-22
白羊座男生通常充满活力、冲动和自信。他们喜欢追求刺激和挑战,对于新鲜事物充满好奇心...
01-22
露肩装里面穿什么内搭?一、露肩装里面穿什么内搭?一、抹胸  抹胸是很常见的,那些穿露肩露背的都会选择这种内衣,舒适,方便,有的抹胸款式还会在背部做一些没有特别的设计,比如好看...
02-07
揭晓那些令人惊艳的女明星,她们的魅力如何征服了观众说到女明星,很多人心中都会浮现出那些荧幕上的闪耀瞬间。她们不仅有着令人羡慕的外貌,更是集智慧与才华于一身。今天,我想和...
02-12
2月4日消息,满载着15吨临猗苹果的冷链运输车近日从山西省运城市临猗县北辛乡卓逸村万华果业基地出发前往青岛港,通过海运至澳大利亚。这是临猗县发展跨境电商业务以来,今年首单...
02-07
小米集团市值冲上万亿赛道自蛇年开工以来,小米股价一路飙升,小米集团市值冲上万亿赛道,仅仅上市7年小米就实现了万亿的跨越,作为创始人的雷军也迎来了高光时刻。具体来看,2025年2...
02-09
再创新高!据2025年综合运输春运工作专班数据显示,今年春节假期8天(1月28日至2月4日),全社会跨区域人员流动量超23亿人次。全社会跨区域...
02-11
2月23日消息,小马智行近日开通广州自动驾驶示范运营专线,用户可搭乘自动驾驶车,从广州市中心相应地点往返广州白云机场和广州南站。图源: Pony.ai小马智行公众号据了解,小马智行...
02-24
近来,交易领域的流行语不外乎是“技术”和“创新”。 虽然许多业内人士都在强调尖端解决方案,但本质上真正的进步是远非这些营销炒作所能比的。 名副其实的创新是能为交易者提...
01-21
近日,先进固态电池解决方案提供商恩力动力完成数亿人民币B轮融资,由清大海峡与金石投资共同领投,老股东大兴投资旗下基金跟投。本轮资金将用于固态电...
02-07
5070是英伟达新50系更具性价比的主流显卡,根据欧洲零售商Proshop的曝光,NVIDIA的中端显卡GeForce RTX 5070 Ti预计将在2月20日发布。 这也意味着RTX 5070 Ti首次...
01-24
近几年育碧的表现相当糟糕,几乎每款新作都以失败告终,比如《碧海黑帆》《星球大战:亡命之徒》《阿凡达:潘多拉边境》等,《不羁联盟》也被关服停运。最近育碧还解雇...
02-03
进入正题之前先来了解一下职场“萌新”眼中的湖北日报是啥样?下面就是今年湖北日报传媒集团的招聘公告来看看吧来源:湖北日报传媒集团人事部美术:鲁翩翩 段雨欣视频:陈玉萱 涂家...
02-05
今天下午,商务部召开例行新闻发布会,新闻发言人在会上表示,今年春节假期,消费市场总体实现平稳开局。后期来看,一季度消费市场总体将继续呈现平稳增长态势。根据商务部商务大数据...
02-06
近日,B站一名员工滥用权限,让某用户在使用哔哩哔哩弹幕网(俗称B站)网页端观看视频时,被错误提示“账号已被封禁”,引发广泛关注。1月21...
01-21
“车组即将到达检修库,各部门做好准备。”1月13日9时许,由香港西九龙返回的复兴号智能动卧列车临近检修区域,深圳动车运用所动车组机械师陈博文便接到...
01-24
  春节的脚步日益临近,丹东市花卉市场迎来了一年中的销售旺季,品质优良的各式花卉被摆放在最显眼的位置...
01-22
已经立春了,天气啥时候变暖?在冷空气的频繁打压下沈阳最低气温已连续多日低于-20℃明天就是春节假期结束第...
02-05
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮