DeepSeek何以创造了“行业奇迹” | 新京报专栏

2个月前 来源: 观看:21

▲坚持长期视角,专注底层创新,探索新的路径。图/DeepSeek界面截图
jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

一家此前不在多数媒体的“明星企业”列表中的“小企业”,一家走开源路线而非走闭源或率先开发应用的“创新组织”,却意外在2025年开年成为了中国大模型领域科技创新的全球代表。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

据多家媒体报道,这家名为DeepSeek(深度求索)的中国大模型企业,最近发布的大模型,在多项性能测试中已经达到了OpenAI的最新大模型o1水平,部分项目还实现了超越。由此引发了全球科技行业的热烈讨论,有媒体形容“DeepSeek朝硅谷‘开了一枪’”,甚至“震动美国科技界”。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

底层创新提升算力效率jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek当前所创造的“神话”,主要是两类叙事。第一类,是DeepSeek的算力成本投入与表现出来的性能对比,超出了行业的一般认知。据部分行业媒体报道,DeepSeek r1的训练成本仅为ChatGPT o1的零头。第二类神话则是,DeepSeek的成功证明了开源路线的逆袭胜利,对大公司、巨头的闭源路线进行了一次底层颠覆。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

这两类看法被灌注到社交平台上进行广泛讨论后,事实上都或多或少因人们的真诚期待而略有扭曲。例如,DeepSeek r1的真实算力成本投入远不止600万美元,且最早报道的媒体混淆了DeepSeek在论文中提及的训练成本。根据原文,550万美元是DeepSeek v3在正式训练阶段的成本,不包括前期研究、实验的成本。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

并且,从行业发展的逻辑看,探索与迭代、追赶所需的算力成本,也不应该放在一起对比。OpenAI在ChatGPT o1的研发探索,与v3在前序产品基础上的迭代,成本无法简单对比。创新和探索必然伴随着算力和各项成本的浪费,在确定性的路径上优化所付出的代价,与探索未知所付出的代价,互相之间不宜简单对比。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

而从大模型现阶段的发展看,准确地说,一家企业的阶段性产品的成功,还不能定义为闭源与开源路线的成败。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

综合以上,比较严谨地看待DeepSeek带给我们的惊喜,应该是:DeepSeek展示了模型架构底层创新的价值,不断提升了算力效率。并且,这一家架构的底层创新,推动了开源大模型产品在能力上的超越,从而将进一步提升行业整体的应用研发水平。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

更重要的仍是“创新”本身jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

尽管比起人们热爱的传奇故事,上面的这个故事显得有些过于审慎无聊。但事实上,这样一个严谨的故事,更值得我们去探讨本文开篇的两句话:为什么是一家资金量不占优势的、专注于底层创新而非商业化的开源企业,创造了中国企业在大模型领域的一次“弯道超车”?jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

2024年8月,在接受媒体专访时,DeepSeek创始人梁文锋提及了团队的研发思路,“如果目标是做应用,那沿用LLaMA模型(LLaMA,是元宇宙平台公司,即Meta公开发布的产品)短平快上产品也是合理的,但我们的目的地是AGI(通用人工智能),这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力”。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

这句话揭示了“奇迹”诞生的出发点:因为目标不同,所以方法不同,面对差距的态度也不同。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

就在DeepSeek创造“行业奇迹”不久前,国内大模型行业的共识几乎仍然是“要做应用”,因为做通用大模型的机会已经没有了。一些明星创业企业更是放弃了对通用AGI的探索,转而借助现有的模型去研发应用。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

在这种行业共识之下,我们所接触到的多数国产大模型企业,津津乐道的多数都是具体且仍不成熟的应用。如,多如牛毛的陪伴型AI聊天机器人,或是文生图、文生视频等“奇观展示”。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

这并非刻意贬低应用层的研发努力,面对差距做策略性的舍弃,是正常的科技与商业选择。就连梁文锋自己也在访谈中承认,在模型结构和训练动力学上,国内的最高水平比起国外最高水平可能有一倍的差距,与此同时,数据效率上国内比起海外可能也有一倍的差距,两者相加,相当于国内要用四倍的算力才能取得同样的效果。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

再加上复杂宏观环境下算力本身的成本差距。在这种现实下,多数企业选择了绕开这些差距,确实是一个直觉上可以理解的选项。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

但DeepSeek选择的方向却显得反直觉和常识。既然资源差距大,那就干脆回到模型架构底层去创新和优化。而事实证明,这条路最终反而能更快地达成目标。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

事实上,AGI的长期发展固然与算力成本息息相关,但AGI本身仍然处在不断迭代的过程之中。在科技创新之中,决定长期结果的固然是宏观环境、经济投入等底层基础,但在动态的创新发生过程中,更重要的或许仍旧是“创新”本身。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

大模型已经火热许久,但时至今日,仍然不是简单的资源加总游戏,不是简单地囤更多算力就能快速实现突破,也不是谁更早拥有更多用户,有更多商业化的场景和赚钱的能力,就能笑到最后。而这正是那些曾经风光无二但却迅速退潮的企业所没有想明白的基础逻辑。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

从这个更严谨的行业发展故事来看,DeepSeek的最大启发,是我们仍旧处在充满不确定性的创新探索周期里。而短视,恰恰是创新的最大敌人。坚持长期视角,专注底层创新,探索新的路径,比起融资、囤卡和商业化,更有可能获得最终的胜利。jwN即热新闻——关注每天科技社会生活新变化gihot.com


jwN即热新闻——关注每天科技社会生活新变化gihot.com

撰稿 / 王晓凯(媒体人)jwN即热新闻——关注每天科技社会生活新变化gihot.com

编辑 / 迟道华 马小龙jwN即热新闻——关注每天科技社会生活新变化gihot.com

校对 / 赵琳jwN即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-1125-0.htmlDeepSeek何以创造了“行业奇迹” | 新京报专栏

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:相信春天的力量 | 新京报春节社论

下一篇:“比手腕还粗”的网红烟花,还是别买了|新京报快评

为你推荐
新华社北京1月21日电(记者张辛欣、张晓洁)工业和信息化部副部长张云明在21日国新办举行的“中国经济高质量发展成效”系列新闻发布会上表示,我国已有570多家工业企业入围全球研...
01-22
  【隔夜重磅】  美财长将启动非常措施避免债务违约  据美国财政部网站消息,美国财政部长耶伦致信美国国会称,由于美国联邦政府即将触及债务上限,财政部将从1月21日起采...
01-21
1 月 27 日消息,1 月 26 日,赛力斯集团股份有限公司与北京航空航天大学战略合作框架协议签约仪式在重庆举行。根据协议,双方将在新兴产业领域的基础研究和产品开发的实...
01-27
1 月 29 日消息,据汽车研究机构 Rho Motion 预测,到 2025 年,全球电动汽车(EV)的销量将突破 2000 万辆,这标志着该行业又将迎来一年的增长。注意到,Rho Motion 几周前曾报...
01-29
最近,一部名叫《御饭团》的剧集由几位杰出的演员出演,播出后受到广泛关注,收视率和热度都很高。尤其是关于第98集的分集剧情介绍,在网上引发了热烈讨论。在第98...
02-20
  1、《难哄》温以凡在大伯家不仅要忍受大伯母的冷眼和挤兑,还差点被大伯母的弟弟侵犯了。  2、大伯母对温以凡并不好,经常对她说很多刻薄的话,温以凡只能察言观色,小心翼...
02-22
  广州日报讯(全媒体记者张青梅通讯员吴丽婷、魏星)七岁的小李正处于身心快速发展的关键时期...
01-21
21世纪经济报道记者 闫硕 北京报道脑机接口领域再传利好消息。2月10日,据阶梯医疗StairMed微信公众号,近日,阶梯医疗宣布完成3.5亿元人民币B...
02-13
近日,湖南大学材料科学与工程学院官网更新信息显示,高力波已任该学院院长,主持...
01-21
    温诗铸(1932—2023)  清华大学机械工程系教授,摩擦学专家,中国科学院院士。  1955年毕...
01-23
  本报记者 熊悦  金价持续攀高之际,已有商业银行下调黄金账户业务(即“积存金”,以下统称“积...
02-11
经济观察网 记者 胡群 在当前的转型和重塑关键时期,中国银行业面对低息差新常态和数字金融的快速发展,如何审慎评估和应对挑战与机遇?2023年,我国商业银行净利润增速放缓,平均资...
02-13
白羊座男生通常被认为是热情、冲动和直率的代表。他们对待感情非常认真,一旦爱上一个人...
01-22
白羊座的男生通常充满活力、热情和冲动,他们喜欢追求刺激和新鲜感。如果你想让一个白羊...
01-22
雨薇服饰有限公司:创造时尚与品质的完美结合在如今的时尚行业中,有许多品牌脱颖而出,但为什么我会特别关注雨薇服饰有限公司呢?这不仅因为它的设计独特,更因为它在服饰的每一个细...
02-12
邹开云:打破常规的模特之路,反串时尚引发关注在时尚界,常常会出现一些颠覆传统的现象,今天你是否听说过邹开云?他是一位反串模特,以非凡的才华和独特的风格走入了大众视野。通过反...
02-17
2月9日消息,阿里云百炼全面上线DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款模型,即日起所有用户可直接使用。DeepSeek-V3、DeepSeek-R1满血版可享各100万免...
02-09
2月15日消息,字节跳动日前举办新一期的All Hands全员会,字节CEO梁汝波、CFO高准、人力资源负责人华巍、电商业务负责人康泽宇、AI业务负责人朱文佳、TikTok CEO周受资与全体员...
02-15
算法透明化,骑手跑的明明白白。1、美团成立算法顾问委员会,保障骑手权益近几年,美团的骑手大军数量增势讯猛。美团研究院数据披露,2023年美团骑手已经攀升至745万人,比2022年多了...
02-08
新春佳节,许多爱美的小伙伴会去美甲店或是在家做个美甲,让指甲换上新装。然而,美甲行业受欢迎的背后,其隐藏的安全问题也不容忽视。近...
02-11
【#交银投资等在陕西成立航空航天股权基金# 出资额10亿】天眼查App显示,近日,陕西财金交汇航空航天新动能股权投资产业基金合伙企业(有限合伙)成立,执行事务合伙人为陕西空天宏远...
01-21
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
近日在四川内江资中,一名小孩往下水道投放鞭炮,瞬间引发剧烈爆炸。 据国内媒体报道称,四川资中县一男孩将鞭炮扔进下水道引发化粪池内沼气爆燃,事故现场多辆停放在...
02-02
Too Kyo Games工作室宣布,旗下新游《百日战纪-最终防卫学园-》PC体验版将于2月19日登场,存档可继承到正式版,Switch版的试玩稍后发布,敬请期待。 《百日战纪-最终...
02-13
央视网消息:商务部数据显示,2024年,中国服务贸易实现快速增长,全年服务进出口总额首次突破1万亿美元,规模创下历史新高,结构持续优化,展现出广阔的发展潜力。2024年,中国全年服务进...
02-04
2月9日,哈尔滨亚冬会短道速滑项目迎来了第二个金牌日的争夺。在男子5000米接力项目的决赛争夺中,由孙龙、林孝埈、刘少林、刘少昂组成的中国队遭遇韩国队阻挡犯规,最终遗憾无缘...
02-09
1月20日,国家能源局发布的“2024年全国油气勘探开发十大标志性成果”显示,2024年,国内油气产量当量首次超过4亿吨,连续8年保持千万吨级快速增长势头,“...
01-21
下一站,回家!无论是绿皮车的温暖情怀,还是高铁的高效快捷,回家的路,永远是最美的风景 下一站,回家!无论是绿皮车的温暖情怀,还...
01-21
  撒欢、尖叫、上厕所、要零食……高铁上,孩子一刻不停歇的场景很多人都体验过,让想安静休息的...
02-11
  乍暖还寒时节,在本钢板材冷轧总厂第三冷轧厂车间内,一场“无人化”的生产正在火热进行——无人天车在...
02-15
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮