视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮

8个月前 来源: 观看:104

  视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮L9M即热新闻——关注每天科技社会生活新变化gihot.com

  2024年过去,AI又走过了狂奔的一年,大模型加速落地的热切、应用场景创新的火热和高投入、商业化缓慢带来的“下牌桌”焦虑同时处在这个行业。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  回过头看来,过往行业共识的一些问题在2024年中被打上了问号,例如智能算力还是否短缺、中国AI企业的“算力焦虑”是必要的吗?Scaling Law(规模法则)还值得信仰吗?L9M即热新闻——关注每天科技社会生活新变化gihot.com

  辞旧迎新之际,中国AI行业的“拐点”时刻更受关注。不再统一的答案背后,值得关注的是,对中国AI企业来说,一些好的变化正在发生,也有更多挑战等待2025年去回答。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  训练成本下降L9M即热新闻——关注每天科技社会生活新变化gihot.com

  2024年12月27日,海外社交媒体平台X被来自中国的大模型DeepSeek-V3刷屏,这一模型能力对标头部模型,但训练的预算却非常低,“2048个GPU、2个月、近600万美元”,相比之下,GPT-4o等模型的训练成本约为1亿美元,至少在万个GPU量级的计算集群上训练。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  这是一项展现了极致性价比的训练成本数据。在已开源的论文中,幻方量化旗下AI公司深度求索(DeepSeek)强调了DeepSeek-V3训练成本较低――通过对算法、框架和硬件的优化协同设计,在预训练阶段,模型每训练1万亿token仅需要18万个GPU小时,即在团队配备2048个H800 GPU的集群上只需3.7天,也就是说,团队的预训练在不到2个月的时间完成。加上后训练,DeepSeek-V3完整训练消耗了278.8万个GPU小时。假设H800 GPU的租用价格为每块GPU 2美元/小时,DeepSeek-V3的全部正式训练成本总计仅为557.6万美元。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  DeepSeek的成功并非个例,值得关注的是,在英伟达显卡等高端算力资源受限的情况下,2024年,许多中国AI企业正在找到降低训练成本的方法。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  极佳科技联合创始人兼首席科学家朱政向第一财经记者透露,过去一年,极佳科技训练大模型的成本也在大规模下降。朱政介绍,之前极佳科技训练一个视觉模型大概需要500万美金,基本上是一个语言模型的1/10,但现在他们已经把这个成本降到了100万美金以下。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  从训练成本的降低来看,朱政表示“方法有很多”,一方面,大模型公司正在关注与云厂商加强合作,通过做一些训练加速、通讯优化、设置优化等降低成本。同时,行业对数据优化也更为重视,之前行业用Scaling Law只是在对数据,但对完数据后并没有做非常多相应的优化,事实上数据优化带来的训练效率提升空间也很大。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  中国AI企业的“抢卡”焦虑也因此有所缓解,朱政表示,例如英伟达最新发布的显卡还是要买,得买最新的架构的显卡,但随着训练效率的提升,需要的规模会下降。他同时表示,来到100万美金以下,未来进一步下探大模型的训练成本将是一件更困难的事情,可能不是一家企业能搞定的事情,可能需要训练框架的支持、编程语言的支持包括显卡算式的支持。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  从全行业的角度来看,蚂蚁集团科技战略与执行部副总经理彭晋对第一财经记者表示,在采购先进算力有些困难的情况下,国内也在推进国产算力的替代,各大公司都在不断采购一些国产算力,从蚂蚁的实践来看,国产算力已经可以支撑很大规模,比如在千亿参数甚至以上规模的模型训练中国产算力是没有问题的。至于到下一步,例如说要建十万卡规模的集群,国产算力能否支撑有待进一步检验。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  “远虑”仍存,但走过2024年,中国企业的“算力焦虑”正在回归理性。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  未来趋势L9M即热新闻——关注每天科技社会生活新变化gihot.com

  2025年,中国AI行业会有哪些变化?L9M即热新闻——关注每天科技社会生活新变化gihot.com

  北京智源人工智能研究院在《2025十大AI技术趋势》报告中指出,从基础设施到产品应用,Scaling Law、基础模型、具身智能、超级应用、AI安全等AI发展的关键方向都可能在2025年迎来新的变化。L9M即热新闻——关注每天科技社会生活新变化gihot.com

L9M即热新闻——关注每天科技社会生活新变化gihot.com

  报告认为,AI4S驱动科学研究范式变革;具身智能领域具身大小脑和本体的协同进化;统一的多模态大模型实现更高效AI;Scaling Law扩展向RL + LLMs,模型泛化从预训练向后训练、推理迁移;世界模型加速发布,有望成为多模态大模型的下一阶段;合成数据成为大模型迭代与应用落地的重要催化剂;推理优化迭代加速,成为AI Native应用落地的必要条件;Agentic AI成为产品落地的重要模式;AI应用将迎来Super APP以及AI安全治理体系的持续完善将成为2025年AI技术发展的十大趋势。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  不少中国自研的技术和产品让业内看到了这些趋势的到来。2024年9月,蚂蚁发布了支小宝、蚂小财等系列AI管家产品,探索更多服务类智能体形态,2024年10月,智源研究院发布了完全自研的基于自回归技术的原生多模态世界模型Emu3,实现了视频、图像、文本三种模态的统一理解和生成,2024年年底,豆包月活跃用户数达到了7116万,成为国内第一、全球第二的AI原生应用。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  智能研究院行业研究组负责人倪贤豪提到,走过2024年全年来看,与2023年相比,国内AI整体的应用热度已明显升温,相比2023年第一季度,他所在的团队调研到,2024年第四季度,整个基础模型的垂直产业链以及其他赛道AI应用的成熟度已有了明显提升,例如AI在3D内容、AI硬件等场景的应用以及医疗文献处理等未来场景的探索中,都有了明显拓展。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  从国内大模型公开中标项目的类型分布来看,2024年10月,大模型应用类项目数量首次超过了算力类项目,应用类大模型招标项目占比已达到56%,国产大模型在垂直行业实现了加速落地,或是在诸多中大型企业扮演中台性质的基础设施。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  AI应用领域的Super APP能否在2025年出现同样受到业内关注。从C端的用户规模、交互频次、停留时长等维度来看,目前,国产AI应用尚未出现爆发式增长,倪贤豪表示,随着大模型推理成本的下降,包括开发工具的适配、框架的创新以及应用安全、决策的可解释性、鲁棒性等问题的解决,未来,推动Agent解决复杂问题的能力提升将变得更有可能也更关键。他认为,从用户视角切入,以需求反推技术或许能撬动AI应用的用户存量和增量市场,Super APP在2025年的诞生值得期待。L9M即热新闻——关注每天科技社会生活新变化gihot.com

  “当前,我们处在人工智能发展的新拐点,大模型的能力涌现加速通用人工智能时代的到来,原生统一多模态、具身智能、AI for Science,将进一步深化人工智能对世界的感知、理解与推理,连接数字世界与物理世界,驱动科学研究创新突破。”智源研究院院长王仲远表示。L9M即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-443-0.html视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:将于本月内生效!泰国颁布紧急法令打击电信网络诈骗

下一篇:失去始祖鸟代理权 三夫户外自救

为你推荐
福建即将迎来一所新院校。 近日,据教育部网站消息,拟同意设置北京科技职业大学、淄博职业技术大学、酒泉职业技术大学等14所学校。...
01-21
  中新经纬1月20日电 国家发改委网站20日消息,国家发展改革委、国家数据局近日发布《关于建立公共数据资源授权运营价格形成机制的通知》(下称通知)。  通知明确定价范围...
01-21
2 月 5 日消息,今日丰田汽车公司宣布了一系列重大举措,一方面,丰田与上海市政府达成合作意向,将在上海金山区独资设立雷克萨斯纯电动汽车及电池的研发和生产公司;另一方...
02-05
  近日,各大车企发布2025年1月销量数据。传统车企中,比亚迪、吉利等增长强劲;新势力车企排名变化...
02-06
  1、《难哄》桑延在小说中是在第63章知道真相,他知道温以凡当初改志愿拒绝自己的真正原因了。  2、知道真相的那一刻,桑延十分懊悔又心痛,他自责为什么当初没能察觉到温...
02-20
电视剧《余烬之上》中已死的角色有很多,以下是一些主要角色:廖知白:在剧中为了揭露真相、报仇雪恨,历经艰难险阻,最后和戚美华同归于尽。莱拉:为给闺蜜彩娜报仇,按...
02-21
  从国家卫生健康委获悉,2024年我国居民健康素养水平达到31.87%,比2023年提高2.17个百分点,保持较快增幅。  健康素养是指个人获取和理解基本健康信息和服务,并运用这...
01-21
21世纪经济报道记者 唐唯珂 广州报道Deepseek持续搅动全球AI格局重塑之下,应用产业端连锁反应也在深入。在医疗端应用展开的讨论同样热闹。...
02-08
贵大新闻网讯(图文/徐恩宇)1月15日,为落实贵州省委省政府关于省外高水平大学...
01-21
  大众网记者 秦瑾 通讯员 张建东 报道  近日,由山东省教育厅主办、曲阜师范大学承办的山东省第五届高校体育教师基本功大赛圆满落幕。齐鲁师范学院体育学院教师们以...
01-21
   当地时间1月24日(周五),美股三大指数收跌,道指跌0.32%,标普500指数跌0.29%,纳指跌0.5%。美国1月...
01-27
  原标题:1月份信托产品发行规模超300亿,基础产业类及金融类非标信托产品热度提升  财联社2月...
02-11
在星座学中,每个星座都有其独特的性格特点和相处方式。而天蝎男作为十二星座中的一员,也...
01-22
射手座男人是热情洋溢、乐观开朗的人,他们喜欢自由自在的生活方式。对于他们寻找一个能...
01-22
北方模特学校:揭秘T台走秀背后的精彩与挑战走在T台上,灯光璀璨、聚光灯下的一瞬间,模特们如同闪耀的星星。这种华丽的场景,对于许多追逐梦想的年轻人来说,是无比向往的。然而,作为...
02-07
邹开云:打破常规的模特之路,反串时尚引发关注在时尚界,常常会出现一些颠覆传统的现象,今天你是否听说过邹开云?他是一位反串模特,以非凡的才华和独特的风格走入了大众视野。通过反...
02-17
2月15日消息,年宵花销售热潮刚过,春节后的鲜花市场又迎来消费高峰。在盒马各大门店,2月热门的玫瑰花以及各种时令鲜花早早陈列到位,桃花、樱花、玉兰等鲜切枝含苞待放。延续了春...
02-15
与其被动防守,不如主动出击。近年来,随着各行业竞争日趋白热化,内卷现象不断加剧。面对生存压力,互联网巨头们在巩固核心业务的同时,愈发迫切地需要拓展多元化布局。这一战略转...
02-18
2月22日消息,第十四届公益节暨2024ESG影响力年会奖项评选结果近日正式公布,享道出行申报的“请帮我回家”项目摘得“2024年度公益项目奖”。“请帮我回家”是享道出行聚焦儿童...
02-23
3月5日消息,据晚点LatePost消息,美团CEO王兴近日召开了总监级别以上的内部沟通会,美团最高决策层S-team的每一位成员都有发言。此次是美团的15周年,除了核心本地商业,王兴提出在...
03-05
2024国庆长假第一天,北京奥林匹克公园人头攒动,往来如织的人群中一道道“奇装异服”的身影吸引了游客注目,银发雪衣的雪女,斗笠披风的侠客,长尾兽耳的萌娘,子衿青青的儒生……原来...
01-23
近日,宿迁时代储能科技有限公司(简称“宿迁时代储能”)完成A+轮数亿元融资。本轮融资由北京绿色能源基金领投,昌平能源智造基金、南京邦盛资本、北京...
02-07
今日(1月26日),女性向视觉小说《Thesis of Love 心动论证》Steam页面开放,2026年发售,游戏支持简体中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 在千...
01-28
随着动漫游戏额不断发展,声优行业也越来越壮大,日前日本专业声优杂志发布“声优名鉴2025 女性篇”,记载现役声优人数已经达到了1099人。 ·要知道该名鉴在2001年...
02-12
据央视新闻报道,当地时间2月1日,美国联邦选举委员会年底的备案文件显示,埃隆·马斯克在2024年美国大选中的花费超过了2.9亿美元。马斯克 资料图(来源:环球网)文件表明,马斯克在年末...
02-02
极目新闻记者 张扬实习生 许诺2月2日大年初五,湖北省黄冈市黄州区的安国禅寺前的广场热闹非凡。遛鸟的大爷提着竹笼在花坛边切磋鸟鸣,举着相机的游客围着青云塔转圈找角度,穿汉...
02-02
美国加州大学旧金山分校团队发现,小鼠体内存在一种分子计时器,在怀孕最初几天就会被激活,并影响小鼠的分娩时间。如果相同的一组分子在人类妊娠中所起...
01-22
美国国家标准与技术研究院(NIST)与瑞典查尔姆斯理工大学合作,开发出一种新型“量子冰箱”,可高效重置量子比特,并利用“冰箱”组件间的热流作为动力源,保...
01-24
  自26日开始,辽宁省大部分地区普降大雪到暴雪。受此次降雪影响,27日到29日,全省大部地区将降温8至12摄...
01-28
  “跟着电影游中国”活动2月17日在京启动。活动旨在抓住春节档电影全球热映契机,利用当前过境...
02-18
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮