视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮

5个月前 来源: 观看:70

  视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮oSL即热新闻——关注每天科技社会生活新变化gihot.com

  2024年过去,AI又走过了狂奔的一年,大模型加速落地的热切、应用场景创新的火热和高投入、商业化缓慢带来的“下牌桌”焦虑同时处在这个行业。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  回过头看来,过往行业共识的一些问题在2024年中被打上了问号,例如智能算力还是否短缺、中国AI企业的“算力焦虑”是必要的吗?Scaling Law(规模法则)还值得信仰吗?oSL即热新闻——关注每天科技社会生活新变化gihot.com

  辞旧迎新之际,中国AI行业的“拐点”时刻更受关注。不再统一的答案背后,值得关注的是,对中国AI企业来说,一些好的变化正在发生,也有更多挑战等待2025年去回答。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  训练成本下降oSL即热新闻——关注每天科技社会生活新变化gihot.com

  2024年12月27日,海外社交媒体平台X被来自中国的大模型DeepSeek-V3刷屏,这一模型能力对标头部模型,但训练的预算却非常低,“2048个GPU、2个月、近600万美元”,相比之下,GPT-4o等模型的训练成本约为1亿美元,至少在万个GPU量级的计算集群上训练。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  这是一项展现了极致性价比的训练成本数据。在已开源的论文中,幻方量化旗下AI公司深度求索(DeepSeek)强调了DeepSeek-V3训练成本较低――通过对算法、框架和硬件的优化协同设计,在预训练阶段,模型每训练1万亿token仅需要18万个GPU小时,即在团队配备2048个H800 GPU的集群上只需3.7天,也就是说,团队的预训练在不到2个月的时间完成。加上后训练,DeepSeek-V3完整训练消耗了278.8万个GPU小时。假设H800 GPU的租用价格为每块GPU 2美元/小时,DeepSeek-V3的全部正式训练成本总计仅为557.6万美元。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  DeepSeek的成功并非个例,值得关注的是,在英伟达显卡等高端算力资源受限的情况下,2024年,许多中国AI企业正在找到降低训练成本的方法。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  极佳科技联合创始人兼首席科学家朱政向第一财经记者透露,过去一年,极佳科技训练大模型的成本也在大规模下降。朱政介绍,之前极佳科技训练一个视觉模型大概需要500万美金,基本上是一个语言模型的1/10,但现在他们已经把这个成本降到了100万美金以下。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  从训练成本的降低来看,朱政表示“方法有很多”,一方面,大模型公司正在关注与云厂商加强合作,通过做一些训练加速、通讯优化、设置优化等降低成本。同时,行业对数据优化也更为重视,之前行业用Scaling Law只是在对数据,但对完数据后并没有做非常多相应的优化,事实上数据优化带来的训练效率提升空间也很大。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  中国AI企业的“抢卡”焦虑也因此有所缓解,朱政表示,例如英伟达最新发布的显卡还是要买,得买最新的架构的显卡,但随着训练效率的提升,需要的规模会下降。他同时表示,来到100万美金以下,未来进一步下探大模型的训练成本将是一件更困难的事情,可能不是一家企业能搞定的事情,可能需要训练框架的支持、编程语言的支持包括显卡算式的支持。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  从全行业的角度来看,蚂蚁集团科技战略与执行部副总经理彭晋对第一财经记者表示,在采购先进算力有些困难的情况下,国内也在推进国产算力的替代,各大公司都在不断采购一些国产算力,从蚂蚁的实践来看,国产算力已经可以支撑很大规模,比如在千亿参数甚至以上规模的模型训练中国产算力是没有问题的。至于到下一步,例如说要建十万卡规模的集群,国产算力能否支撑有待进一步检验。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  “远虑”仍存,但走过2024年,中国企业的“算力焦虑”正在回归理性。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  未来趋势oSL即热新闻——关注每天科技社会生活新变化gihot.com

  2025年,中国AI行业会有哪些变化?oSL即热新闻——关注每天科技社会生活新变化gihot.com

  北京智源人工智能研究院在《2025十大AI技术趋势》报告中指出,从基础设施到产品应用,Scaling Law、基础模型、具身智能、超级应用、AI安全等AI发展的关键方向都可能在2025年迎来新的变化。oSL即热新闻——关注每天科技社会生活新变化gihot.com

oSL即热新闻——关注每天科技社会生活新变化gihot.com

  报告认为,AI4S驱动科学研究范式变革;具身智能领域具身大小脑和本体的协同进化;统一的多模态大模型实现更高效AI;Scaling Law扩展向RL + LLMs,模型泛化从预训练向后训练、推理迁移;世界模型加速发布,有望成为多模态大模型的下一阶段;合成数据成为大模型迭代与应用落地的重要催化剂;推理优化迭代加速,成为AI Native应用落地的必要条件;Agentic AI成为产品落地的重要模式;AI应用将迎来Super APP以及AI安全治理体系的持续完善将成为2025年AI技术发展的十大趋势。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  不少中国自研的技术和产品让业内看到了这些趋势的到来。2024年9月,蚂蚁发布了支小宝、蚂小财等系列AI管家产品,探索更多服务类智能体形态,2024年10月,智源研究院发布了完全自研的基于自回归技术的原生多模态世界模型Emu3,实现了视频、图像、文本三种模态的统一理解和生成,2024年年底,豆包月活跃用户数达到了7116万,成为国内第一、全球第二的AI原生应用。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  智能研究院行业研究组负责人倪贤豪提到,走过2024年全年来看,与2023年相比,国内AI整体的应用热度已明显升温,相比2023年第一季度,他所在的团队调研到,2024年第四季度,整个基础模型的垂直产业链以及其他赛道AI应用的成熟度已有了明显提升,例如AI在3D内容、AI硬件等场景的应用以及医疗文献处理等未来场景的探索中,都有了明显拓展。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  从国内大模型公开中标项目的类型分布来看,2024年10月,大模型应用类项目数量首次超过了算力类项目,应用类大模型招标项目占比已达到56%,国产大模型在垂直行业实现了加速落地,或是在诸多中大型企业扮演中台性质的基础设施。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  AI应用领域的Super APP能否在2025年出现同样受到业内关注。从C端的用户规模、交互频次、停留时长等维度来看,目前,国产AI应用尚未出现爆发式增长,倪贤豪表示,随着大模型推理成本的下降,包括开发工具的适配、框架的创新以及应用安全、决策的可解释性、鲁棒性等问题的解决,未来,推动Agent解决复杂问题的能力提升将变得更有可能也更关键。他认为,从用户视角切入,以需求反推技术或许能撬动AI应用的用户存量和增量市场,Super APP在2025年的诞生值得期待。oSL即热新闻——关注每天科技社会生活新变化gihot.com

  “当前,我们处在人工智能发展的新拐点,大模型的能力涌现加速通用人工智能时代的到来,原生统一多模态、具身智能、AI for Science,将进一步深化人工智能对世界的感知、理解与推理,连接数字世界与物理世界,驱动科学研究创新突破。”智源研究院院长王仲远表示。oSL即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-443-0.html视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:将于本月内生效!泰国颁布紧急法令打击电信网络诈骗

下一篇:失去始祖鸟代理权 三夫户外自救

为你推荐
福建即将迎来一所新院校。 近日,据教育部网站消息,拟同意设置北京科技职业大学、淄博职业技术大学、酒泉职业技术大学等14所学校。...
01-21
  中新经纬1月16日电 商务部流通发展司司长李佳路表示,手机等3类数码产品的补贴为购新补贴,不是以旧换新,不以“交旧”为前提。  16日,商务部召开手机等数码产品购新补贴组...
01-21
1 月 23 日消息,阿维塔 06 的实车图在网上曝光,这款定位中型车的新车预计将在今年第二季度正式上市。从曝光的照片来看,阿维塔 06 提供了多种大胆的配色方案,包括紫色、...
01-24
[本站 资讯] 近日,小鹏汽车正式推送了AI天玑XOS 5.5.0版本,该版本的新功能,包含图灵AI智驾、智能泊车与出库、AI充电等实用功能。图灵AI智驾车位到车位(先锋版):双击拨杆可...
01-24
《揽月抱遗珠之八零好日子》是近期热门的电视剧之一,吸引了大量观众。该剧在剧情和演员表现方面都取得了成功,成为一部佳作。这部剧于10:00上线,属于女频穿越...
02-22
近日,龚俊工作室在社交媒体上对外公布了其名誉维权案件的最新动态,引发广泛关注。据工作室透露,截至目前,共有17例名誉维权案件已成功结案,这意味着龚俊及其团队在维护自身合法权...
02-22
据国家卫生健康委消息,1月22日,国家卫生健康委办公厅、国家中医药局综合司发布流行性感冒诊疗方案(2025年版)。国家卫生健康委表示,为进一步提...
01-23
21世纪经济报道记者 韩利明 上海报道2024年,对于中国生物医药企业而言,似乎尚未走出“资本寒冬”。医药魔方数据显示,中国医疗健康领域一级市...
02-06
1月22日,沈阳战狼特训营国防教育基地2025年寒假战狼军事冬令营的22名小学生们一起来到抗美援朝老兵李维...
01-23
  大众网记者 王一刚 报道  冬日风雅,大雪知寒。一年岁暮风雪始,寒冬用最纯洁的底色酝酿世间最精彩的颂歌。  一、童言话大雪  孩子们对即将到来的“大雪”节气充...
01-21
  消费是经济增长的重要引擎,也与百姓日常生活息息相关。近段时间以来,金融业紧跟政策导向,瞄准...
01-22
  近日,河北武强农商银行因关联交易管理不到位,违规办理承接贷款等违法违规行为收百万罚单,5名相...
01-23
在一段感情中,了解对方的内心世界是非常重要的。而通过一些必问问题,可以考验男朋友在你...
01-22
天蝎座的男生通常都有着强烈的个人魅力和吸引力,因此很容易吸引到一些暗恋他们的女生。...
01-22
怎样免费加盟淘宝代理男装?怎样免费加盟淘宝代理男装?免费的,,,其实是最昂贵的。。。。这个道理和我们现实中一样。。。。。。很抱歉,回答者上传的附件已失效服装加盟店排行榜品牌...
02-12
韩雪服饰品牌? 2020新款双面羊绒排扣韩版,怎么洗?韩雪服饰品牌?是百适乐品牌,这款产品是全球运动休闲品牌隶属荣威国际控股有限公司,致力于研发、生产、销售高品质和创新的运动休...
02-17
2月14日消息,拼多多站内的多多国际正全面招募海淘商家入驻,针对生活或来往境外有便利条件的境内个人,开放海淘个人店入驻。拼多多方面强调,全球购个人店机制简单,入驻流程简单,资...
02-15
2月14日消息,苏宁易购与美的召开2025年度战略合作会议,加力投入以旧换新。锚定年度200亿战略目标,双方将深化联合创新、服务体验、终端运营等方面合作,上新超70款新品。抢滩春季...
02-15
2月14日消息,今年情人节适逢星期五,同程旅行数据显示,2月14日,国内酒店预订迎来春节假期过后的首个峰值,情侣房、影音房等特色房型产品的预订热度环比均出现10%以上的增长。同程...
02-15
国际金价在即将触及3000美元/盎司的关键心理关口时,突然遭遇重压,转而大幅下跌,跌至最近三周以来的最低点。 国内市场方面,沪金期货连...
03-04
在全球化的大背景下,中国品牌凭借自身实力与创新能力,在国际舞台上愈发耀眼。近日,来自拉丁美洲的一则消息引起了行业广泛关注:远大智能工业集团博林特电梯,成功中标哥伦比亚麦德...
02-09
随着特斯拉人形机器人Optimus量产计划临近,以及国内智元机器人、宇树机器人等大放异彩,全球科技界对这一领域的关注度持续升温。在此背景下,国内资本市场对人形机器人概念的...
02-09
改编自韩国条漫《我独自升级》的同名动画,目前正在热播第二季内容,以“爽文”风格为核心的本作在播出后受到了许多观众的喜爱,其第二季目前已获得了众多好评。 ...
01-24
最近我第一次亲眼看到了 Steam Deck,才意识到这款掌上电脑实际上有多大。当初我已经觉得 PS Vita 的体积和重量不方便携带,SteamDeck对于随时随地有玩游戏来说可...
01-29
你的浏览器不支持video标签。极目新闻记者 张屏 视频剪辑 李仪2月5日,10位“楚才”人形机器人在武汉洪山礼堂组团亮相,为湖北省“新春第一会”上演科技序曲。其中,华中科技大学...
02-05
极目新闻记者 付瞰2月8日,是大S与具俊晔登记结婚3周年纪念日,具俊晔当日一早在个人社交账号发文,虽然只有令人心酸的“永远,我爱你”几个字,却让网友再次痛心大S的骤然离开。据中...
02-08
  1月7日,国家区块链技术创新中心介绍,长安链支撑自然资源部逐步形成覆盖全国、跨层级、跨系统...
01-21
SQL Error: select * from ***_ecms_news2 where id in(,170) limit 2
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮