视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮

10个月前 来源: 观看:119

  视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮MDv即热新闻——关注每天科技社会生活新变化gihot.com

  2024年过去,AI又走过了狂奔的一年,大模型加速落地的热切、应用场景创新的火热和高投入、商业化缓慢带来的“下牌桌”焦虑同时处在这个行业。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  回过头看来,过往行业共识的一些问题在2024年中被打上了问号,例如智能算力还是否短缺、中国AI企业的“算力焦虑”是必要的吗?Scaling Law(规模法则)还值得信仰吗?MDv即热新闻——关注每天科技社会生活新变化gihot.com

  辞旧迎新之际,中国AI行业的“拐点”时刻更受关注。不再统一的答案背后,值得关注的是,对中国AI企业来说,一些好的变化正在发生,也有更多挑战等待2025年去回答。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  训练成本下降MDv即热新闻——关注每天科技社会生活新变化gihot.com

  2024年12月27日,海外社交媒体平台X被来自中国的大模型DeepSeek-V3刷屏,这一模型能力对标头部模型,但训练的预算却非常低,“2048个GPU、2个月、近600万美元”,相比之下,GPT-4o等模型的训练成本约为1亿美元,至少在万个GPU量级的计算集群上训练。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  这是一项展现了极致性价比的训练成本数据。在已开源的论文中,幻方量化旗下AI公司深度求索(DeepSeek)强调了DeepSeek-V3训练成本较低――通过对算法、框架和硬件的优化协同设计,在预训练阶段,模型每训练1万亿token仅需要18万个GPU小时,即在团队配备2048个H800 GPU的集群上只需3.7天,也就是说,团队的预训练在不到2个月的时间完成。加上后训练,DeepSeek-V3完整训练消耗了278.8万个GPU小时。假设H800 GPU的租用价格为每块GPU 2美元/小时,DeepSeek-V3的全部正式训练成本总计仅为557.6万美元。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  DeepSeek的成功并非个例,值得关注的是,在英伟达显卡等高端算力资源受限的情况下,2024年,许多中国AI企业正在找到降低训练成本的方法。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  极佳科技联合创始人兼首席科学家朱政向第一财经记者透露,过去一年,极佳科技训练大模型的成本也在大规模下降。朱政介绍,之前极佳科技训练一个视觉模型大概需要500万美金,基本上是一个语言模型的1/10,但现在他们已经把这个成本降到了100万美金以下。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  从训练成本的降低来看,朱政表示“方法有很多”,一方面,大模型公司正在关注与云厂商加强合作,通过做一些训练加速、通讯优化、设置优化等降低成本。同时,行业对数据优化也更为重视,之前行业用Scaling Law只是在对数据,但对完数据后并没有做非常多相应的优化,事实上数据优化带来的训练效率提升空间也很大。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  中国AI企业的“抢卡”焦虑也因此有所缓解,朱政表示,例如英伟达最新发布的显卡还是要买,得买最新的架构的显卡,但随着训练效率的提升,需要的规模会下降。他同时表示,来到100万美金以下,未来进一步下探大模型的训练成本将是一件更困难的事情,可能不是一家企业能搞定的事情,可能需要训练框架的支持、编程语言的支持包括显卡算式的支持。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  从全行业的角度来看,蚂蚁集团科技战略与执行部副总经理彭晋对第一财经记者表示,在采购先进算力有些困难的情况下,国内也在推进国产算力的替代,各大公司都在不断采购一些国产算力,从蚂蚁的实践来看,国产算力已经可以支撑很大规模,比如在千亿参数甚至以上规模的模型训练中国产算力是没有问题的。至于到下一步,例如说要建十万卡规模的集群,国产算力能否支撑有待进一步检验。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  “远虑”仍存,但走过2024年,中国企业的“算力焦虑”正在回归理性。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  未来趋势MDv即热新闻——关注每天科技社会生活新变化gihot.com

  2025年,中国AI行业会有哪些变化?MDv即热新闻——关注每天科技社会生活新变化gihot.com

  北京智源人工智能研究院在《2025十大AI技术趋势》报告中指出,从基础设施到产品应用,Scaling Law、基础模型、具身智能、超级应用、AI安全等AI发展的关键方向都可能在2025年迎来新的变化。MDv即热新闻——关注每天科技社会生活新变化gihot.com

MDv即热新闻——关注每天科技社会生活新变化gihot.com

  报告认为,AI4S驱动科学研究范式变革;具身智能领域具身大小脑和本体的协同进化;统一的多模态大模型实现更高效AI;Scaling Law扩展向RL + LLMs,模型泛化从预训练向后训练、推理迁移;世界模型加速发布,有望成为多模态大模型的下一阶段;合成数据成为大模型迭代与应用落地的重要催化剂;推理优化迭代加速,成为AI Native应用落地的必要条件;Agentic AI成为产品落地的重要模式;AI应用将迎来Super APP以及AI安全治理体系的持续完善将成为2025年AI技术发展的十大趋势。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  不少中国自研的技术和产品让业内看到了这些趋势的到来。2024年9月,蚂蚁发布了支小宝、蚂小财等系列AI管家产品,探索更多服务类智能体形态,2024年10月,智源研究院发布了完全自研的基于自回归技术的原生多模态世界模型Emu3,实现了视频、图像、文本三种模态的统一理解和生成,2024年年底,豆包月活跃用户数达到了7116万,成为国内第一、全球第二的AI原生应用。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  智能研究院行业研究组负责人倪贤豪提到,走过2024年全年来看,与2023年相比,国内AI整体的应用热度已明显升温,相比2023年第一季度,他所在的团队调研到,2024年第四季度,整个基础模型的垂直产业链以及其他赛道AI应用的成熟度已有了明显提升,例如AI在3D内容、AI硬件等场景的应用以及医疗文献处理等未来场景的探索中,都有了明显拓展。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  从国内大模型公开中标项目的类型分布来看,2024年10月,大模型应用类项目数量首次超过了算力类项目,应用类大模型招标项目占比已达到56%,国产大模型在垂直行业实现了加速落地,或是在诸多中大型企业扮演中台性质的基础设施。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  AI应用领域的Super APP能否在2025年出现同样受到业内关注。从C端的用户规模、交互频次、停留时长等维度来看,目前,国产AI应用尚未出现爆发式增长,倪贤豪表示,随着大模型推理成本的下降,包括开发工具的适配、框架的创新以及应用安全、决策的可解释性、鲁棒性等问题的解决,未来,推动Agent解决复杂问题的能力提升将变得更有可能也更关键。他认为,从用户视角切入,以需求反推技术或许能撬动AI应用的用户存量和增量市场,Super APP在2025年的诞生值得期待。MDv即热新闻——关注每天科技社会生活新变化gihot.com

  “当前,我们处在人工智能发展的新拐点,大模型的能力涌现加速通用人工智能时代的到来,原生统一多模态、具身智能、AI for Science,将进一步深化人工智能对世界的感知、理解与推理,连接数字世界与物理世界,驱动科学研究创新突破。”智源研究院院长王仲远表示。MDv即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-4-443-0.html视觉模型训练成本一年下降80%,中国AI厂商“掀起”全球算力降价潮

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:将于本月内生效!泰国颁布紧急法令打击电信网络诈骗

下一篇:失去始祖鸟代理权 三夫户外自救

为你推荐
  编者按:年关将近,在外打拼一年的你,返乡的心情是否雀跃不已?家中的亲人,想必也是如此。今年回家,你给家人准备了什么礼物?他们会有怎样的期待?海报新闻记者在北京、上海、济...
01-22
  中新经纬1月20日电 文化和旅游部官方微信号20日发布春节假期出游提示称,选择有经营资质的旅行社,不前往未开发开放、缺乏安全保障的区域。  2025年春节假期即将来临,文化...
01-21
1 月 22 日消息,奇瑞星途汽车营销中心总经理黄招根在微博透露,奇瑞星途星纪元ES 增程版已向首批内测车主交付,计划 3 月初上市。作为参考,当前在售的 2025 款星纪元ES ...
01-23
1 月 26 日消息,多年来,除了对续航里程、充电速度和基础设施的担忧之外,选择不购买电动汽车的消费者常常将电动汽车的高价作为一个主要因素。然而最新研究显示,电动汽车...
01-27
《香草的每天》近期正在热播,播出后反响良好,网上热度持续上升,在各大论坛上也引发了热烈讨论。观众们尤其关注第19集的剧情。在这一集中,作为点心教室最后的学...
02-20
随着《相棒 第23季》的播出热度不断攀升,它有望成为近期最值得一看的作品,并成为大众话题的中心。最近讨论最多的是第17集的剧情。在这一集中,一具尸体在搬运...
02-21
  本报北京1月5日电(中青报・中青网记者 刘昶荣)“目前是儿童呼吸道感染的高发期,病原(体)还是以病毒和肺炎支原体为主,病毒主要以流感病毒为主。”在国家卫生健康委今天...
01-21
21世纪经济报道记者武瑛港 实习生张烁 北京报道小红书上又多出来了一批“难民”,不过这次是医美“难民”——近日北京塑研医疗美容诊所疑似...
01-25
2名个人、14项成果获中国科学院杰出科技成就奖 1月16日,中国科学院颁...
01-21
  大众网记者 司心鹏 报道  4月1日,华为ICT大赛2023—2024全国总决赛成绩公布,山东商业职业技术学院云计算技术与应用产业学院学生团队获得昇腾AI赛道国赛二等奖2项,计...
01-21
  本报记者 冷翠华  记者近日从业内获得的独家数据显示,2024年,新能源商业车险保费收入约1177...
01-21
  原标题:2024年12月信托发行数量、规模创全年新高?非标信托主导季节性冲规模 标品信托回归债券...
01-22
狮子座的男生通常自信、热情和有领导力,因此要打动他们的心并不容易。然而,只要你掌握了...
01-22
射手座的男生通常是开朗、乐观、自由奔放的,他们对待感情也是如此。然而,当他们真正爱上...
01-22
揭示女明星穿衣风格的秘密:如何借鉴她们的时尚灵感当我们翻看杂志或者社交媒体时,常常会被一位位女明星的穿衣风格所吸引。她们的时尚选择不仅体现了个人魅力,更在无形中影响了...
02-17
ysl官网怎么退? ysl有中国官网吗?ysl官网怎么退?ysl官网你可以申请退款,然后联系下客服,就说想要退,他们会给你一个地址,然后你寄过去就可以了,他们会把钱通过原路返给你的。其实退...
02-17
马云回国,首站闲鱼。元宵节前一天,马云突然现身阿里巴巴西溪园区,首先来到了闲鱼办公区,向闲鱼的年轻员工们送上新年问候。期间,马云表示:闲鱼应用AI技术的重点,在于服务年轻用户体...
02-14
2月19日消息,小红书电商日前正式启动运营服务商招募,通过运营服务商的专业化能力和经验,为商家提供账号定位、内容打造、直播操盘、店铺运营、投流推广、货盘供应等服务,加速潜...
02-20
2月10日消息,美团外卖发布《年轻人春节送礼报告(2025)》,2025年春节期间,美团平台上“春节送礼”搜索量同比增速达165%,外卖餐饮礼券赠送量环比节前增长120%。其中95后消费者占比...
02-11
2月20日消息,高德地图近日联合国家信息中心大数据发展部、清华大学土木水利学院、同济大学智能交通运输系统(ITS)研究中心、未来交通与城市计算联合实验室等机构共同发布《2024...
02-21
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
“宁王”的港股IPO,终于要落地了。12月26日晚,宁德时代发布公告称,为进一步推进公司全球化战略布局,打造国际化资本运作平台,提高综合竞争力,公司拟发行...
02-07
前几天,经典科幻作品《攻壳机动队》官方突然发布倒计时,今天谜底揭晓,官方将举行系列全部动画作品展,届时还会包括2026年的全新作品等等,敬请期待后续详细消息。 ...
02-05
快科技2月5日消息,今天,华为董事长梁华透露了过去1年公司的成绩,还是相当不错的。 华为董事长梁华在广东省高质量发展大会上透露,2024年华为整体经营达到预期,全年...
02-06
今天(2月3日)上午第九届亚洲冬季运动会火炬传递仪式在黑龙江哈尔滨启动火炬传递时间为1天传递总路线长约11公里火炬传递起点定在哈尔滨市道外区中华巴洛克街区这里是哈尔滨城...
02-03
2月5日傍晚,小米创始人雷军在社交媒体上发文:这是金的。转发的视频里有人介绍,小米SU7 Ultra车标变成了碳纤维+金色,兄弟们这个如何?来源:当事人社交账号今日上午,雷军又连发多条微...
02-06
一个由多国科学家组成的国际团队在开发高能效计算机方面取得重磅成果:用于超快计算的新型磁光存储器。这是一种创新的光子平台,不仅开关速度比当前最...
01-21
央视网消息:近日,中央社会工作部等8部门联合出台措施,指导加强快递员、网约配送员服务管理,推动构建和谐劳动关系,切实维护各方合法权益。措施提出,推进...
01-21
  中新社太原1月16日电(记者胡健)“晋祠·唐刻华严石经陈列馆”16日在山西太原晋祠博物馆开馆...
01-22
  春晚的开场视觉秀《迎福》中,李子柒化身“蝴蝶仙子”,以一袭长裙惊艳全场。这条长裙凝结了十...
02-05
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮