“技术升级+一站构建”助大模型降本增效

1年前 来源:科技日报 观看:237

如何在算力紧缺的背景下提升大模型训练和推理的效率,并降低成本?这已成为一众大模型企业不得不面对的难题之一。VLU即热新闻——关注每天科技社会生活新变化gihot.com

日前,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级。“自研机器学习框架升级后,腾讯大模型训练效率可提升至主流开源框架的2.6倍,用该框架训练千亿级大模型可节省50%算力成本,大模型推理速度提高了1.3倍。”11月30日,腾讯机器学习平台部总监陶阳宇向科技日报记者表示。VLU即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在提升大模型训练效率、加速大模型落地应用方面,一批中国企业交出了自己的“答卷”。VLU即热新闻——关注每天科技社会生活新变化gihot.com

双管齐下节约算力成本VLU即热新闻——关注每天科技社会生活新变化gihot.com

在大型模型训练和推理过程中,需要消耗大量算力资源。因此,提高硬件资源利用率,对国产大模型技术的发展至关重要。VLU即热新闻——关注每天科技社会生活新变化gihot.com

陶阳宇介绍,面向大模型训练,腾讯自研了机器学习框架Angel。该框架针对预训练、模型精调和强化学习等全流程进行了加速和优化。据悉,它采用FP8混合精度训练技术,并深度优化了4D混合并行训练策略,还在ZeROCache技术基础上减少了冗余模型存储和内存碎片,提升了内存的利用率。同时,该框架还可兼容适配多款国产化硬件。VLU即热新闻——关注每天科技社会生活新变化gihot.com

而据媒体披露,除了提高硬件资源利用率,针对通信策略、AI框架、模型编译等进行系统级优化,亦可大幅节约训练调优和算力成本。VLU即热新闻——关注每天科技社会生活新变化gihot.com

此外,随着模型参数的增大,大模型推理的成本也随之攀升。陶阳宇介绍,腾讯自研的大模型机器学习框架Angel通过扩展并行、向量数据库、批处理等多种优化手段,提高了吞吐能力,达到了更快的推理性能,降低了成本。VLU即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在第二十届中国计算机大会上,百度首席技术官王海峰就公开透露,文心大模型4.0从今年3月发布至今,其训练算法效率已提升3.6倍;通过百度飞桨与文心大模型的协同优化,文心大模型周均训练有效率超过98%,推理性能提升50倍。VLU即热新闻——关注每天科技社会生活新变化gihot.com

此外,据公开资料显示,阿里云通义大模型则聚焦于规模定理,基于小模型数据分布、规则和配比,研究大规模参数规模下如何提升模型能力,并通过对底层集群的优化,将模型训练效率提升了30%,训练稳定性提升了15%。VLU即热新闻——关注每天科技社会生活新变化gihot.com

让大模型“开箱即用”成为可能VLU即热新闻——关注每天科技社会生活新变化gihot.com

不难看出,调整和优化模型的训练和推理方式,其最终目的都指向使模型更好地适应实际应用场景、降低在终端应用中的额外成本。“大模型的应用和研发同样重要。”腾讯机器学习平台专家工程师姚军说,只有提供方便、强大的接入平台,才能让大模型真正走向应用。VLU即热新闻——关注每天科技社会生活新变化gihot.com

百度创始人、董事长兼首席执行官李彦宏也曾表示,大模型本身是不直接产生价值的,基于大模型开发出来的应用才是大模型存在的意义。然而,很多大模型落地的难度很大,因为一个大模型往往会对应着很多不同种类的应用,这需要大量的接口和流量支持。VLU即热新闻——关注每天科技社会生活新变化gihot.com

如何破解这道难题?据悉,基于自研机器学习框架Angel,腾讯打造了大模型接入和应用开发的一站式平台,让针对业务场景的数据处理、模型微调、评测部署和应用构建等多个环节,从以往“散装”的多团队协作方式,转化成流水线平台上自动化生产方式,让大模型的“开箱即用”成为可能。“开箱即用”的关键在于预训练基础模型的泛化能力,高性能框架提供的微调或扩展工程能力,以及应用平台的灵活构建能力等支撑。据媒体披露,目前腾讯会议、腾讯新闻、腾讯视频等超过300个腾讯产品及场景均已接入腾讯混元大模型进行内测,数量相比10月份翻了一倍,覆盖文本总结、摘要、创作、翻译、代码等多个场景。比如,腾讯混元大模型就可支持智能化的广告素材创作,满足“千人千面”的需求。VLU即热新闻——关注每天科技社会生活新变化gihot.com

《北京市人工智能行业大模型创新应用白皮书(2023年)》数据显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余个省市/地区。VLU即热新闻——关注每天科技社会生活新变化gihot.com

“未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合。”中国人民大学数字经济研究中心主任李三希此前表示,这不仅需要具备坚实的技术基础,如大规模、高质量、多样化的语料库,创新的大模型算法,自研的机器学习框架和强大的算力基础设施等,也需要大模型产品具有坚实的基于场景的应用。未来,从实践中来,到实践中去的“实用级”大模型将成为趋势。VLU即热新闻——关注每天科技社会生活新变化gihot.com

 VLU即热新闻——关注每天科技社会生活新变化gihot.com

如何在算力紧缺的背景下提升大模型训练和推理的效率,并降低成本?这已成为一众大模型企业不得不面对的难题之一。VLU即热新闻——关注每天科技社会生活新变化gihot.com

日前,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级。“自研机器学习框架升级后,腾讯大模型训练效率可提升至主流开源框架的2.6倍,用该框架训练千亿级大模型可节省50%算力成本,大模型推理速度提高了1.3倍。”11月30日,腾讯机器学习平台部总监陶阳宇向科技日报记者表示。VLU即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在提升大模型训练效率、加速大模型落地应用方面,一批中国企业交出了自己的“答卷”。VLU即热新闻——关注每天科技社会生活新变化gihot.com

双管齐下节约算力成本VLU即热新闻——关注每天科技社会生活新变化gihot.com

在大型模型训练和推理过程中,需要消耗大量算力资源。因此,提高硬件资源利用率,对国产大模型技术的发展至关重要。VLU即热新闻——关注每天科技社会生活新变化gihot.com

陶阳宇介绍,面向大模型训练,腾讯自研了机器学习框架Angel。该框架针对预训练、模型精调和强化学习等全流程进行了加速和优化。据悉,它采用FP8混合精度训练技术,并深度优化了4D混合并行训练策略,还在ZeROCache技术基础上减少了冗余模型存储和内存碎片,提升了内存的利用率。同时,该框架还可兼容适配多款国产化硬件。VLU即热新闻——关注每天科技社会生活新变化gihot.com

而据媒体披露,除了提高硬件资源利用率,针对通信策略、AI框架、模型编译等进行系统级优化,亦可大幅节约训练调优和算力成本。VLU即热新闻——关注每天科技社会生活新变化gihot.com

此外,随着模型参数的增大,大模型推理的成本也随之攀升。陶阳宇介绍,腾讯自研的大模型机器学习框架Angel通过扩展并行、向量数据库、批处理等多种优化手段,提高了吞吐能力,达到了更快的推理性能,降低了成本。VLU即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在第二十届中国计算机大会上,百度首席技术官王海峰就公开透露,文心大模型4.0从今年3月发布至今,其训练算法效率已提升3.6倍;通过百度飞桨与文心大模型的协同优化,文心大模型周均训练有效率超过98%,推理性能提升50倍。VLU即热新闻——关注每天科技社会生活新变化gihot.com

此外,据公开资料显示,阿里云通义大模型则聚焦于规模定理,基于小模型数据分布、规则和配比,研究大规模参数规模下如何提升模型能力,并通过对底层集群的优化,将模型训练效率提升了30%,训练稳定性提升了15%。VLU即热新闻——关注每天科技社会生活新变化gihot.com

让大模型“开箱即用”成为可能VLU即热新闻——关注每天科技社会生活新变化gihot.com

不难看出,调整和优化模型的训练和推理方式,其最终目的都指向使模型更好地适应实际应用场景、降低在终端应用中的额外成本。“大模型的应用和研发同样重要。”腾讯机器学习平台专家工程师姚军说,只有提供方便、强大的接入平台,才能让大模型真正走向应用。VLU即热新闻——关注每天科技社会生活新变化gihot.com

百度创始人、董事长兼首席执行官李彦宏也曾表示,大模型本身是不直接产生价值的,基于大模型开发出来的应用才是大模型存在的意义。然而,很多大模型落地的难度很大,因为一个大模型往往会对应着很多不同种类的应用,这需要大量的接口和流量支持。VLU即热新闻——关注每天科技社会生活新变化gihot.com

如何破解这道难题?据悉,基于自研机器学习框架Angel,腾讯打造了大模型接入和应用开发的一站式平台,让针对业务场景的数据处理、模型微调、评测部署和应用构建等多个环节,从以往“散装”的多团队协作方式,转化成流水线平台上自动化生产方式,让大模型的“开箱即用”成为可能。“开箱即用”的关键在于预训练基础模型的泛化能力,高性能框架提供的微调或扩展工程能力,以及应用平台的灵活构建能力等支撑。据媒体披露,目前腾讯会议、腾讯新闻、腾讯视频等超过300个腾讯产品及场景均已接入腾讯混元大模型进行内测,数量相比10月份翻了一倍,覆盖文本总结、摘要、创作、翻译、代码等多个场景。比如,腾讯混元大模型就可支持智能化的广告素材创作,满足“千人千面”的需求。VLU即热新闻——关注每天科技社会生活新变化gihot.com

《北京市人工智能行业大模型创新应用白皮书(2023年)》数据显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余个省市/地区。VLU即热新闻——关注每天科技社会生活新变化gihot.com

“未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合。”中国人民大学数字经济研究中心主任李三希此前表示,这不仅需要具备坚实的技术基础,如大规模、高质量、多样化的语料库,创新的大模型算法,自研的机器学习框架和强大的算力基础设施等,也需要大模型产品具有坚实的基于场景的应用。未来,从实践中来,到实践中去的“实用级”大模型将成为趋势。VLU即热新闻——关注每天科技社会生活新变化gihot.com

 VLU即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-135-0.html“技术升级+一站构建”助大模型降本增效

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京极光登上热搜,天文专家详解出现原因→

下一篇:开源助推AI技术落地

为你推荐
微信分付套现最新流程,24小时回收秒到方法在当今社会,科技的浪潮汹涌澎湃,人们的生活质量如芝麻开花般节节高升,消费水平也如同顺水推舟般稳步增长。然而,正如生活中的每一片晴空...
08-10
深圳南山区当面套VISA境外卡花呗白条分付【微电:138 1874 5895】全天在线欢迎打电话,当面办理安全靠谱!套京东白条取现?有这么一个商家你不知道你就吃大亏!最近很多兄弟们给我留...
07-30
当面套花呗京东白条抖音月付分期乐VISA信用卡分付一手商家秒到账:【166 7513 1138 微信同号】一手当面靠谱!白条怎么套出来,大家在急用钱的时候肯定会想到京东白条或者京东金条...
08-05
京东白条的额度能刷出来吗,常用7种操作方法手把手教给你,大家都知道,白条属于京东旗下的一款消费产品,初衷并不是要大家套出来当现金使用的。只是很多朋友可能在月底或者有时候...
08-05
现代快报讯(记者高达)10月1日,国庆假期首日,一列满载着苏州三星电子高端家电的中亚班列从江苏(苏州)国际铁路物流中心驶出,发往阿拉木图。现代快报记者了解到,这是国庆期间苏州三星...
10-01
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【得物佳物分期购可以提现吗】【得物的分期购额度怎么套出来...
08-29
12 月 14 日消息,尽管近期一些媒体报道称电动汽车需求出现放缓,但沃尔沃汽车首席执行官吉姆・罗文(Jim Rowan)表示,他没有看到任何放缓的迹象。相反,沃尔沃的新款电动汽车...
12-14
预演;微信分付怎么可以刷出来,实用教程与心得分享商家收款码是由商家生成并展示,用于接收用户支付款项的二维码。当用户扫描商家的收款码后,会自动跳转到微信的支付界面,用户可...
09-09
新发现:花呗风控了淘宝套出来,轻松7种流程提现方法虚拟代付 这是一种相对简单的套现方式,通过找信用卡还款渠道,将花呗还款,然后用信用卡还款即可。具体步骤如下: 1. 下载并安装...
09-02
很多人在大暑时节都比较注重养生,但是他们对很多的食物禁忌都不是很清楚,不知道该吃哪些不该吃哪些,为此小编整理了相关的资料将为大家做出详细的介绍,希望能给各位提供一些有用...
04-02
郑州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-30
太原风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-24
武汉风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-26
南宁风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-10
  今年以来,并购重组支持政策不断落地,市场环境不断优化,配套制度适应性、包容性持续增强,并购市场活跃度...
10-10
暑期近在眼前,研学却先热起来了。不论在社媒直播间、路边广告牌还是家校微信群,“研学”二字频频亮相,研学从业者摩拳擦掌迎接一年中...
07-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮