“技术升级+一站构建”助大模型降本增效

9个月前 来源:科技日报 观看:212

如何在算力紧缺的背景下提升大模型训练和推理的效率,并降低成本?这已成为一众大模型企业不得不面对的难题之一。oTp即热新闻——关注每天科技社会生活新变化gihot.com

日前,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级。“自研机器学习框架升级后,腾讯大模型训练效率可提升至主流开源框架的2.6倍,用该框架训练千亿级大模型可节省50%算力成本,大模型推理速度提高了1.3倍。”11月30日,腾讯机器学习平台部总监陶阳宇向科技日报记者表示。oTp即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在提升大模型训练效率、加速大模型落地应用方面,一批中国企业交出了自己的“答卷”。oTp即热新闻——关注每天科技社会生活新变化gihot.com

双管齐下节约算力成本oTp即热新闻——关注每天科技社会生活新变化gihot.com

在大型模型训练和推理过程中,需要消耗大量算力资源。因此,提高硬件资源利用率,对国产大模型技术的发展至关重要。oTp即热新闻——关注每天科技社会生活新变化gihot.com

陶阳宇介绍,面向大模型训练,腾讯自研了机器学习框架Angel。该框架针对预训练、模型精调和强化学习等全流程进行了加速和优化。据悉,它采用FP8混合精度训练技术,并深度优化了4D混合并行训练策略,还在ZeROCache技术基础上减少了冗余模型存储和内存碎片,提升了内存的利用率。同时,该框架还可兼容适配多款国产化硬件。oTp即热新闻——关注每天科技社会生活新变化gihot.com

而据媒体披露,除了提高硬件资源利用率,针对通信策略、AI框架、模型编译等进行系统级优化,亦可大幅节约训练调优和算力成本。oTp即热新闻——关注每天科技社会生活新变化gihot.com

此外,随着模型参数的增大,大模型推理的成本也随之攀升。陶阳宇介绍,腾讯自研的大模型机器学习框架Angel通过扩展并行、向量数据库、批处理等多种优化手段,提高了吞吐能力,达到了更快的推理性能,降低了成本。oTp即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在第二十届中国计算机大会上,百度首席技术官王海峰就公开透露,文心大模型4.0从今年3月发布至今,其训练算法效率已提升3.6倍;通过百度飞桨与文心大模型的协同优化,文心大模型周均训练有效率超过98%,推理性能提升50倍。oTp即热新闻——关注每天科技社会生活新变化gihot.com

此外,据公开资料显示,阿里云通义大模型则聚焦于规模定理,基于小模型数据分布、规则和配比,研究大规模参数规模下如何提升模型能力,并通过对底层集群的优化,将模型训练效率提升了30%,训练稳定性提升了15%。oTp即热新闻——关注每天科技社会生活新变化gihot.com

让大模型“开箱即用”成为可能oTp即热新闻——关注每天科技社会生活新变化gihot.com

不难看出,调整和优化模型的训练和推理方式,其最终目的都指向使模型更好地适应实际应用场景、降低在终端应用中的额外成本。“大模型的应用和研发同样重要。”腾讯机器学习平台专家工程师姚军说,只有提供方便、强大的接入平台,才能让大模型真正走向应用。oTp即热新闻——关注每天科技社会生活新变化gihot.com

百度创始人、董事长兼首席执行官李彦宏也曾表示,大模型本身是不直接产生价值的,基于大模型开发出来的应用才是大模型存在的意义。然而,很多大模型落地的难度很大,因为一个大模型往往会对应着很多不同种类的应用,这需要大量的接口和流量支持。oTp即热新闻——关注每天科技社会生活新变化gihot.com

如何破解这道难题?据悉,基于自研机器学习框架Angel,腾讯打造了大模型接入和应用开发的一站式平台,让针对业务场景的数据处理、模型微调、评测部署和应用构建等多个环节,从以往“散装”的多团队协作方式,转化成流水线平台上自动化生产方式,让大模型的“开箱即用”成为可能。“开箱即用”的关键在于预训练基础模型的泛化能力,高性能框架提供的微调或扩展工程能力,以及应用平台的灵活构建能力等支撑。据媒体披露,目前腾讯会议、腾讯新闻、腾讯视频等超过300个腾讯产品及场景均已接入腾讯混元大模型进行内测,数量相比10月份翻了一倍,覆盖文本总结、摘要、创作、翻译、代码等多个场景。比如,腾讯混元大模型就可支持智能化的广告素材创作,满足“千人千面”的需求。oTp即热新闻——关注每天科技社会生活新变化gihot.com

《北京市人工智能行业大模型创新应用白皮书(2023年)》数据显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余个省市/地区。oTp即热新闻——关注每天科技社会生活新变化gihot.com

“未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合。”中国人民大学数字经济研究中心主任李三希此前表示,这不仅需要具备坚实的技术基础,如大规模、高质量、多样化的语料库,创新的大模型算法,自研的机器学习框架和强大的算力基础设施等,也需要大模型产品具有坚实的基于场景的应用。未来,从实践中来,到实践中去的“实用级”大模型将成为趋势。oTp即热新闻——关注每天科技社会生活新变化gihot.com

 oTp即热新闻——关注每天科技社会生活新变化gihot.com

如何在算力紧缺的背景下提升大模型训练和推理的效率,并降低成本?这已成为一众大模型企业不得不面对的难题之一。oTp即热新闻——关注每天科技社会生活新变化gihot.com

日前,腾讯披露,腾讯混元大模型背后的自研机器学习框架Angel再次升级。“自研机器学习框架升级后,腾讯大模型训练效率可提升至主流开源框架的2.6倍,用该框架训练千亿级大模型可节省50%算力成本,大模型推理速度提高了1.3倍。”11月30日,腾讯机器学习平台部总监陶阳宇向科技日报记者表示。oTp即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在提升大模型训练效率、加速大模型落地应用方面,一批中国企业交出了自己的“答卷”。oTp即热新闻——关注每天科技社会生活新变化gihot.com

双管齐下节约算力成本oTp即热新闻——关注每天科技社会生活新变化gihot.com

在大型模型训练和推理过程中,需要消耗大量算力资源。因此,提高硬件资源利用率,对国产大模型技术的发展至关重要。oTp即热新闻——关注每天科技社会生活新变化gihot.com

陶阳宇介绍,面向大模型训练,腾讯自研了机器学习框架Angel。该框架针对预训练、模型精调和强化学习等全流程进行了加速和优化。据悉,它采用FP8混合精度训练技术,并深度优化了4D混合并行训练策略,还在ZeROCache技术基础上减少了冗余模型存储和内存碎片,提升了内存的利用率。同时,该框架还可兼容适配多款国产化硬件。oTp即热新闻——关注每天科技社会生活新变化gihot.com

而据媒体披露,除了提高硬件资源利用率,针对通信策略、AI框架、模型编译等进行系统级优化,亦可大幅节约训练调优和算力成本。oTp即热新闻——关注每天科技社会生活新变化gihot.com

此外,随着模型参数的增大,大模型推理的成本也随之攀升。陶阳宇介绍,腾讯自研的大模型机器学习框架Angel通过扩展并行、向量数据库、批处理等多种优化手段,提高了吞吐能力,达到了更快的推理性能,降低了成本。oTp即热新闻——关注每天科技社会生活新变化gihot.com

不只是腾讯,在第二十届中国计算机大会上,百度首席技术官王海峰就公开透露,文心大模型4.0从今年3月发布至今,其训练算法效率已提升3.6倍;通过百度飞桨与文心大模型的协同优化,文心大模型周均训练有效率超过98%,推理性能提升50倍。oTp即热新闻——关注每天科技社会生活新变化gihot.com

此外,据公开资料显示,阿里云通义大模型则聚焦于规模定理,基于小模型数据分布、规则和配比,研究大规模参数规模下如何提升模型能力,并通过对底层集群的优化,将模型训练效率提升了30%,训练稳定性提升了15%。oTp即热新闻——关注每天科技社会生活新变化gihot.com

让大模型“开箱即用”成为可能oTp即热新闻——关注每天科技社会生活新变化gihot.com

不难看出,调整和优化模型的训练和推理方式,其最终目的都指向使模型更好地适应实际应用场景、降低在终端应用中的额外成本。“大模型的应用和研发同样重要。”腾讯机器学习平台专家工程师姚军说,只有提供方便、强大的接入平台,才能让大模型真正走向应用。oTp即热新闻——关注每天科技社会生活新变化gihot.com

百度创始人、董事长兼首席执行官李彦宏也曾表示,大模型本身是不直接产生价值的,基于大模型开发出来的应用才是大模型存在的意义。然而,很多大模型落地的难度很大,因为一个大模型往往会对应着很多不同种类的应用,这需要大量的接口和流量支持。oTp即热新闻——关注每天科技社会生活新变化gihot.com

如何破解这道难题?据悉,基于自研机器学习框架Angel,腾讯打造了大模型接入和应用开发的一站式平台,让针对业务场景的数据处理、模型微调、评测部署和应用构建等多个环节,从以往“散装”的多团队协作方式,转化成流水线平台上自动化生产方式,让大模型的“开箱即用”成为可能。“开箱即用”的关键在于预训练基础模型的泛化能力,高性能框架提供的微调或扩展工程能力,以及应用平台的灵活构建能力等支撑。据媒体披露,目前腾讯会议、腾讯新闻、腾讯视频等超过300个腾讯产品及场景均已接入腾讯混元大模型进行内测,数量相比10月份翻了一倍,覆盖文本总结、摘要、创作、翻译、代码等多个场景。比如,腾讯混元大模型就可支持智能化的广告素材创作,满足“千人千面”的需求。oTp即热新闻——关注每天科技社会生活新变化gihot.com

《北京市人工智能行业大模型创新应用白皮书(2023年)》数据显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余个省市/地区。oTp即热新闻——关注每天科技社会生活新变化gihot.com

“未来大模型产品的发展趋势可能是通用大模型与垂直领域细分模型的结合。”中国人民大学数字经济研究中心主任李三希此前表示,这不仅需要具备坚实的技术基础,如大规模、高质量、多样化的语料库,创新的大模型算法,自研的机器学习框架和强大的算力基础设施等,也需要大模型产品具有坚实的基于场景的应用。未来,从实践中来,到实践中去的“实用级”大模型将成为趋势。oTp即热新闻——关注每天科技社会生活新变化gihot.com

 oTp即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-135-0.html“技术升级+一站构建”助大模型降本增效

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京极光登上热搜,天文专家详解出现原因→

下一篇:开源助推AI技术落地

为你推荐
分付去哪里套出来啊,2024最新渠道已更新随着移动支付时代的汹涌而至,微信支付已悄然融入人们的日常点滴,成为我们生活中不可或缺的支付伙伴。而在这一繁华的支付生态中,微信分...
08-07
南昌青云谱区本地当面套花呗京东白条VISA信用卡分付一手商家秒到账:【150 0062 3958 微信同号】一手当面靠谱!白条怎么套出来,大家在急用钱的时候肯定会想到京东白条或者京东金...
07-28
当仁,不让于师。——《论语》  译:遇到应该做的好事,不能犹豫不决,即使老师在一旁,也应该抢着去做。后发展为成语“当仁不让”。 二人同心,其利断金;同心之言,其臭如兰...
08-06
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-8979可v可来电)(全年365天不掉线) 【抖音月付分付要怎样提现】【抖音Dou分期怎么刷出来】【抖...
08-05
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-8979可v可来电)(全年365天不掉线) 【抖音月付分付要怎样提现】【抖音Dou分期怎么刷出来】【抖...
08-18
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【拼多多先用后付要怎样提现】【拼多多先用后付怎么刷出来】...
08-17
[本站 资讯] 大众汽车(安徽)有限公司已于近日正式投产出口欧洲市场的纯电动车型Cupra Tavascan。另一款面向中国市场的大众汽车品牌车型将于2024年下线。大众安徽是大...
12-31
横评:微信分付最新取现小程序(必须知道的三个步骤五种小技巧)微信分付需要那种二维码可以消费?分付需要扫商家收款码才能消费。微信的收款码分为两种,一种是个人收款码 分付...
08-31
白条如何自己套出来 如何正确使用白条,让购物能够得到最大的资金。在现在的社会,白条购物已经成为越来越多人的消费习惯,但是,在使用白条的过程中,消费者们也应该掌握一些技巧,以...
08-14
夏季的时候大家最容易出现的情况就是中暑了吧,这时候的气温是非常高的了,因此就让我们很多人都容易出现身体的不适,中暑发热的情况是很常见的了吧,那么我们应该怎么做来保护好身...
04-02
近日,西北工业大学航空学院教授吕震宙因其在学校官网个人主页上详细公布...
04-08
长沙风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-23
郑州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-09
惠州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-13
西安风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-09
近日,国际数据公司IDC发布的《中国专属云服务市场(2023上半年)跟踪》报告显示,2023上半年,专属云服务市场同比增长26.6%。中国电信天翼云以18.7%的份额占比...
01-22
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮