“源2.0-M32”开源大模型发布

3个月前 来源:科技日报 观看:35

记者6月1日获悉,浪潮电子信息产业股份有限公司近日发布“源2.0-M32”开源大模型。“源2.0-M32”在“源2.0”系列大模型基础上,创新性提出和采用了基于注意力机制的门控网络技术,构建包含32个专家的混合专家模型(MoE),大幅提升了模型算力效率。模型运行时激活参数37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

据介绍,针对MoE模型核心的专家调度策略,“源2.0-M32”采用的新型算法结构——基于注意力机制的门控网络,关注专家模型之间的协同性度量,可解决传统门控网络下选择两个或多个专家参与计算时关联性缺失问题,大幅提升专家之间协同处理数据的水平。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

据悉,“源2.0-M32”以“源2.0-2B”为基础模型设计,沿用并融合局部过滤增强注意力机制。通过“先学习相邻词之间的关联性,再计算全局关联性”的方法,它能更好地学习自然语言的局部和全局语言特征。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

在数据层面,“源2.0-M32”基于超2万亿token(文本中最小的语义单元)进行训练,覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。在算力层面,“源2.0-M32”为硬件差异较大的训练环境提供了一种高性能训练方法。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

基于在算法、数据和算力方面的创新,“源2.0-M32”性能大幅提升,在数学竞赛、科学推理榜单上的得分超过700亿参数的LLaMA3开源大模型。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

浪潮电子信息产业股份有限公司人工智能首席科学家吴韶华表示,大模型在性能不断提升的同时,也面临着所需算力大幅攀升的问题。“源2.0-M32”将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。“‘源2.0-M32’开源大模型配合企业大模型开发平台,将助力企业实现更快的技术迭代与高效的应用落地,为人工智能产业发展提供坚实底座,加速产业智能化进程。”他说。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

记者6月1日获悉,浪潮电子信息产业股份有限公司近日发布“源2.0-M32”开源大模型。“源2.0-M32”在“源2.0”系列大模型基础上,创新性提出和采用了基于注意力机制的门控网络技术,构建包含32个专家的混合专家模型(MoE),大幅提升了模型算力效率。模型运行时激活参数37亿,在业界主流基准评测中性能全面对标700亿参数的LLaMA3开源大模型。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

据介绍,针对MoE模型核心的专家调度策略,“源2.0-M32”采用的新型算法结构——基于注意力机制的门控网络,关注专家模型之间的协同性度量,可解决传统门控网络下选择两个或多个专家参与计算时关联性缺失问题,大幅提升专家之间协同处理数据的水平。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

据悉,“源2.0-M32”以“源2.0-2B”为基础模型设计,沿用并融合局部过滤增强注意力机制。通过“先学习相邻词之间的关联性,再计算全局关联性”的方法,它能更好地学习自然语言的局部和全局语言特征。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

在数据层面,“源2.0-M32”基于超2万亿token(文本中最小的语义单元)进行训练,覆盖万亿量级的代码、中英文书籍、百科、论文及合成数据。在算力层面,“源2.0-M32”为硬件差异较大的训练环境提供了一种高性能训练方法。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

基于在算法、数据和算力方面的创新,“源2.0-M32”性能大幅提升,在数学竞赛、科学推理榜单上的得分超过700亿参数的LLaMA3开源大模型。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

浪潮电子信息产业股份有限公司人工智能首席科学家吴韶华表示,大模型在性能不断提升的同时,也面临着所需算力大幅攀升的问题。“源2.0-M32”将为企业开发应用生成式AI提供模型高性能、算力低门槛的高效路径。“‘源2.0-M32’开源大模型配合企业大模型开发平台,将助力企业实现更快的技术迭代与高效的应用落地,为人工智能产业发展提供坚实底座,加速产业智能化进程。”他说。Z0m即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-5492-0.html“源2.0-M32”开源大模型发布

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:用人工智能解决心理问题 抑郁状态识别模型准确率达90%

下一篇:智能云打印破解远程打印难题

为你推荐
额度套出来的最新方法,请认准靠谱提在线客服24小时在线为您服务【V杏2561663326电15580821310】在快节奏的现代社会中,人们对于购物的需求变得越来越大。为了满足消费者的需...
08-23
避免:白条出库秒商家,你的方法是最便捷的吗在这个科技飞速发展和金融创新层出不穷的时代,京东白条作为一种便捷的消费信贷工具,已经深入到了许多人的日常生活中。然而,近期越来...
08-12
白条额度最新套法,教你如何套白条方法步骤。如今,越来越多的人开始使用白条进行消费,但很多人不知道如何才能套出来秒到账。其实,套白条出来秒到账并不是一件难事,只要掌握一些...
08-04
要点必读:白条怎么套出来,白条个人套现最稳定的方法。让我们了解一下京东白条是啥。京东白条是京东上线的一种个人消费服务项目,为用户提供了一种不用提早支付就可以购买商品...
08-03
羊小咩享花卡怎么套出来现金,最简单的二个操作方法羊小咩享花卡作为一款备受关注的金融产品,为广大用户提供了便捷的消费体验。然而,许多用户在使用过程中,可能会遇到需要将享...
09-16
说是免费安装实际不免费、高空费材料费“套娃”收费……近日,不少消费者在社交媒体反映,自己本是高高兴兴换新家电,却被安装费“刺中”,有的安装费甚至高达商品本身价格的四成。...
09-02
预支-pos机能不能套分付-秒到6种绝对技巧探索世界万象,普及科学、科技知识!从未见过你,但会更懂你。每天分享各种生活小窍门,一起享受生活。 作为当今最流行的社交应用程序之一,...
09-12
谈吐:分付能一次性套出来吗(14种方法详细的操作步骤)借款人短期内频繁使用分付消费,或者是在支付时经常取消交易,导致系统对借款人采取限额措施。一旦借款人再使用分付扫码付...
09-05
春季的时候由于天气比较温暖,所以这时候是很适合我们进行养生的时候了,但是在春季的时候我们也会发现,这时候我们也会出现犯困的情况,所以在这时候我们就要注意春季养生的方法才...
04-02
按照高校设置有关规定及要求,现将以无锡职业技术学院为基础整合相关资源拟...
08-11
青春恰似火,筑梦正当时。3月22日,沈阳市旅游学校迎来了一批特殊的“客人”——沈阳市第八中学学子,他们踏...
03-25
昆明风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-24
科技通报2024微信分付提现方法,微信分付回收商家...
08-05
南京风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
08-22
泉州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-13
今日(8月6日),横版剧情向语言解谜游戏《按右键启动翻译器》Steam页面上线,游戏支持简体中文,发售日待定,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《按...
08-06
  央视网消息:近日,浙江多地持续高温,给一线建设者带来重重“烤”验,工地上也采取多种措施,为建设者们送去...
08-12
  每经记者 陈鹏丽 每经编辑 梁枭  6月6日晚,富信科技(SH688662,股价23.76元,市值20.97亿元)公告...
06-27
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮