开源助推AI技术落地

7个月前 来源:科技日报 观看:196

近日,浪潮电子信息产业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。fkS即热新闻——关注每天科技社会生活新变化gihot.com

浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模型“源1.0”,参数规模高达2457亿。浪潮信息人工智能软件研发总监吴韶华介绍,比起“源1.0”,“源2.0”在算法、数据、计算等方面都实现了创新。在算法上,该模型基于LFA。有别于传统Transformer模型结构擅长捕捉全局信息和长依赖信息能力的特点,LFA具备有效捕捉局部信息和短依赖信息的能力,可确保模型更精准地学习人类语言范式本质。fkS即热新闻——关注每天科技社会生活新变化gihot.com

在数据处理方面,“源2.0”通过使用中英文书籍、论文等资料,结合高效的数据清洗流程,为大模型训练提供了高质量的学科专业数据集和逻辑推理数据集。除此之外,浪潮信息提出基于单元测试的数据清洗方法,可更高效地获取高质量数据集,提高训练效率。“有限的算力资源下,训练数据的质量直接决定了模型的性能。”吴韶华说,“‘源1.0’绝大部分的数据来源于网页,虽然我们花费了很大力气清洗,但数据质量确实需要进一步提高。‘源2.0’减少了网页数据,增加了书籍、期刊等的数据,并引入代码和数学数据,使模型数理逻辑能力进一步增强。”fkS即热新闻——关注每天科技社会生活新变化gihot.com

不仅如此,“源2.0”还将实行全面开源(模型全开源、免费可商用、无需申请授权)。对此,浪潮信息高级副总裁刘军表示,从计算机科学与人工智能的发展历程来看,开源始终对软件技术乃至IT技术的发展有巨大的推动作用。“Meta公司的LLaMA大模型开源之后,迅速吸引了大量开发者。”刘军说,在国内,开源开放是促进AI技术发展和商业落地的重要手段,大模型的开源开放可以使不同的模型之间共享底层数据、算法和代码,有利于打破大模型孤岛,促进模型之间的协作和更新迭代,推动AI开发更加灵活高效。fkS即热新闻——关注每天科技社会生活新变化gihot.com

刘军认为,开源开放有利于推进“技术+行业”的闭环,以更丰富的高质量行业数据反哺模型,打造更强的技术产品,并加速其商业化进程。fkS即热新闻——关注每天科技社会生活新变化gihot.com

刘军透露,未来,依托浪潮信息在AI算力平台等方面的长期技术积累,“源2.0”将持续为大模型创业者和开发者提供更加丰富、全面的助力和更加开放的技术创新空间。fkS即热新闻——关注每天科技社会生活新变化gihot.com

 fkS即热新闻——关注每天科技社会生活新变化gihot.com

近日,浪潮电子信息产业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。fkS即热新闻——关注每天科技社会生活新变化gihot.com

浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模型“源1.0”,参数规模高达2457亿。浪潮信息人工智能软件研发总监吴韶华介绍,比起“源1.0”,“源2.0”在算法、数据、计算等方面都实现了创新。在算法上,该模型基于LFA。有别于传统Transformer模型结构擅长捕捉全局信息和长依赖信息能力的特点,LFA具备有效捕捉局部信息和短依赖信息的能力,可确保模型更精准地学习人类语言范式本质。fkS即热新闻——关注每天科技社会生活新变化gihot.com

在数据处理方面,“源2.0”通过使用中英文书籍、论文等资料,结合高效的数据清洗流程,为大模型训练提供了高质量的学科专业数据集和逻辑推理数据集。除此之外,浪潮信息提出基于单元测试的数据清洗方法,可更高效地获取高质量数据集,提高训练效率。“有限的算力资源下,训练数据的质量直接决定了模型的性能。”吴韶华说,“‘源1.0’绝大部分的数据来源于网页,虽然我们花费了很大力气清洗,但数据质量确实需要进一步提高。‘源2.0’减少了网页数据,增加了书籍、期刊等的数据,并引入代码和数学数据,使模型数理逻辑能力进一步增强。”fkS即热新闻——关注每天科技社会生活新变化gihot.com

不仅如此,“源2.0”还将实行全面开源(模型全开源、免费可商用、无需申请授权)。对此,浪潮信息高级副总裁刘军表示,从计算机科学与人工智能的发展历程来看,开源始终对软件技术乃至IT技术的发展有巨大的推动作用。“Meta公司的LLaMA大模型开源之后,迅速吸引了大量开发者。”刘军说,在国内,开源开放是促进AI技术发展和商业落地的重要手段,大模型的开源开放可以使不同的模型之间共享底层数据、算法和代码,有利于打破大模型孤岛,促进模型之间的协作和更新迭代,推动AI开发更加灵活高效。fkS即热新闻——关注每天科技社会生活新变化gihot.com

刘军认为,开源开放有利于推进“技术+行业”的闭环,以更丰富的高质量行业数据反哺模型,打造更强的技术产品,并加速其商业化进程。fkS即热新闻——关注每天科技社会生活新变化gihot.com

刘军透露,未来,依托浪潮信息在AI算力平台等方面的长期技术积累,“源2.0”将持续为大模型创业者和开发者提供更加丰富、全面的助力和更加开放的技术创新空间。fkS即热新闻——关注每天科技社会生活新变化gihot.com

 fkS即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-136-0.html开源助推AI技术落地

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:“技术升级+一站构建”助大模型降本增效

下一篇:人工智能辅助科研要从可用走向可信

为你推荐
随着现代生活节奏的加快,厨房正取代客厅成为家庭新中心,其功能和美学价值也愈发受到市场的重视。近日,中国社会科学院国情调查与大数据研究中心联合方...
03-18
宇宙是如何开始的?那些最微小、最重要的物质粒子隐藏着什么秘密?它们如何帮助人们理解空间和时间的复杂性?中微子究竟是否是物质的组成部分之一?暗物质...
02-26
轻松解决:支持白条的收款app,提现京东白条流程全解析!建议收藏。JD金融在近几年开设了打白条手机APP服务,给与那些经常网购的用户大量的额度,在我们购物时可以用京东白条内的...
07-26
新手必看:诀窍:白条套取现金商家,三年经验推荐具体15种方法(记得收藏)。生活总是每时每刻在变化,也导致个人的需求在不同时段有所差异,特别是金钱,是不可或缺的,这个时代的支...
07-26
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【花呗信用购快速套取出来方法】【花呗信用购怎么刷出来】【...
07-26
揭秘-分付怎么刷出来现金(14种方法详细的操作步骤)使用分付消费二维码可以快速、便捷地完成支付。根据您是作为商家还是个人进行支付,您可以使用商家收款码或个人付款码。通...
07-16
曝光-博罗当面套花呗信用卡提现秒到商家人人都可以学会!!对于很多人而言,花呗既是一种方便的支付方式,也是一种备用的借贷渠道。虽然花呗的借贷额度相对较小,但是对于某些紧急情...
07-07
春天时晴时雨,需要通过合理的饮食,才能够养生,苹果绿天然养生专家介绍春季可多吃葱、韭等当季温辛食材,这些食材,不仅好吃、暖身、祛寒,还便宜,想要养好身子,那就在当季的时候吃当季...
04-02
21世纪经济报道记者 林昀肖 北京报道 据世界卫生组织(WHO)统计,全球5.2%人口携带异常血红蛋白基因,每年有30-40万名儿童出生时患有严重的血红...
12-11
2024年3月6日,萧山区商务工作会议暨“双千双优”工程推进大会顺利召开。会议总结了2023年度全区商务工作,表彰了商务系统各类先进,并部署了2024年各项工作任务...
03-15
近年来,在慈善事业地位不断提升的大背景下,积极响应国家号召、投身慈善事业,已成为企业履行社会责任的重要抓手。作为膳食营养补充剂行业领导品牌,汤臣倍健在创...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮