解决传统架构记忆瓶颈 MiniMax发布新一代模型

1年前 来源:新京报 观看:379

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。rWk即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。rWk即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。rWk即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”rWk即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。rWk即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。rWk即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。rWk即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”rWk即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
这两天,小红书“霸屏”了,成为网络热议话题。如果还有人不明所以,可以打开小红书App浏览一下,就会发现刷到外国博主的几率非常大,他们还给自己贴上了“T...
01-21
1月22日,汽车产业再迎重大战略合作:东风汽车集团有限公司(以下简称东风汽车)旗下主流科技电动品牌东风奕派与华为技术有限公司(以下简称华为)在华为深圳...
01-24
  受到近期寒潮天气影响,渤海辽东湾海域的海冰发展迅速,目前辽东湾超过四分之一的海面被海冰覆盖。...
02-07
  今年计划换新车的辽宁消费者迎来利好。2月13日晚,辽宁省商务厅发布通知,明确了今年辽宁落实国家汽车...
02-14
财联社1月21日讯(记者 王宏)昨日晚间离岸人民币兑美元持续拉升,接连收复7.31、7.30、7.29、7.28、7.27关口,日内涨近750点。业内分析指出,当前特朗普对贸易政策的最新表态有所缓...
01-21
有海的城市,好像会更浪漫些。想象一下,坐在海边,感受着轻柔的海风,聆听着海浪拍打礁石的声音;在海水退潮时,踏入浅滩,翻开一块块礁石,寻找...
01-21
1 月 22 日消息,汽车媒体 ShortsCar 昨日(1 月 21 日)在 Instagram 上发布动态,抓拍到了现代 IONIQ 6 首批 P1 原型车的照片。这款流线型电动轿车改头换面,前脸重新设计,...
01-23
2 月 1 日消息,特斯拉在海外发布视频,主要展示该公司的自动机械臂整备其 Cybercab无人驾驶出租车。参考视频,相应机械臂能够将车内遗留的物品、喝剩一半的水瓶、未归位...
02-02
《余烬之上》河神新娘真相是什么?河神新娘大结局是什么?‌《余烬之上》中“河神新娘案”的真相是引入了民间传说的元素:寡妇身披红衣待嫁,而准新郎却是河神‌‌...
02-21
随着电视剧《狂医魔徒》的热播,该剧逐渐吸引了广大粉丝的关注。一经播出,就以精彩的剧情、精良的制作和精心的演绎赢得了观众的一致好评,并且拿下了收视第一的...
02-22
21世纪经济报道记者 韩利明 上海报道 随着跨国药企(MNC)陆续披露2024年业绩,21世纪经济报道记者初步统计发现,自免领域的营收排名中,赛诺菲的度...
02-08
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家医保局发布2025年度第一批重点事项清单2...
02-17
根据国务院发布的《高等教育自学考试暂行条例》和《辽宁省高等教育自学考试学历认定和课程免考实施细则...
01-21
  大众网记者 王一刚 报道  报纸王国欢迎您,纸不仅是孩子们熟知的事物,更是他们游戏,创作和探索的素材,在《报纸王国》主题活动中孩子们与报纸展开了一系列的活动,不知不...
01-21
  在我国人口老龄化加速的大背景下,养老金融成为社会关注的焦点。中共中央、国务院近日出台的...
01-21
  摘要  【“盘中异动赶紧锁仓”!锰硅全线大涨原因找到了?】银河期货大宗商品研究所黑色板块...
02-07
天秤男是十二星座中最具魅力的一种类型,他们温文尔雅、风度翩翩,总能吸引众多女性的目光...
01-22
水瓶座的男生一向以聪明、独立和理性著称。他们喜欢自由自在地生活,追求个人空间和独特...
01-22
T恤穿搭技巧? 男士t恤衫穿搭技巧?一、T恤穿搭技巧?01 T恤+吊带裙简约T恤与长款吊带连衣裙搭配,优雅大气,而且能凸显优美的身材曲线。手臂粗的姑娘们,可以选择袖子宽松的T恤,腰部较...
02-12
蓝百万潮流服饰:引领时尚的潮流先锋选择一件衣服,不仅是为了保暖或遮羞;更多的时候,它是一种身份的象征,一种自我表达的方式。当我第一次听说蓝百万潮流服饰这个品牌时,我立刻被它...
02-17
1月25日消息,香港位元堂药业有限公司CEO陈杰文(Raymond Chan)近日率队访问怡亚通总部,双方围绕未来业务合作展开深入交流。最终,双方正式达成战略合作关系,致力于共同打造香港中成...
02-07
2月17日消息,猪八戒网旗下江西八戒创新资源近日收到了“高新技术企业”证书纸质件,标志着该公司再次获批高新技术企业。图源:猪八戒网头条公众号江西八戒创新资源是猪八戒网企...
02-18
图源:喜茶官网 喜茶的一封全员内部信,打响了2025年新茶饮行...
02-11
牧业公司在2024年度过艰难一年,即便是头部玩家也不例外。 现代牧业(01117.HK)2月18日晚间发布盈利预警,预期截至2024年12月31日止年...
02-21
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
《黑神话:悟空》大获成功后,亢金龙、紫蛛儿、小狐狸萍萍等角色也深受玩家喜爱。近日小狐狸萍萍女演员钱思怡在网上分享视频,展示了她泡澡的视频,一起来看看吧! 视频...
01-31
《城市:天际线2》中国地区资产包现已免费上线Paradox Mods,官方表示中国资产包的目标是重现这种独特的融合——从四合院的历史韵味到现代高层建筑的宏伟规模。此...
02-11
记者今天从国家邮政局了解到,今年春节假期,全国邮政快递行业业务量保持良好增长态势,揽收和投递快递包裹超19亿件。国家邮政局数据显示,1月28日至2月4日,全国揽收和投递快递包裹1...
02-05
随着人工智能技术的迅猛发展,AI大模型“深度求索 DeepSeek”凭借其突破性进展迅速走红,各种“培训课”马上就来了。学习人工智能一定要付费吗?消费者如何甄别纷繁的网课?有消费...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮