解决传统架构记忆瓶颈 MiniMax发布新一代模型

1年前 来源:新京报 观看:332

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。mMB即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。mMB即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。mMB即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”mMB即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。mMB即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。mMB即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。mMB即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”mMB即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
从空间太阳能发电到破解大脑基因密码,再到由真菌制造的自我修复材料,《欧盟研究与创新》杂志盘点了2025年有望大放异彩的创新技术。这些成果拥有广阔...
01-21
1月13日,由浙江大学杭州国际科创中心(以下简称“科创中心”)人形机器人创新研究院联合镜识科技有限公司、杭州凯达尔焊接机器人股份有限公司研发的四...
01-21
  一辆辆卡车载着生产材料来回穿梭,机器设备的轰鸣声此起彼伏……中化扬农葫芦岛大型精细化工项目生产...
02-01
  2月13日,40名辽宁朝阳籍务工人员乘坐G3503次列车抵达大连北站。元宵节过后,随着企业复工复产步伐加快...
02-14
  国泰航空飞往香港航班因故障折返美国波士顿  中新社香港1月20日电 (记者 韩星童)国泰航空20日回复中新社记者查询时表示,国泰航空20日一架由美国波士顿前往香港的航班,...
01-21
  中新经纬1月17日电 “中国铁路”微信号17日消息,1月17日,全国铁路客流持续走高,预计发送旅客1280万人次,计划加开旅客列车778列。1月16日,全国铁路发送旅客1202.6万人次,运输...
01-21
1 月 21 日消息,比亚迪汽车去年就表示,希望 2~3 年内在 15 万级甚至 10 万级车型中全面实现标配比亚迪自研自产自销的智驾系统。上周三,36 氪称比亚迪部分车型从今年开...
01-21
北京时间 1 月 24 日,据英国《金融时报》报道,欧盟已承诺帮助陷入困境的欧洲汽车行业,可能会通过实施覆盖整个欧盟的补贴计划来提振电动汽车需求。欧盟委员会执行副主...
01-24
《难哄》苏浩安是什么角色?苏浩安第几篇出场?苏浩安是男主桑延的好兄弟,与桑延从初中就相识,后来还考上了同一所高中,也是女主温以凡的朋友。他是一个富二代,有着...
02-19
《山寨人生》是最新上映的一部热门电视剧,成功吸引了大量观众的关注,并在剧情和演员表现方面获得了高度评价。这部剧围绕“山寨人生一共有几季”这一话题展开...
02-22
  本报北京1月16日电 (记者孙秀艳)为进一步优化医保基金结算政策,不断提升医保基金结算清算效率,近日,国家医保局印发《关于推进基本医保基金即时结算改革的通知》。按...
01-21
21世纪经济报道记者朱艺艺 杭州报道步入2025年,医药生物板块将演绎什么样的行情?2月5日,A股在春节假期之后迎来蛇年的首个交易日,医药生物板块...
02-06
2025年刚过去半个多月,北京大学周欢萍教授已经连续两度在国际顶级学术刊物《...
01-21
  大众网记者 秦瑾 通讯员 朱睿斌 报道  近日,济南市教育局公布了2024年度市校融合发展战略工程支持项目名单,齐鲁师范学院科学教育和基础学科创新后备人才培养市校共...
01-21
  近日,多家消费金融公司围绕春节购物、出行、旅游等消费需求,打造多样化服务和优惠举措,推出满...
01-24
  摘要  【国际金价上演“狂飙”行情!华尔街交易商正“疯抢”黄金现货运往纽约】节后金价迭...
02-07
双鱼座的男生通常以他们的热情和温柔而闻名。他们善于表达自己的感情,对待朋友和爱人总...
01-22
射手座的男生通常是开朗、乐观、自由奔放的,他们对待感情也是如此。然而,当他们真正爱上...
01-22
aono童装怎么拿货? aono是什么童装?一、aono童装怎么拿货?aono童装可以通过以下途径拿货:1. 直接联系aono童装官方销售代表,了解他们的销售政策和拿货流程。可以通过官方网站或者...
02-07
引领潮流:2023年热门时尚服饰与包包选择潮流的魅力时尚,总是充满变幻与惊喜。每一年、每一个季节,都见证着不同的潮流风向。在2023年的时尚舞台上,服饰和包包更是不可忽视的主角...
02-12
2月5日消息,朋湖网近日联合机器人开放社区发布“2024年度科技产业系列榜单”,商越科技凭借自身的采购数字化技术创新、服务能力、市场竞争力及社会价值,入选“2024企业服务创新...
02-07
2月9日消息,阿里云百炼全面上线DeepSeek-V3、DeepSeek-R1、DeepSeek-R1-Distill-Qwen-32B等6款模型,即日起所有用户可直接使用。DeepSeek-V3、DeepSeek-R1满血版可享各100万免...
02-09
2月24日消息,智联招聘发布第三期《2025年春招市场行情周报》,继续围绕38个重点城市,洞察春节后第三周招聘求职趋势,快速呈现春招市场最新动态。智联招聘数据显示,节后第三周,交通/...
02-25
2月28日消息,携程集团近日与华盛顿特区旅游局签署战略合作协议,进一步推广华盛顿特区旅游资源。作为这项为期三年的战略合作的一部分,双方将在包括中国、日本和韩国在内的东亚...
03-01
据相关媒体发布重磅消息:2025年当地时间1月15日晚,卡塔尔首相兼外交大臣穆罕默德在多哈宣布,以色列与哈马斯达成加沙停火协议,协议第一阶段将于1月19日开始实施。对这一消息,应邀...
01-21
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
2月3日今天,美国洛杉矶举行的第67届格莱美颁奖大会上,经典名作《巫术(Wizardry: Proving Grounds of the Mad Overlord)》重制版斩获格莱美电子游戏音乐大奖,作曲人...
02-04
随着AI的快速发展,部分科学家开始借助AI设计芯片,然而AI设计的部分芯片过于复杂,甚至超出人类的理解范畴。 普林斯顿大学Sengupta实验室的科学家团队主导了这项...
02-10
“海上神器展锋芒,油气开发创辉煌”。今天说的神器就是中国制造的亚洲首艘圆筒型浮式生产储卸油装置(FPSO)——“海葵一号”。《渔舟唱晚》在民族音乐里可谓是鼎鼎有名。音乐一...
02-03
央视网消息:商务部数据显示,2024年,中国服务贸易实现快速增长,全年服务进出口总额首次突破1万亿美元,规模创下历史新高,结构持续优化,展现出广阔的发展潜力。2024年,中国全年服务进...
02-04
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮