解决传统架构记忆瓶颈 MiniMax发布新一代模型

1年前 来源:新京报 观看:435

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。6EM即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。6EM即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。6EM即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”6EM即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。6EM即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。6EM即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。6EM即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”6EM即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
记者1月18日从中国铁建股份有限公司了解到,由中铁十七局承建的雄商高铁全线控制性工程建设取得新进展,雄商高铁阳谷特大桥跨三干渠连续梁顺利合龙。...
01-21
近日,在中国空间站梦天实验舱航天基础试验机柜其中一个“太空抽屉”里,开展了地外人工光合作用技术试验,成功实现了高效二氧化碳转换和氧气再生新技术...
01-21
  1月20日下午,辽宁省商务厅发布《辽宁省手机、平板、智能手表(手环)购新补贴实施细则》,明确补贴范围及...
01-21
  近日,《辽宁省沿海港口布局规划(2024—2035年)》(以下简称《规划》)正式出台。我省是2023年全国港口航道...
02-05
  摘要  【国家统计局:12月份一线城市商品住宅销售价格环比上涨二三线城市环比总体降幅收窄...
01-21
  近年来,短小精悍、剧情跌宕的短剧,发展成网络影视的一种新业态,短剧出海也成为我国文化产业的一个新风向。  截至2024年8月,头部海外短剧App的地区数据中,美国的收入达1...
01-22
1 月 21 日消息,比亚迪汽车去年就表示,希望 2~3 年内在 15 万级甚至 10 万级车型中全面实现标配比亚迪自研自产自销的智驾系统。上周三,36 氪称比亚迪部分车型从今年开...
01-21
1 月 26 日消息,吉利汽车集团甲醇汽车业务中心总经理陆玉凯透露,吉利今年推出两款醇电混动车型,即吉利全新一代“醇氢电混”轿车和 SUV 车型,相关车型顾名思义,就是能够...
01-27
  1、《树下有片红房子》陈欢尔和景栖迟在一起了,两人在打打闹闹中沉淀下了深厚的感情,互相陪伴彼此走过了艰难的时光。  2、虽然宋丛先喜欢的陈欢尔,但陈欢尔只是把他当...
02-18
自《好闺蜜突然邀请我参加婚礼》播出以来,该剧在各大社交平台上引起了广泛关注和讨论。无论是在抖音、微博还是B站等平台上,都有人分享有关该剧的视频、剧情...
02-19
  记者从国家医保局了解到,12月1日,全国医保正式上线慢性阻塞性肺疾病、类风湿关节炎、冠心病、病毒性肝炎、强直性脊柱炎等5种门...
01-21
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
  大众网记者 王一刚 报道  报纸王国欢迎您,纸不仅是孩子们熟知的事物,更是他们游戏,创作和探索的素材,在《报纸王国》主题活动中孩子们与报纸展开了一系列的活动,不知不...
01-21
  今天我们来到了公安局浐灞分局。警察叔叔先带我们参观了他们审讯的地方。警察阿姨还教给我们很多在野外保护自己的知识。最后我们还进行了射击体验。  射击体验让我...
01-21
  摘要  苹果市场走势主要由“预期”和“预期差”这两个关键词主导。收购初期,受弱现实影响,...
01-21
  摘要  【骤增近30%纯碱库存创历史新高!供需失衡态势加剧?】本周,纯碱市场呈现双弱状态。纯碱...
02-07
天蝎座是十二星座中最神秘、复杂的一个星座。他们通常深思熟虑,善于隐藏自己的真实感受...
01-22
星座一直以来都是人们津津乐道的话题,尤其是在爱情方面。每个星座都有自己独特的性格特...
01-22
休闲衬衫搭配什么裤子和鞋子好看?一、休闲衬衫搭配什么裤子和鞋子好看?休闲衬衫搭配什么裤子 配阔腿牛仔裤 随着复古的阔腿裤回归,阔腿裤的搭配越来越灵活。 最常见的韩范妹子...
02-12
时尚T台秀上的秘密武器:道具伞的魅力与创意当我走进时尚界的T台秀场,映入眼帘的总是那些色彩斑斓、设计独特的服装,以及为其增光添彩的各种道具。其中,有一种道具常常成为我特别...
02-17
微信接入DeepSeek-R1模型,提供微信搜索框的AI搜索。微信正在灰度测试接入DeepSeek-R1,部分用户已获得测试资格。在微信聊天界面顶部进入搜索栏,会出现“AI搜索”入口,点击后出现...
02-17
2月18日消息,春节复工以来,焦点科技旗下中国制造网(以下简称“MIC国际站”)商机同比(按农历年同比)大涨49%,显示出中国外贸的强劲增长动力。平台数据显示,欧洲、大洋洲和南美洲市场...
02-18
2月16日消息,新春期间,快手快聘新春招工会再次引爆蓝领招聘市场,1月15日-2月12日活动期间,用户求职意愿激增,求职人数是去年的284%,超1000万用户通过视频直播求职。同时,平台撮合效...
02-17
3月8日消息,第115个“三八”国际劳动妇女节到来之际,京东互联网医院联合全国三甲医院妇科、皮肤科、精神心理科等领域权威专家,推出一系列健康关爱活动,通过线上线下结合的义诊...
03-09
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
曾为《上古卷轴》系列献声的资深游戏配音演员韦斯·约翰逊突发重病入院,其家人已在GoFundMe平台发起医疗费募捐。截至发稿时,该活动已筹得超5.2万美元(最初目标5...
01-31
根据《怪物猎人:荒野》日文官推透露,《怪物猎人:荒野》正式版仍然会像《怪物猎人:世界》一样,对玩家重新编辑角色外观进行收费。 在游戏发售时,官方会为为所有玩家免...
02-11
央视网消息:商务部数据显示,2024年,中国服务贸易实现快速增长,全年服务进出口总额首次突破1万亿美元,规模创下历史新高,结构持续优化,展现出广阔的发展潜力。2024年,中国全年服务进...
02-04
随着人工智能技术的迅猛发展,AI大模型“深度求索 DeepSeek”凭借其突破性进展迅速走红,各种“培训课”马上就来了。学习人工智能一定要付费吗?消费者如何甄别纷繁的网课?有消费...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮