解决传统架构记忆瓶颈 MiniMax发布新一代模型

1年前 来源:新京报 观看:265

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。1MP即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。1MP即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。1MP即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”1MP即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。1MP即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。1MP即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。1MP即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”1MP即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
  IT之家1月15日消息,TheVerge今日报道,微软悄然撤下了其仿冒谷歌搜索的界面,该界面此前被用于让...
01-21
中国科学院紫金山天文台1月16日晚通报,国际小行星中心于当日发布了由该台近地天体望远镜观测发现的一颗新彗星C/2025 A3 (Tsuchinshan)。这也是紫金...
01-21
  据广州铁路警方通报,春运大幕开启,随着客流节节攀升,广州南站安检口查获不少禁止携带上车的行...
01-21
  我省扩内需、促消费再迎政策加码。近日,省商务厅、省发展改革委等九部门联合印发《关于促进服务消费...
02-18
新华社北京1月21日电(记者张辛欣、张晓洁)工业和信息化部副部长张云明在21日国新办举行的“中国经济高质量发展成效”系列新闻发布会上表示,我国已有570多家工业企业入围全球研...
01-22
2 月 2 日消息,上汽通用别克品牌宣布别克 GL8 陆尊 PHEV 八方来财版上市。该车以“八方来财”套件形式提供,GL8 陆尊 PHEV 全系款型均可免费选装(限量 888 辆)。作为比...
02-02
2 月 7 日消息,在福特 2024 年财报电话会议上,首席执行官吉姆・法利向媒体坦言,全尺寸电动或增程电动汽车并不是拖车的理想选择。他说:“它并不完美。如果你需要拖车,这...
02-07
电视剧《六姊妹》自开拍以来就备受关注,粉丝们对第28集的剧情尤为好奇。在这一集中,何家丽认为四妹何家欢的事业正处于上升期,不应为离婚而消沉,并且她对张秋林...
02-21
电视剧《难哄》中的钟思乔职业成为了近期热门话题。该剧开拍前就吸引了大量粉丝,随着剧集播出,更多观众加入粉丝群体,对剧情充满期待,并对钟思乔的职业感到好奇...
02-22
  编者按:春节临近,年味愈浓。红彤彤的糖葫芦,酸甜交织的滋味在舌尖绽放;家中盛放的年宵花,寄托着...
01-23
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局药审中心发布《地中海贫血基因治...
02-10
中新网上海1月22日电(记者陈静)记者22日获悉,在中医“瘀血理论”指导下,结...
01-23
上海市科学学研究所研究员李辉为华东师范大学应用伦理专业研究生授课。受访者供图“只有完善多学科协同...
01-22
  摘要  【开年显著回升!PX能否扭转颓势?】PX作为聚酯产业链中关键的原料之一,在整个产业链中...
01-28
  本报记者 冷翠华 见习记者 杨笑寒  2024年四季度偿付能力报告陆续披露,非上市财险公司的“...
02-11
当双鱼男第一次见到巨蟹女时,他会展现出一系列特定的表现。这些表现可以帮助我们更好地...
01-22
水瓶座的男人通常具有独立、聪明、理性和创新的特点。他们对于自由和个人空间非常重视...
01-22
探索幻走服饰:蕴含个性与时尚的潮流选择在瞬息万变的时尚潮流中,服饰不仅是对外形象的展示,更是个性化风格的体现。今天,我想和大家聊一聊一个备受关注的服饰品牌――幻走服饰。...
02-07
橙色裙子怎么搭配图片欣赏?一、橙色裙子怎么搭配图片欣赏?浅橙色与白色搭配  浅橙色是橙色中加入了较多的白色,给人一种甜腻腻的感觉。与白色搭配,清新亮丽,美丽脱俗。更有阳光...
02-12
小米集团市值冲上万亿赛道自蛇年开工以来,小米股价一路飙升,小米集团市值冲上万亿赛道,仅仅上市7年小米就实现了万亿的跨越,作为创始人的雷军也迎来了高光时刻。具体来看,2025年2...
02-09
2月14日消息,中农网近日正式发布面向实际工作场景的智能助手AI小易(内测版),并完成满血版DeepSeek-R1与智能助手AI小易的接入。经过多次训练,AI小易已经具备了多文体写作支持、数...
02-14
2月4日消息,携程发布《2025年春节旅游总结报告》,报告显示,超半数游客集中在初五、初六返程,8天假期的灵活性也让不少游客选择延长旅途,节后错峰返程。跨境游整体订单同比去年增...
02-07
2月27日消息,京东外卖宣布推出“10元/20元餐补随机领”优惠活动,用户每晚8点即可随机领取“满15元减10元”“满40元减20元”两种大额餐补优惠券,首批覆盖通过京东认证的大学生...
03-01
1月18日,游族网络2025年会“U-nite U-show——游秀之夜”在上海西岸穹顶艺术中心成功举办。本次年会主题意为“聚在一起,秀出自己”,一方面象征着这是以每位优秀的游族人为主角...
01-21
根据一份流传到网上的内部公告,1月24日,完美世界开除了百万工作室四人,其违规行为包括在素材制作外包管理方面玩忽职守,构成严重失职;利用公司资源、谋取利益,涉及金额巨大;内外相...
02-09
据法国媒体报道Les Echos报道,育碧和沙特公司Savvy Games Group达成合作关系,这可能让发售两年的《刺客信条:幻景》迎来DLC。 报道称育碧之前对《刺客信条:幻景》...
01-27
任天堂的初代Switch(Nintendo Switch或简称NS)在近日收获了累计销量超过1.5亿台的傲人成绩,不过任天堂方面也承认2024年未能实现NS的销售目标,为此还调低了财年总...
02-06
南极秦岭站是新时代我国建成的第一个常年科考站,今天(2月7日)是秦岭站开站一周年的日子。这座最新的考察站目前的建设进展怎么样?目前,中国第41次南极考察队已经高效完成了全部卸...
02-07
2月8日,哈尔滨亚冬会自由式滑雪女子U型场地技巧决赛,中国选手李方慧、张可欣包揽金银牌!中国选手李方慧凭借第三轮95.25分的成绩夺得金牌,这是中国代表团在哈尔滨亚冬会夺得的首...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮