解决传统架构记忆瓶颈 MiniMax发布新一代模型

10个月前 来源:新京报 观看:199

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。xxO即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。xxO即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。xxO即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”xxO即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。xxO即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。xxO即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。xxO即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”xxO即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
“成功!”1月9日,伴随着最后一个控制开关被合上,宽敞明亮的集控室内爆发出热烈的掌声与欢呼声,中国能建主体投资建设的全球首座300兆瓦(MW)压气储能示范...
01-21
AI智能体,或将成为2025年的关键词之一,国内外厂商激战正酣,探索其能为千行百业带来的变化。但对数据安全的忧虑也浮出水面。有多少交互的工作内容会上...
01-21
  来自公安部交通管理局的消息显示:春节期间(截至2月4日18时),全国道路交通安全形势总体平稳,未接...
02-05
  中国自然资源部北海区海洋预报台9日发布的监测数据显示,当日,辽东湾海冰面积达10018平方公里,三分之一...
02-11
  春运期间,乘坐高铁动车组列车时,您会看到在座位上方、行李架的下方有一串圆点状指示灯,分为红、绿、黄三种颜色。这些指示灯是干什么用的?不同颜色指示灯代表什么意思?掌...
01-21
  日前,爱奇艺推出的热播剧《漂白》陷入抄袭风波,在网络引发热议。  1月20日,一篇名为《爱奇艺的<漂白>把南方都市报的<漂白>‘漂白’了》的文章引起关注。  文章作者...
01-22
1 月 21 日消息,据中国汽研今日消息,《智能网联汽车交通事故保险赔偿判定技术规范》团体标准启动会近日在北京召开。平安财险、太平洋财险、中国人寿财险等 20 余家保...
01-21
1 月 27 日消息,1 月 26 日,赛力斯集团股份有限公司与北京航空航天大学战略合作框架协议签约仪式在重庆举行。根据协议,双方将在新兴产业领域的基础研究和产品开发的实...
01-27
随着电视剧的热播,“难哄温以凡在大伯家遭遇了什么”引起了广大粉丝的关注。该剧凭借精彩的剧情、精良的制作和精湛的演技,一经播出便受到观众的一致好评,并拿...
02-20
《重症外伤中心》一经播出便迅速登上各大平台的热门榜单,吸引了众多观众的关注。这部电视剧中,白江赫医生在医疗事故后遭受误解与危机的故事引起了广泛讨论。...
02-22
  如今在城市的大街小巷,不同类型的口腔治疗机构随处可见。这么多的口腔诊所对于消费者而言,是意味着享受更多优质医疗服务呢?还是...
01-21
21世纪经济报道记者季媛媛 上海报道 2025年,DeepSeek火爆出圈。借力DeepSeek技术的加持,人工智能(AI)技术正深度重塑医药健康行业格局。当下,...
02-18
  2025年1月20日,“霓裳万象”首届高校汉服设计大赛在陕西西安唐乐宫圆满收官,观众们在颁奖典礼现场欣赏了由参赛者和表演者共同呈现的诗画汉服国风大秀,感受华章之美、国风...
01-21
  今天我们来到了公安局浐灞分局。警察叔叔先带我们参观了他们审讯的地方。警察阿姨还教给我们很多在野外保护自己的知识。最后我们还进行了射击体验。  射击体验让我...
01-21
  春节临近,多家理财公司发售“春节档”理财产品。记者走访北京地区银行网点发现,多家银行已上...
01-22
  中国网财经1月21日讯 2024年12月权益市场震荡上行,资产管理标品信托市场的产品发行数量环比...
01-23
天蝎座的男生通常都很神秘、独立而又有魅力,他们对感情非常认真,因此要想让一个天蝎男心...
01-22
巨蟹座是一个温柔、敏感且充满爱心的星座,他们对家庭和情感非常重视。因此,与哪个星座最...
01-22
选一个大气的饰品店名字,让你的品牌脱颖而出在开设一家饰品店的时候,给店铺取个好名字是至关重要的。一个大气的名字不仅能吸引顾客的目光,还能传达出你的品牌理念和品质。作为...
02-12
加拿大户外运动品牌排行榜?1、TheNorthFace北面  品牌创立时间:1966年  北面是1966年创立于美国的全球知名户外运动品牌,专注于为全球户外运动爱好者提供户外服装、背包、...
02-17
2月7日消息,震坤行宣布旗下AI产品:AI物料管家已接入DeepSeek V3模型,用户可以在处理海量物料数据清单时自主选择使用,至此将为企业在物料梳理相关工作环节带来更多改善。图源:震...
02-08
京东做外卖,佣金引热议互联网行业,又将掀起一场腥风血雨。最近,社交平台上传出“京东外卖以只抽5%的佣金的旗号上线,美团降低高佣金应对”的帖子。对此,有媒体从美团方面确认,网传...
02-11
2月10日消息,美团外卖发布《年轻人春节送礼报告(2025)》,2025年春节期间,美团平台上“春节送礼”搜索量同比增速达165%,外卖餐饮礼券赠送量环比节前增长120%。其中95后消费者占比...
02-11
2月22日消息,第十四届公益节暨2024ESG影响力年会奖项评选结果近日正式公布,享道出行申报的“请帮我回家”项目摘得“2024年度公益项目奖”。“请帮我回家”是享道出行聚焦儿童...
02-23
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
加州大学欧文分校2023年的一项研究《茫然与困惑:关于reCAPTCHAv2的大规模真实用户研究》得出结论,验证码不仅在实际阻止机器人流量方面效果不佳,还通过追踪cookie...
02-10
不知大家发现没有,我们在晚上做决定的时候,总会“大胆”很多,但第二天醒来不免会懊恼。这种到了晚上更易做出冲动决定的现象,在心理学上叫“深夜效应”。 白天大...
02-10
极目新闻记者 梁传松通讯员 倪婷婷2月2日,湖北省阳新县王英镇飘起了细雨,延绵起伏的山峦间云雾升腾、氤氲缭绕,仙岛湖生态旅游风景区管理处党委书记、主任,镇党委书记孔祥鹏带队...
02-03
据西安头条2月5日消息,陕西省第十一届人大常委会副主任,陕西省政府原副省长,陕西省总工会原主席党组书记,著名作家白阿莹同志因病医治无效,于2025年2月5日9时56分在西安逝世,享年7...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮