解决传统架构记忆瓶颈 MiniMax发布新一代模型

1年前 来源:新京报 观看:288

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。7oI即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。7oI即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。7oI即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”7oI即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。7oI即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。7oI即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。7oI即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”7oI即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
  IT之家1月12日消息,近年来,英伟达(Nvidia)凭借其在人工智能和图形处理领域的领先地位,迅速崛起为...
01-21
在信息化浪潮席卷全球的时代,数据毋庸置疑已成为推动科技与商业发生深刻变革的核心力量。每一个看似微不足道的数据,实际上都蕴藏着令人难以想象的无...
01-25
  2025年春运于1月14日正式启动。当日,记者从省公安厅交管局举行的新闻发布会上获悉,全省公安交管部门...
01-21
  我国铁路实行“实名购票”政策,旅客在购票、进站、乘车等环节都需要刷身份证。返程途中,旅客...
02-08
新闻记者 康旭阳 通讯员 沈商轩实习生 何世银1月21日,全国手机、平板、智能手表(手环)购新补贴政策实施暨“年在荆楚 巳巳如意”湖北新春消费季启动仪式在武汉举行。新闻记者获...
01-22
  编者按:2024渐行渐远,2025源源而来。各行业如何应变局,如何开新局?中新经纬广邀经济学者,梳理过去关键事件,展望新年潜在机遇,以期为您提供有价值的参考。  中新经纬1月20日...
01-21
1 月 21 日消息,东风日产今日公布纯电轿车 N7 的全新配色 —— 墨海蓝色。上周,该车已经公布了五种配色,分别为流光银、霜雪白、燕麦米、黑色以及青色,加上此次公布的墨...
01-21
2 月 2 日消息,深蓝 S09 大六座 SUV 在上月(1 月 29 日)公布了部分座舱内饰细节,新车以“家庭智慧旗舰”为核心定位,首次搭载智能移动中岛与鸿蒙座舱 HarmonySpace。注意...
02-02
《难哄》段嘉许什么时候爱上桑稚的?段嘉许和姜颖的关系是怎样的?一开始,段嘉许因为和桑稚哥哥桑延是朋友,又受桑家照顾,把桑稚当作妹妹看待。桑稚13岁时两人相识...
02-19
随着电视剧的热播,“夜魔侠重生上映时间是什么时候”这一话题逐渐吸引了众多粉丝的目光。该剧播出后,凭借其精彩的剧情、精良的制作和演员们的精湛表演,赢得了...
02-21
21世纪经济报道记者 闫硕 北京报道原研仿制之争已然“破圈”,成为社会各界热议的话题。近日,在一场同学聚会上,众人向21世纪经济报道记者抛出...
01-31
21世纪经济报道记者 闫硕 北京报道脑机接口领域再传利好消息。2月10日,据阶梯医疗StairMed微信公众号,近日,阶梯医疗宣布完成3.5亿元人民币B...
02-13
  大众网记者 杨涛报道  近日,2024年山东省“技能兴鲁”职业技能大赛暨第五届山东省汽车服务行业职业技能竞赛在青岛港湾职业技术学院成功举行。“技能兴鲁”职业技能...
01-21
日前,辽宁大学马克思主义学院与沈阳“九·一八”历史博物馆共建活动在辽宁大学崇山校区图书馆学术报告厅...
01-21
  摘要  【碳酸锂价格节后维持“震荡”业内人士:今年一季度或上演“躁动”行情】对于锂行业...
02-06
  摘要  【证监会重磅!13处提及期货解读来了】《关于资本市场做好金融“五篇大文章”的实施...
02-08
金牛座的男生通常被认为是稳重、务实的代表,他们对感情非常认真,但有时候也会故意气你。...
01-22
巨蟹座是一个温柔、敏感且充满爱心的星座,他们对家庭和情感非常重视。因此,与哪个星座最...
01-22
童装拿货术语? 童装术语有哪些?一、童装拿货术语?一手,五手,十手,二十手,一手是五件衣服二、童装术语有哪些?童装术语有:尺码:童装尺码一般以年龄、身高、胸围等作为购买标准。连身衣:...
02-07
穿貂怎么搭配围巾图片欣赏?一、穿貂怎么搭配围巾图片欣赏?个人觉得貂皮本身就有厚重感,搭配围巾不是很适合,可以搭配轻质的丝巾。搭配如果艳丽一点可以选择正红色;肤色白的话可以...
02-17
2月9日消息,抖音商城情人节活动日前正式启动,2月8日-14日,抖音电商将投入海量的流量激励和用户补贴,鼓励商家达人赢得春节后业绩的快速恢复和爆发增长。本次大促活动依托平台全...
02-09
2月8日消息,京东工业近日与永冠新材签署战略合作协议。双方将依托京东工业自营供应链合作模式,共同拓展市场、提升品牌影响力,携手为广大工业企业用户带来更便捷、更专业的胶粘...
02-09
中国火锅品牌正在逐步打开中东市场的大门。近年来,刘一手、海底捞、小龙坎、哥老官等在中国各城市常见的连锁火锅品牌,纷纷进入中东...
03-01
大清洗来临。1.抖音生服重拳出击,违规商家被处理在抖音,每天都有近200万条探店视频涌向6亿消费者。有人被种草了一碗麻辣烫,有人下单了人生第一次医美,但也有人掉进“9.9元低价...
03-01
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
扬州无界矩阵科技有限公司(简称“无界矩阵”)近期以亿级估值完成超千万元天使轮融资,本轮融资由力合金融领投。无界矩阵是一家成立于2024年的人工智...
02-07
近日武侠电影《笑傲江湖》角色海报发布。天下英雄各展身手,谁能最终问鼎武林?江湖恩怨诸多是非,还请诸君敬请期待! 《笑傲江湖》电影将于1月28日(除夕)在腾讯视频...
01-25
《堡垒之夜》服务器即将迎来重大升级!据报道,Epic Games正在三个新地区测试服务器,此举将显著改善玩家体验。此次升级将影响数百万休闲与竞技玩家。此外,预计该开...
02-01
极目新闻记者 张秀娟 2月5日上午9时10分许,武汉市民之家企业开办综合办事窗口,工作人员将崭新的营业执照交至武汉国有资本投资运营集团有限公司办事人员彭艳丽的手中。这是武...
02-05
随着人工智能技术的迅猛发展,AI大模型“深度求索 DeepSeek”凭借其突破性进展迅速走红,各种“培训课”马上就来了。学习人工智能一定要付费吗?消费者如何甄别纷繁的网课?有消费...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮