解决传统架构记忆瓶颈 MiniMax发布新一代模型

1年前 来源:新京报 观看:338

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。FXN即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。FXN即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。FXN即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”FXN即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。FXN即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。FXN即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。FXN即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”FXN即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
1月20日,国家能源局发布的“2024年全国油气勘探开发十大标志性成果”显示,2024年,国内油气产量当量首次超过4亿吨,连续8年保持千万吨级快速增长势头,“...
01-21
图源:pixabay1月17日晚间,思科瑞(688053.SH)发布公告称,公司收到四川证监局出具的《行政监管措施决定书》。据上述文件,思科瑞在2022年...
01-21
  近日,在金价飙升的背景下,售价只有足金产品十分之一的“金包银”引发各界关注,然而,看似标价更...
02-14
  近日,省农业农村厅发布《辽宁省蚕遗传资源保护名录》,经论证评估,鲁黄、黄安东、胶蓝等13个品种列入保...
02-18
图源:图虫创意 第二个5000亿县级市诞生了。1月6日,江阴市第...
01-21
东北第一城沈阳正全力冲刺“甲醇汽车第一城”。12月2日,沈阳市工业和信息化局发布了《关于加快沈阳市甲醇汽车生产及推广应用的若...
01-21
1 月 22 日消息,汽车媒体 ShortsCar 昨日(1 月 21 日)在 Instagram 上发布动态,抓拍到了现代 IONIQ 6 首批 P1 原型车的照片。这款流线型电动轿车改头换面,前脸重新设计,...
01-23
1 月 30 日消息,日本汽车媒体 Mag-X 昨日(1 月 29 日)发布博文,报道称由于 LS 轿车 2024 在日本销量不足 1500 辆,雷克萨斯考虑调整 LS 系列,替代推出三排七座混合动力 SU...
01-31
  《难哄》温以凡明明是喜欢桑延的,却在高考后背弃了跟桑延的约定,还用言不由衷的借口拒绝了桑延。《难哄》温以凡到底经历了什么?她为什么要拒绝桑延?   温以凡本来跟桑延...
02-18
《求婚告急》播出后受到了观众的喜爱和追捧,剧情讨论热度居高不下。以下是该剧的主要内容。主演为卡戎和孟璐,上线时间为11:00。题材属于女频-虐渣,可在微剧吧...
02-19
  记者从国家医保局了解到,12月1日,全国医保正式上线慢性阻塞性肺疾病、类风湿关节炎、冠心病、病毒性肝炎、强直性脊柱炎等5种门...
01-21
  记者1日从国家卫生健康委获悉,2025年至2027年被确定为“儿科和精神卫生服务年”,同时,国家卫生健康委公布了2025年全系统为民服务的八件实事。  据介绍,在2025年至2...
01-21
  大众网记者 司心鹏 通讯员 刘振 盛凤娟 报道  近日,2024年职业院校技能大赛各赛项圆满收官,山东水利职业学院在本年度赛事中表现卓越,成绩斐然。在世界职业院校技能大...
01-21
  今天,我们参观了浐灞公安局,我了解了执法办案的过程。1:警察对嫌疑人进行人身安全检查;2:对身高体重身体做全面检查;3:会带着嫌疑人员进行审讯,审讯室分成年和未成年审讯室; ...
01-21
  近日,中央金融办、中国证监会、财政部、人力资源和社会保障部、中国人民银行、金融监管总局...
01-24
  根据日程安排,2月11日,美联储主席鲍威尔将出席美国参议院金融委员会的听证会,就半年度货币政策...
02-11
每个人都有自己的星座,而星座之间的相互作用常常引起人们的好奇。其中,巨蟹男是一个温柔...
01-22
金牛座的男生通常被认为是稳重、务实的代表,他们对感情非常认真,但有时候也会故意气你。...
01-22
魅力与风格并存:男模特如何征服T台走秀当我第一次走上T台,看着千百双眼睛注视着我,那一刻的紧张与兴奋交织在一起。场下的闪光灯、一阵阵掌声、还有设计师们期待的眼光,几乎每一...
02-07
婴童文案? 洛阳婴童国际儿童摄影现在叫什么?婴童文案?在生产婴童用品时厂家一定要保障产品的质量,和材质的选用,因为婴童太小,皮肤及各个器官还没长成熟,所以为了孩子健康要确保产...
02-07
2月7日消息,秦皇岛津峰线缆制造有限公司(以下简称:津峰线缆)董事长韩金良一行日前到访涂多多。现场,涂多多副总裁、跨境产发部常务副总经理郑德莲与津峰线缆副总经理韩冬共同签署...
02-07
2月14日消息,中农网近日正式发布面向实际工作场景的智能助手AI小易(内测版),并完成满血版DeepSeek-R1与智能助手AI小易的接入。经过多次训练,AI小易已经具备了多文体写作支持、数...
02-14
2月7日消息,Lyft与AI初创公司Anthropic达成合作,为该打车平台的客户服务增加人工智能工具。合作的第一阶段已在进行中,并为客户带来了成果。Lyft通过AmazonBedrock将Claude整合...
02-08
2月12日消息,携程集团公告称,由百度集团提名任命的董事何俊杰已辞任公司董事职务,并于2025年2月11日生效。百度集团执行副总裁罗戎,已获委任于何俊杰离职后继任为携程集团董事。...
02-13
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
在今早的Xbox开发者直面会上,Xbox在直播过程中发布了《忍者龙剑传2》的发售宣传片,但网友发现直播的Xbox版预告遭到了和谐,本该露出性感女性的画面被无故掐掉,而PS...
01-27
在经历了《质量效应:仙女座》和《圣歌》这两款彻底失败的游戏后,《龙腾世纪:影障守护者》的开发商BioWare亟需这款游戏大获成功。尽管它广受许多玩家喜爱,但最终还...
02-02
极目新闻评论员 石平2024年11月26日,小米集团首座智能家电工厂的奠基开工仪式在武汉举行,小米创始人——仙桃人雷军在湖北投资,成为湖北人津津乐道的话题,也激发了众多湖北人回...
02-04
据参考消息网援引俄新社2月5日报道,世界黄金协会发布的数据显示,去年俄罗斯居民的黄金购买量创下2013年以来最高纪录,并且首次跻身全球黄金消费量前五名。而中国人连续第12年在...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮