解决传统架构记忆瓶颈 MiniMax发布新一代模型

1年前 来源:新京报 观看:272

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。v5Y即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。v5Y即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。v5Y即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”v5Y即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。v5Y即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。v5Y即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。v5Y即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”v5Y即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
  科技日报记者 刘霞  据物理学家组织网16日报道,德国基尔大学科学家研制出一款新型人工智能...
01-21
技术进步是降低人工智能应用门槛的关键。这有待加大科研投入,强化自主研发能力,在智能芯片、操作系统等关键领域取得更多突破。夯实算力、算法、数据...
01-27
  1月21日下午3点,在辽宁省营口市鲅鱼圈区的辽港集团营口港47号泊位,“信风安庆”轮在进行粮食装船作业...
01-24
元宵佳节来临本想着美美出门赏灯玩耍可恶劣天气却来“搞事情”2月11日夜间到12日小雪、大风......这些...
02-12
新闻通讯员 木子春运承载着亿万游子对家乡的眷恋与期盼,春节的脚步近了,归心似箭的人们纷纷踏上返乡之路。据交通运输等部门预计,今年春运全社会跨区域人员流动量将达到90亿人...
01-22
  上海外国游客消费额激增,“韩流”何以转为“韩金量”  作者:缪琦  1月中旬,也即刚刚过去的周五夜间5点左右,位于上海南京路步行街的“很久以前”羊肉串店内已经坐满了头...
01-21
[本站 资讯] 日前,小米YU7实车图再度曝光,这组实车图展示给我们新车的更多细节,新车定位为中大型SUV,售价预计会在30-40万之间,并将在2025年6月-7月份正式上市。此次最新...
01-24
2 月 3 日消息,据 Carscoops 报道,近日一位福特 Mustang Mach-E 车主在驾驶其电动跨界车时,仪表盘突然显示“立即安全停车”的警告信息,随后车辆完全失去动力,停在停车场...
02-04
《余烬之上》美华姐是幕后黑手吗?美华姐是好人还是坏人?《余烬之上》中,美华姐(戚美华)是幕后黑手‌。在剧情发展中,廖知白逐渐揭开了大火背后的种种秘密,最终发现...
02-21
《余烬之上》男主是谁啊?余烬之上背后的boss是谁?‌《余烬之上》的男主角是王子奇和孙阳。‌王子奇饰演的廖思远是一个天才破案少年,因童年创伤患上“解离性人...
02-21
21世纪经济报道记者林昀肖 北京报道 近日,全国中成药联合采购办公室发布第三批全国中成药采购联盟集中采购中选结果。此次中成药集采由湖...
02-13
关于实施2025年卫生健康系统为民服务实事项目的通知国卫办函〔2025〕25号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、中医药局、...
02-14
  大众网记者 张明明 报道  7月27日至31日,由教育部高等教育司指导、中国高等教育学会主办的第四届全国高校教师教学创新大赛在成都举行,校(院)临床与基础医学院(基础医学...
01-21
当学校的铃声渐渐沉寂,社区的活力却悄然绽放。沈阳市珠江五校教育集团与社区携手,共同编织了一场别开生面...
01-21
  中国网财经2月7日讯 截至上月中旬,已有51家信托公司披露2024年未经审计业绩数据。数据显示,信...
02-08
  “春节后,豆粕一天一个价,今天就涨了300元(每吨)。”提及近期豆粕价格情况,广东一家中型饲料企业...
02-13
双鱼座的男生通常是浪漫、敏感且富有想象力的人。他们渴望与一个特别的女生建立深厚的...
01-22
天蝎座的男生通常都很神秘、独立而且有着强烈的自我保护意识,所以要追求他们并不容易。...
01-22
蓝色条纹衬衫搭配什么马甲?一、蓝色条纹衬衫搭配什么马甲?搭配蓝色牛仔马甲特别匹配,这样的组合特别统一特别有套装的高级感,搭配黑色水洗布马甲也非常协调,黑色百搭经典有低调大...
02-07
时尚与舒适并存:中老年女性的麦子熟了服饰选择每到初夏,田野间的麦子泛着金黄的光辉,仿佛在预告着丰收的季节。这不仅是个农忙时节,也是一个为爱美的中老年女性挑选合适服饰的好...
02-07
1月20日消息,猎芯近日与深圳市矽睿半导体有限公司(以下简称:矽睿半导体)达成授权代理合作。矽睿半导体全系列产品已上线至猎芯网平台商城,含磁传感器、电源管理、锂电池保护芯片...
02-07
2月15日消息,快手电商女装亲子行业近日开启“春日焕新季”。活动分三个阶段,第一阶段从2月13日至19日,将为商家带来商家端和用户端补贴、流量激励、新品扶持、磁力金牛对投、短...
02-16
图片来源:图虫创意 2月17日,本土高端女装品牌JORYA卓雅母公...
02-19
2月25日消息,平安健康日前推出名医AI助理服务“平安芯医”,全面开放AI辅助专家7*24小时健康咨询服务。该数字人作为真实医生的数字分身,依托数字人技术和医学大数据支撑下的AI...
02-26
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
近日Havock游戏引擎发布了重大更新,引入全新的动态破坏技术。Havock还发布新的技术视频,展示了使用该技术后的逼真动态画面,看起来很酷。 视频欣赏: 动态破坏技...
01-31
四川资中一小孩因燃放鞭炮引起的沼气燃爆,致使8辆汽车受损一事,引起网友热议。 因为受损车辆包括林肯、雷克萨斯、奥迪、保时捷等豪华品牌,事件发生后,网上出现多...
02-03
外交部发言人宣布:应国家主席习近平邀请,巴基斯坦伊斯兰共和国总统阿西夫·阿里·扎尔达里将于2月4日至8日对中国进行国事访问。...
02-03
极目新闻通讯员 凌丽万“巳”大“集”闹新春,非遗技艺过大年。2月3日,正月初六,又恰逢二十四节气之首“立春”,为庆祝首个“非遗版”春节,弘扬中华优秀传统文化,寄托岁首美好期盼,...
02-04
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮