解决传统架构记忆瓶颈 MiniMax发布新一代模型

10个月前 来源:新京报 观看:205

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。k2p即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。k2p即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。k2p即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”k2p即热新闻——关注每天科技社会生活新变化gihot.com

1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破了Transformer传统架构的记忆瓶颈。k2p即热新闻——关注每天科技社会生活新变化gihot.com

未来,AI智能体有望成为最重要的产品形态,由于智能体处理的任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。因此,长上下文能力与多模态处理能力的提升至关重要。k2p即热新闻——关注每天科技社会生活新变化gihot.com

技术上,MiniMax-01系列模型首次将线性注意力机制扩展到商用模型的级别,受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。从规模效应、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。相较于Gemini等一众全球顶级模型,MiniMax-01随着输入长度变长,性能衰减最慢。k2p即热新闻——关注每天科技社会生活新变化gihot.com

值得注意的是,MiniMax还开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。MiniMax方面表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”k2p即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-195-0.html解决传统架构记忆瓶颈 MiniMax发布新一代模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:深瞳丨AI为药物研发按下“快进键”

下一篇:丝巾变色、火柴变玫瑰 年货节期间淘宝魔术道具销量大增174%

为你推荐
美国物理学家阿瑟·阿什金因光镊操控技术获得2018年获诺贝尔物理学奖,让研究人员在微观世界中也可“抓得着”物体。这一研究为物理、生物和材...
01-21
美国研究人员开发出一个新的人工智能模型,经过大量数据的训练后,该模型能精确预测各种人体细胞内部的基因表达情况,将为生物和医学研究带来便利。这个...
01-27
图为新松机器人智慧产业园区内的工业机器人。记者 查金辉 摄  这个深冬,冰雪之下的辽沈大地涌动着一股...
01-23
  新春伊始,丹东港迎来粮食生产“开门红”,粮食船舶接续到港。丹东港散粮码头分公司全力抢船期、保生产...
02-17
>  近日,有网友在12306购票时发现,一些不是那么热门的行程出现了低价票。对此,12306科创中心负责人单杏花介绍,这是铁路在春运期间的一个惠民措施,一些客座率较低的车次票价...
01-21
图源:图虫创意 第二个5000亿县级市诞生了。1月6日,江阴市第...
01-21
  近日,丰田中国宣布雷克萨斯中国执行副总经理李晖升任总经理,这是丰田入华以来首次由非日本籍...
01-21
2 月 2 日消息,深蓝 S09 大六座 SUV 在上月(1 月 29 日)公布了部分座舱内饰细节,新车以“家庭智慧旗舰”为核心定位,首次搭载智能移动中岛与鸿蒙座舱 HarmonySpace。注意...
02-02
  1、《难哄》温以凡之所以拒绝桑延,是因为她经历了太多不幸的事情,在大伯家还遭到他人猥亵欺负,她在面对桑延时不再自信。  2、一系列不幸和痛苦的事情的发生,不仅让温以...
02-17
《六姊妹》房子给了谁?六姊妹大结局介绍‌《六姊妹》的房产最终给了何家喜‌。在大结局时,母亲刘美心将老宅过户给了何家喜,起因是因为何家丽。刘美心在退休后...
02-22
21世纪经济报道 记者季媛媛 广州 上海报道岁末年初,多家疫苗企业纷纷发布了2024年度业绩预告,从数据来看,“承压”成为一众国产疫苗巨头面临...
01-25
  新华社北京2月14日电(记者顾天成、侠克)13日,在国家儿童医学中心、北京儿童医院会诊中心,一位专家型AI儿科医生正式“上岗”,与13位儿科专家共同完成了一场疑难病例多...
02-15
  大众网记者 司心鹏 报道  为贯彻落实教育部、山东省《关于加强新时代教育科学研究工作的实施意见》,提高特殊教育教师教科研水平,促进特殊教育教师专业成长,2024年12...
01-21
  近日,在第三届全球数字贸易博览会上发布了首批全国农村电商“领跑县”典型案例,曹县是山东省唯一上榜者。文化自信是新时代的突出优势,也是新时代文化的鲜明标识。正是...
01-21
  今年以来,银行、理财子公司布局“理财夜市”热度持续。多家银行、理财子公司发布关于理财夜...
01-22
  新华财经北京1月21日电(郭洲洋、吴郑思)国内商品期货市场1月21日涨跌互现,其中集运欧线主力合...
01-23
每个人都有自己的喜好和偏好,而星座也可以给我们一些线索,帮助我们了解一个人的性格特点...
01-22
冷战是一种常见的情感处理方式,但对于狮子男他们往往更难以忍受这种冷漠的态度。如果你...
01-22
休闲衬衫搭配什么裤子和鞋子好看?一、休闲衬衫搭配什么裤子和鞋子好看?休闲衬衫搭配什么裤子 配阔腿牛仔裤 随着复古的阔腿裤回归,阔腿裤的搭配越来越灵活。 最常见的韩范妹子...
02-12
女生格子衬衫搭配什么裤子?一、女生格子衬衫搭配什么裤子?女生穿格子衬衫的时候,建议搭配纯色的裤子。比如说白色、乳白色、浅灰色和黑色以及藏青色的裤子。并且适合穿休闲直筒...
02-17
2月17日消息,抖音电商近日发布了关于打击网络水军的治理公告,从打击虚假流量的源头入手,保障消费者体验。公告显示,2024年,该平台共清理了160万个水军账号,日均拦截水军评论超250...
02-18
这下雷军真成“爽文”男主了。小米集团股价再创新高用网上的话说,50多岁,正值“当打之年”,是努力拼搏的好时候。2025年,56岁的雷军还在继续为梦想奋斗,并迎来了人生的高光时刻。...
02-20
2025年春节,在北京工作的95后女孩小苗没有回老家。大年初一这天晚上,她和母亲一起在云南大理古城参加篝火晚会,手牵手围着“科技篝火...
02-07
食材新鲜是餐食健康的重要因素。如今,宠物猫狗的一日三餐也“卷”向生鲜。2月的最后一个周末,主打宠物现制鲜食、冷藏鲜食和糕点的...
03-09
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
近日,美克生能源完成数亿元D+轮融资。本轮融资由北京市绿色能源和低碳产业投资基金(简称“北京绿色能源基金”)领投,北京未来科学城先进能源和智能制...
02-07
根据最新消息曝料,苹果即将推出的第四代iPhone SE(iPhone SE4)尺寸已被初步知晓。 消息称,这款“平民版”iPhone的尺寸将接近即将发布的iPhone 16,进一步打破了SE系...
01-25
Sagestone Games工作室制作并发行,一款多人联机沙盒生存冒险新游《德尔维瑞姆》序章免费试玩发布,本作支持中文。 《德尔维瑞姆》序章:Steam地址 《德尔维瑞姆...
02-10
北京时间2月1日,国际乒联在官网公布了2025澳门单打世界杯的参赛名额选拔办法。48个名额将分别由洲际杯赛和世界排名决定,其中每个大洲的洲际杯赛会产生4个名额(共20个名额),其余2...
02-02
极目新闻通讯员 李展鹏春运过半,东航武汉以高效运行和暖心服务交出一份亮眼答卷,截至2月1日,累计执行航班3200余班,运输旅客超44万人次,较2024年同期分别增长6.59%、10.42%;平均客...
02-03
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮