价格战凶猛，AI小模型狂飙

4个月前来源：观看：29

　　价格战凶猛，AI小模型狂飙 　

　　21世纪经济报道记者孔海丽、实习生刘清怡北京报道

　　AI小模型大爆发，成为AI巨头的新角力赛场。

　　大模型价格战“卷生卷死”，投入了巨额资金的AI企业，亟需在商业故事上再进一步，最近纷纷祭出了自家低成本、易部署的小模型，新一轮较量拉开。

　　先是HuggingFace发布了SmolLM - 135M、360M和1.7B，仅使用650B个token进行训练，性能却超过了Qwen 1.5B、Phi 1.5B。

　　隔日，Mistral AI和英伟达联合发布Mistral NeMo，被称为“Mistral AI最佳小型模型”，易于使用，可以直接替代任何使用Mistral 7B的系统。

　　就在同一天，OpenAI下场“血拼”，推出了GPT-4o 的迷你版――GPT-4o Mini，称这款新模型是“功能最强、性价比最高的小参数模型”，并将其作为展示模型，替换了GPT-3.5的网页版“台前”位置。

　　苹果也不甘示弱，与OpenAI同日发布了DCLM小模型，并且发布即开源。苹果ML小组研究科学家Vaishaal Shankar说“这是迄今为止性能最好的真正开源的模型”。

　　这些模型参数小、占内存少，在特定场景中，经过精调后使用效果可以媲美大模型，成为性价比之选。

　　“小模型一定是更容易实现价值的。”IBM中国数据与人工智能首席架构师徐孝天在接受21世纪经济报道记者采访时表示：“一批专业小模型配合agents实现业务流的整合，功能和经济性上都会更加可行。”

　　在AI生成式模型战场上，迭代速度极快，可能今天的“最好”，马上就会被明天的新版本打败，“历史记录”不断被颠覆重写。“模型更新太快，都不好评判，前脚有厂商说自家是‘最大最好的’，后脚就有另外一家说自己是‘最小最好的’。”人工智能行业资深观察人士告诉21世纪经济报道记者，人工智能模型眼花缭乱，AI企业要想跑通商业故事，必须十倍、百倍努力。

　　小模型赛道开“卷”

　　AI巨头们密集发布小模型，既比性能，还拼价格。

　　根据Open AI官网，在MMLU、MGSM、HumanEval、MMMU等基准测试中，GPT-4o mini均展现出了比GPT-3.5 Turbo和Gemini Flash、Claude Haiku等小模型更加出色的文本和视觉推理、数学推理、编码和多模态推理能力，尤其是数学推理和编码能力远胜过GPT-3.5 Turbo和其他小模型，稍弱于GPT-4o。在最新的LMSYS盲测竞技场排名中，GPT-4o mini还取得了与GPT-4o并列第一的好成绩，连OpenAI的CEO Sam Altman也难掩激动的心情，在社交媒体平台上发文称，“我们从未对任何一项评估感到如此兴奋。”

　　除了优异的性能，OpenAI还拿出了低价杀手锏。7月18日上线时，OpenAI宣布GPT-4o mini的定价为每百万输入token15美分和每百万输出token60美分，比GPT-3.5 Turbo便宜60%以上。7月24日，OpenAI再次宣布，从即日起至9月23日，免费为4级、5级用户提供GPT-4o mini微调服务，每天限制200万token，超过的部分按照每100万token3美元收费。OpenAI称：“我们期待GPT-4o mini将扩大人工智能的应用范围，使人工智能更加实惠。”

　　平安证券研报认为，GPT-4omini是价格显著下降的新一代入门级别人工智能“小模型”，兼具性能与性价比。当前全球范围内的大模型逐渐呈现由单方面的性能角逐，转向性能与实用性并重的发展趋势。大模型能力达到一定水平时必然会走向应用，大模型厂商通过提升其产品性价比，助推下游应用端的推广部署，有望加速大模型产业链商业闭环的形成。

　　在GPT-4o mini之后发布的苹果DCLM模型同样引人瞩目，DCLM全面开源了代码、权重、训练流程及数据集。DCLM分为14亿和70亿参数两种规模，其70亿参数版本超越了Mistral-7B ，性能接近Llama 3、Gemma。在MMLU(5-shot)基准测试中，DCLM-7B的准确率为63.7%。根据研究人员的说法，这一性能比此前最先进的开放数据语言模型MAP-Neo提高了6.6%，并减少了40%的计算量。更重要的是，这一结果超越了准确率为62.7%的Mistral-7B-v0.3，并接近于准确率为64.3%的Gemma 8B、66.2%的Llama3 8B和69.9%的Phi-3 7B。

　　比起“越大越好”，苹果更倾向于走小模型路线。今年4月，苹果公布的小模型家族四款预训练的大模型OpenELM，体量极小，彼时已在朝着“让人工智能在苹果设备上本地运行”目标迈进。

　　6月，苹果曾透露自己的AI发展路线图，计划把小模型顺利嵌进移动装备，不仅能达到“更快速、更安全”的目的，还一举解决了移动端设备与模型融合的终极难题。

　　Mistral NeMo是Mistral AI与NVIDIA合作构建的，该模型经过先进的微调和对准阶段，在遵循精确指令、推理、处理多轮对话和生成代码方面表现优异。据了解，Mistral NeMo主要面向企业环境，目的是让企业在不需要大量云资源的情况下实施人工智能解决方案。

　　在接受Venturebeat采访时，英伟达应用深度学习研究副总裁 Bryan Catanzaro 详细阐述了小型模型的优势。他说：“小型模型更容易获取和运行，可以有不同的商业模式，因为人们可以在家中自己的系统上运行它们。”

　　大模型进入下半场，从技术卷到应用，市场对于更易本地部署的高效率、低成本模型越来越感兴趣，这背后折射了对安全性、隐私性以及高效率、高性价比的渴望。

　　行业分析师认为，AI部署有了一个明显的新趋势，即可以在本地硬件上高效运行的模型，正在打消许多企业大规模采用AI方案的担忧，比如数据隐私、延迟以及高成本等问题。“这可能会使竞争更加公平，资源有限的小企业也将获得AI模型的加持，从而弥合与大企业之间先天的差距。”

　　入局小模型赛道背后

　　AI巨头们为何纷纷开辟小模型赛道？部分或出于成本因素的考量。

　　大模型的开发和运行成本高昂，即使像OpenAI这样的巨头也难以负担得起。

　　近日，有知情人士分析称“OpenAI今年可能会亏损50亿美元，面临着在12个月内资金耗尽的风险”。截至今年3月，OpenAl花费近40亿美元租用微软的服务器，以运行ChatGPT及其底层大语言模型(LLM)。除了运行ChatGPT之外，OpenAl包括数据费用在内的培训成本今年可能会飙升至30亿美元。据知情人士透露，去年，OpenAl加快了对新AI的训练，速度超过了最初的计划，OpenAl原本计划在这类成本上花费约8亿美元，但最终的支出要多得多。

　　相较之下，小模型成本低、响应速度快，而且可以本地化运行，更能适应个性化、精准化的使用需求。业内人士表示：“在全球AI硬件供不应求的前提下，小模型意味着更低的部署和训练成本，其产出效果足以应对一些特定任务。”

　　有国内AI企业相关业务负责人告诉21世纪经济报道记者，小参数规模可以大幅节省推理成本，模型训练与调整所需的硬件成本远远低于大模型，成熟开发者甚至可以低成本训练垂直模型，这些操作的成本都远低于大模型。

　　OpenAI创始成员、特斯拉前AI高级总监Andrej Karpathy最近的预测颇有代表性，他提出，生成式模型的尺寸竞争将会逆转，比拼谁的模型更小、更智能。

　　在Andrej Karpathy的解释中，当前大模型如此之大，是因为训练期间仍然非常浪费，虽然大模型在记忆方面非常出色，但这也意味着大模型记住了大量无关紧要的细节，而那些内容本不应该在特定问题中反复被调用。

　　对于小模型来说，训练目标变得更简单、直接、高效，让AI更直接地学到更有用的信息。

　　不过，大模型与小模型并非“二选一”，他们的发展路线仍然有着相互借鉴的意义。

　　Andrej Karpathy称：“模型必须先变大，然后才能变小。因为我们需要大模型将数据重构、塑造成理想的形式，一个模型帮助生成下一个模型的训练数据，逐渐得到完美的训练集，再喂给小模型，而后者不需要完全记住所有的知识，只是偶尔需要查找一些东西以确保准确。”

　　李彦宏也曾在百度AI开发者大会Create 2024上表示，未来大型的AI原生应用基本都是Moe架构，即大小模型的混用。李彦宏还称，通过大模型压缩蒸馏出一个基础模型，然后再用数据去训练，比从头开始训练小模型的效果要好很多，比基于开源模型训练出来的模型效果更好，速度更快，成本更低。

点击展开全文

本文链接：http://www.gihot.com/news-4-72529-0.html价格战凶猛，AI小模型狂飙

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：价格战凶猛 AI小模型狂飙

下一篇：强降雨致日本山形县和秋田县3人死亡千余栋房屋被淹

为你推荐

有效的攻略：佳物分期购哪里变现出来靠谱全天取现商家：

现在网络鱼龙混杂，请认准靠谱八年商家，金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【得物佳物分期购可以提现吗】【得物的分期购额度怎么套出来...

09-25

三部门：持续实施好农机报废更新补贴

　　中新经纬9月10日电据农业农村部网站10日消息，近日，农业农村部、国家发改委、财政部联合印发《关于加大工作力度持续实施好农业机械报废更新补贴政策的补充通知》(下称《...

09-12

价格不变新款Model 3在北美地区上市

[本站资讯] 特斯拉终于在美国和加拿大推出了2024款Model 3。新车在外观、内饰、配置、续航等方面都进行了升级，入门级后驱版和长续航全驱版的价格保持不变，分别为38,9...

01-11

李奕臻《永夜星河》端阳帝姬今日上线开启直球追爱

　　由腾讯视频出品，恒星引力联合出品，王娟担任总监制，赵一龙执导，虞书欣、丁禹兮、祝绪丹、杨仕泽领衔主演，李奕臻特别出演的穿书冒险剧《永夜星河》11月1日，于腾讯视频全网独...

11-09

《再见,怦然心动》沁沁被家暴是哪一集？沁沁被家暴相关剧情介绍

《再见,怦然心动》这部电视剧的开播迅速吸引了大量观众的目光，其引人入胜的剧情成为热议话题。剧中角色沁沁遭受家暴的情节尤其触动人心，让人不禁疑问，这一切...

10-15

初夏适量吃苦味食物多喝热茶多运动

初夏的时候大家养生要小心的情况是比较多的，在这时候高温对我们健康影响是很大的，这时候会容易对大家健康造成影响，所以说我们在初夏的时候就要学会方法去养生，这是初夏很关键的...

04-02

怎么查看附近白条商家怎么才能套出来（十年本地商家这6种方法取现秒到账）

8年专业老商家微：k973880【8年专注更专业】【靠谱秒到】24小时在线接单我们都知道白条是京东金融旗下的消费信贷产品，功能是给我们消费购物使用，先用后还，这种模式比较适合大部...

08-21

当面！广州套花呗信用购支持线下秒到账线下当面这9个方法值得收藏(本地一手商家当面秒刷)

广州风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-09

唯一！烟台当面套京东白条提现完整流程破限制强烈推荐！（没有中间商赚差价不花冤枉钱）

烟台风控花呗白条套取秒到账：【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已实名安全的很。十...

08-28

实体！南宁套花呗信用购本地商户极力推荐！(本地一手商家当面秒刷)

南宁风控花呗白条套取秒到账：【181 181 43671微信同号】万事达、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷，本地一手超低费用没有中间商赚差价，所有信息已...

08-11

第十四届漫博会在东莞开幕，全国首个潮玩与动漫产业蓝皮书发布

南方财经全媒体记者郑康喜东莞报道10月24日，第十四届中国国际影视动漫版权保护和贸易博览会（以下简称“漫博会”）在东莞开幕。启动仪式上，中...

10-25

“宁王”狂赚400亿背后的AB面

作为动力电池行业巨头，宁德时代备受关注，而在摩根士丹利上调评级、股票大涨后，“宁王”晒出2023年...

06-27

真真切切!武汉汉阳区套抖音月付一手商家突破一切限制！（3秒拿钱堪称业界标杆）

当面套花呗京东白条抖音月付分期乐VISA信用卡分付一手商家秒到账：【138 1874 5895 微信同号】一手当面靠谱！白条怎么套出来，大家在急用钱的时候肯定会想到京东白条或者京东金条...

08-04

微信分付提现大揭秘：额度变现，轻松几步走

想要安全提现，请认准靠谱提在线客服24小时在线为您服务【V杏2561663326电15580821310】在经济的浪潮中，微信分付提现是您最可靠的救生圈。我们提供的不仅仅是资金，更是对您未...

08-01

三分钟拿钱: 京东白条商城额度套现步骤六十秒教你三种提现方法

天时不如地利，地利不如人和。　　有利于作战的天气、时令，比不上有利于作战的地理形势，有利于作战的地理形势，比不上作战中的人心所向、内部团结。刚刚初入社会的年轻人手头...

08-06

北京京东白条自己如何提现（最简单大方5种操作）

到店支付，顾名思义，就是用户可以在线上购买商品后，在线下实体店铺完成支付。这种方式不仅保留了线上购物的便捷性,随着移动支付的普及和便利性，分付作为微信的支付工具之一，成为...

08-06

全部导航

价格战凶猛，AI小模型狂飙

五大攻略：花呗信用购的钱怎么套出来商家教会你：

本人亲测：怎么找抖音月付回收商家

五大步骤：得物分期购物额度大额怎么套出一分钟了解：

变现无风险：抖音月付额度如何提现出来

简单秒到攻略：抖音月付怎么取出现金

两分钟拿钱：得物分期购变现多久到账全天提现小二：

五分钟拿钱：抖音分付大额怎么取出

提现一步到位：花呗信用购额度如何提现出来