“北京造”大模型GLM-4.5开源 综合性能世界领先

5个月前 来源:千龙网 观看:79

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。18z即热新闻——关注每天科技社会生活新变化gihot.com

图片118z即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。18z即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。18z即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)18z即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。18z即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。18z即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”18z即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。18z即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。18z即热新闻——关注每天科技社会生活新变化gihot.com

图片218z即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。18z即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。18z即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。18z即热新闻——关注每天科技社会生活新变化gihot.com

图片118z即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。18z即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。18z即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)18z即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。18z即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。18z即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”18z即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。18z即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。18z即热新闻——关注每天科技社会生活新变化gihot.com

图片218z即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。18z即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。18z即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3196-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
昆虫即使在弱光条件下也能表现出极其优秀的敏捷性和反应能力。秘密在于它们的复眼能以惊人的速度和灵敏度检测运动。韩国科学技术院研究人员模仿这...
01-21
黄仁勋在中国台湾的行程聚焦于先进封装 CoWoS。1月16日,英伟达CEO黄仁勋开启中国台湾行程,首站到访矽品精密并出席揭牌仪式。黄仁勋...
01-21
  1月26日18时至27日7时,我市普降大雪,局地暴雪,全市平均降雪量8.2毫米,四个国家站降雪量:营口市9.6毫米(...
01-28
  1月29日,大年初一。受到持续强降雪的影响,许多要通过高速公路返乡团聚的司机朋友,时刻关注和期待着高...
01-29
新闻记者 张秀娟 实习生 赵子豪春节临近,牛羊肉作为年夜饭餐桌上的“硬菜”代表,其销售也迎来旺季。“用来滋补的牛尾,适合煨汤的瓦沟和炖煮入味的牛腩,近日销量都不错。”武汉...
01-21
  新华社快讯:以色列监狱管理局20日说,已释放90名巴勒斯坦被扣押人员。 ...
01-21
[本站 资讯] 日前,我们从官方获悉,捷达VA7将会在明日(1月12日)正式上市,车辆定位国民家轿,是一款紧凑型车,使用1.4T动力,此前预售价为11.8777万元起。在上个月,捷达VA7就完成...
01-21
2 月 2 日消息,比亚迪腾势销售事业部总经理赵长江今日发布视频分享了腾势 N9 新车“九大爆料”,其中提到了该车的上市时间、发布节奏,以及部分车型的续航能力。整理赵...
02-02
当前,《远亲近邻,择良而交》在网络上热播,其精心设计的剧情、服装和音乐吸引了大量观众。剧中的人物性格鲜明,命运曲折,成为了观众心中的经典角色。接下来是关于...
02-20
近期,汪小菲成功将子女接回北京的消息在网络上掀起热议。这一过程中,并未遇到来自前妻徐家的任何阻挠,引发了公众对亲子关系及家庭责任的广泛讨论。众多网友对汪小菲的这一行为...
02-23
  中新网2月7日电 据国家医保局微信公众号消息,医保钱包开通地区再扩容,14省份117个统筹区实现跨省共济。  2024年12月2日,国家医疗保障局在江苏苏州正式启动全国医...
02-08
21世纪经济报道记者李佳英 广州报道对多数患者来说,福斯曼的倒闭消息如晴天霹雳,突如其来。“广州齐遇口腔门诊部(福斯曼)总部出现经营困难,拖...
02-15
  大众网记者 司心鹏 通讯员 邱文风 王琴 报道  12月5日,山东商业职业技术学院云计算技术与应用产业学院党总支与浪潮软件股份有限公司党委开展了“党建引领聚合力,双...
01-21
大家好,我是童学会小记者李峻轩。今天我们来到了九紫宝藏陨石博物馆参观。通过讲解员的生动解说,和仔细观察产品,我知道了陨石分为三大类:石陨石、铁陨石和石铁陨石。其中石陨...
01-21
  银行业理财登记托管中心近日发布《中国银行业理财市场年度报告(2024年)》(简称《报告》)。《报...
01-22
  财联社2月5日讯(记者 夏淑媛)春节前夕,金融监管总局副局长肖远企在国新办会议上提出“两个力争...
02-06
天秤座是一个注重平衡和公正的星座,他们通常不容易生气。然而,当某些事情触碰到了他们的...
01-22
双子座的男生天性活泼开朗,善于交际,他们通常是聚会中最引人注目的人物。然而,有时候双子...
01-22
从高个子女明星看时尚与魅力:她们的独特风采如果你留意一下娱乐圈,时常会发现那些高个子女明星总是有着特别的魅力,无论是在红毯上还是日常生活中,她们的形象都能成为众人瞩目的...
02-12
韩国女明星:穿衣风格的大胆创新与时尚潮流提到韩国女明星,你首先想到的是什么?是她们精致的面容、优雅的举止,还是那令人眼前一亮的穿衣风格?无论是哪一种,她们都以独特的个性和大...
02-17
1月23日消息,山东齐鲁漆业有限公司(以下简称:齐鲁漆业)总经理孙亮亮一行近日到访涂多多。涂多多副总裁、跨境产业总经理邵春生,涂多多副总裁、粉体产业链链主郑德莲代表公司与来...
02-07
小米在向华为看齐。二、小米 15 Ultra 更多细节透露元宵节的夜晚,小米创始人雷军再次开启了他的直播之旅。这次直播的场地选在了小米食堂,雷军选择带大家参观小米员工的日常餐...
02-14
2月13日消息,蚂蚁集团发布《2024年消费者权益保护年报》。报告显示,2024年,蚂蚁集团发挥安全科技能力,预防、识别和应对各种风险,协助公安反诈部门保护35.6亿元资金;加速拥抱 AI ...
02-14
2月19日消息,美团宣布,预计2025年第二季度开始逐步为全职及稳定兼职骑手缴纳社保。去年以来,美团就骑手缴纳养老保险等社保方案做了认真研究,选择了不同区域不同城市进行深入调...
02-20
由爱奇艺出品,新力量文化、新影方舟、老有影视联合出品,新力量文化承制,爱奇艺奇正工作室打造,惠楷栋执导,解嬿嬿编剧,谭卓、高叶、刘奕君领衔主演,林雨申特邀领衔出演,扈耀之、田小...
01-21
近日,AI异构算力软件Infra供应商中科加禾完成数千万元Pre-A1轮融资,由北京市人工智能产业投资基金领投。成立于2023年的中科加禾,聚焦编译技术,为助推...
02-07
根据国外游戏论坛IconEra管理员爆料,SIE已不再计划将《恶魔之魂》和《GT赛车7》移植到PC平台。 关于《GT赛车7》,爆料称原本有一个PC版正在开发中,但最终被取消...
02-03
近日,在接受西班牙媒体Gamereactor采访时,《怪物猎人:荒野》制作人辻本良三和总监德田优也被问及了游戏是否会登陆Switch 2的问题,虽然两人明显没有透露任何有关Sw...
02-13
“杯子快补货”,“盲盒快补货”……《哪吒之魔童闹海》上映5天的票房已破27亿,成为这个春节档“一超多强”中的超级头部影片,多个平台的票房预测不断上调,最终票房有望在65亿以...
02-02
昨天(1日),我国南方地区阴雨雪天气持续,河南、湖北、安徽等地局地出现大雪。今天(2日),南方大部地区仍被阴雨雪“控场”,湿冷感较为突出。此外,新疆、青海、甘肃以及东北地区有小雪或...
02-02
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮