“北京造”大模型GLM-4.5开源 综合性能世界领先

2个月前 来源:千龙网 观看:60

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。twX即热新闻——关注每天科技社会生活新变化gihot.com

图片1twX即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。twX即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。twX即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)twX即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。twX即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。twX即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”twX即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。twX即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。twX即热新闻——关注每天科技社会生活新变化gihot.com

图片2twX即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。twX即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。twX即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。twX即热新闻——关注每天科技社会生活新变化gihot.com

图片1twX即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。twX即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。twX即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)twX即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。twX即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。twX即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”twX即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。twX即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。twX即热新闻——关注每天科技社会生活新变化gihot.com

图片2twX即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。twX即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。twX即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3196-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
1月15日,记者从中国科学院大连化学物理研究所获悉,该所动力电池与系统研究中心主任陈忠伟团队与双登集团近日对外联合发布了最新一代智能电池管理系...
01-21
以“新质 新人才”为主题的《新质生产力应用型人才就业趋势报告》(以下简称《报告》)发布会日前在中国人民大学举行。会上发布的《报告》显示,2022年...
01-24
  尼泊尔一名官员22日说,尼政府已提高从南坡攀登世界最高峰珠穆朗玛峰的许可费。  尼泊尔文...
01-24
  新华社北京2月13日电题:破百亿元!“哪吒”动画新突围  新华社记者李欢  突破100亿元!2月13...
02-14
进入冰雪季,东北三省谁能成为新的“顶流”?它们亮出了不同的数据,各自展示自己的受欢迎程度。比如辽宁,元旦假期接待游客267.2万人次,...
01-21
  中新经纬1月17日电 题:新兴领域发展为消费内循环提供新支撑  作者 刘春生 中央财经大学副教授  2024年,社会消费品零售总额达到48.8万亿元,比上年增长3.5%,规模稳居全球...
01-21
1月10日,焕新Model Y正式登陆特斯拉中国官网,同时上线首发版车型,预售价26.35万元起,在外观、座舱、续航等方面均迎来升级,安全、智能等硬核产品实力进一步提升,使这款全球最畅销...
01-21
[本站 资讯] 本期本站的《2025新车大爆料》将为大家带来长安集团的2024年销量回顾以及2025年新产品规划。2024年长安集团旗下众多品牌齐心创造了近七年销量新高,并且...
01-21
《难哄》苏浩安是什么角色?苏浩安第几篇出场?苏浩安是男主桑延的好兄弟,与桑延从初中就相识,后来还考上了同一所高中,也是女主温以凡的朋友。他是一个富二代,有着...
02-19
最近播出的电视剧《夫人为何如此无情》受到了很多人的喜爱,热度持续上升。这部剧不仅因为其扣人心弦的情节吸引观众,还因其丰富的剧情讨论点成为了大众关注的...
02-20
  2025年1月1日,新版国家医保目录将正式实施。此次共新增91种药品,其中89种以谈判/竞价方式纳入,另有2种国家集采中选药品直接纳入,...
01-21
21世纪经济报道记者武瑛港 实习生张烁 北京报道小红书上又多出来了一批“难民”,不过这次是医美“难民”——近日北京塑研医疗美容诊所疑似...
01-25
  大众网记者 司心鹏 通讯员 刘振 盛凤娟 报道  近日,2024年职业院校技能大赛各赛项圆满收官,山东水利职业学院在本年度赛事中表现卓越,成绩斐然。在世界职业院校技能大...
01-21
  大众网记者 隋宜笑 报道  12月26日,山东政法学院党委委员、副校长胡晓清,山东政法学院传媒学院党总支书记徐永青,山东政法学院传媒学院副院长常洪卫等一行5人到访山东...
01-21
  摘要  【每日龙虎榜】周一商品期货综合指数下跌0.43%,日内资金净流出76.44亿元。一文带你...
01-21
  “春节后,豆粕一天一个价,今天就涨了300元(每吨)。”提及近期豆粕价格情况,广东一家中型饲料企业...
02-13
星座配对一直是人们关注的话题,其中双子座男和处女座女的组合备受瞩目。他们之间的配对...
01-22
天蝎男是一个神秘而深沉的星座,他们喜欢与人保持一定的距离感,不轻易展示自己的内心世界...
01-22
穿貂怎么搭配围巾图片欣赏?一、穿貂怎么搭配围巾图片欣赏?个人觉得貂皮本身就有厚重感,搭配围巾不是很适合,可以搭配轻质的丝巾。搭配如果艳丽一点可以选择正红色;肤色白的话可以...
02-17
闯入时尚潮流:道程服饰的风格与魅力在我的生活中,时尚往往不仅仅是衣服的选择,它反映了个人的品位与态度。如今,越来越多的人开始关注潮流服饰,而道程潮流服饰正是其中一道独特的...
02-17
2月8日消息,《微信小店带货账号体系管理规则》日前正式生效,该规则自2025年2月7日起施行。这份文档较以往视频号小店的要求,有了较大的变化,尤其是在账号绑定与关联账号两个方面...
02-08
2月15日消息,字节跳动日前举办新一期的All Hands全员会,字节CEO梁汝波、CFO高准、人力资源负责人华巍、电商业务负责人康泽宇、AI业务负责人朱文佳、TikTok CEO周受资与全体员...
02-15
2月5日消息,滴滴出行数据显示,春节假期期间,打车完单量同比去年上涨17%,其中异地打车(非常驻地打车)需求相比年前上涨60%。入境用户在国内使用滴滴的打车完单量同比去年上涨80%。...
02-07
3月6日消息,携程集团日前与拉斯海马旅游发展局(RAKTDA)在2025年柏林国际旅游展上签署了一份谅解备忘录(MOU),联合推出一系列新举措,包括加强数字化互动、深化文化故事讲述和提升营...
03-09
近日,众钠能源完成由中合投资和黄海金控联合投资的近亿元A1轮融资,本轮融资充分体现了资本市场对硫酸铁钠技术路线及众钠团队产业化能力的高度认可...
02-07
值此新春佳节之际,农业农村部传来捷报,我国“菜篮子”工程稳扎稳打,保障能力再上新台阶。据最新数据显示,2024年度全国蔬菜种植面积与产量双丰收,当前田间蔬菜绿意盎然,总面积突破...
02-09
角色扮演游戏如今没有20世纪90年代时那么复杂,这已不是什么秘密。多年来,许多游戏机制和特色都被简化,以便让更广泛的玩家群体能够轻松上手,但这也让一些经典RPG的...
02-02
据猫眼专业版数据显示,《哪吒之魔童闹海》 上映5天, 总票房破26亿,观影人次破5000万,排名春节档第一,遥遥领先《唐探1900》《封神第二部:战火西岐》。 另据据灯塔专...
02-03
极目新闻记者 潘锡珩4日,极目新闻记者从武汉地铁了解到,为保障铁路夜间到达乘客出行需求,今日(2月4日),武汉轨道交通2号线汉口火车站往佛祖岭方向末班车延时至24:00,4号线武汉火车站...
02-04
2月4日,据报道,《封神2》太原路演现场观众情绪失控,导演乌尔善被观众贴脸质问: “为什么封神的口碑两极分化,你想过没有? 我们作为路人一直在给你说好话,你有没有想过自己去解决这...
02-05
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮