“北京造”大模型GLM-4.5开源 综合性能世界领先

3个月前 来源:千龙网 观看:65

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。MfC即热新闻——关注每天科技社会生活新变化gihot.com

图片1MfC即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。MfC即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。MfC即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)MfC即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。MfC即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。MfC即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”MfC即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。MfC即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。MfC即热新闻——关注每天科技社会生活新变化gihot.com

图片2MfC即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。MfC即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。MfC即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。MfC即热新闻——关注每天科技社会生活新变化gihot.com

图片1MfC即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。MfC即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。MfC即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)MfC即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。MfC即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。MfC即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”MfC即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。MfC即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。MfC即热新闻——关注每天科技社会生活新变化gihot.com

图片2MfC即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。MfC即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。MfC即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3196-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
1月17日,记者从中国石化新闻办获悉,我国首套采用聚酯中黏工艺技术建设的50万吨/年瓶级切片装置在中国石化仪征化纤公司成功投产,标志着我国在聚酯非纤...
01-21
人形机器人产业作为发展新质生产力的代表领域之一,正在进入发展上升期,成为科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用...
01-27
  今天是春运第12天,交通出行迎来节前客流高峰。交通部门积极应对不利天气对春运带来的影响,全...
01-27
  至1月27日10时40分,经与交警部门协商,沈阳、葫芦岛、铁岭、锦州、大连、抚顺、盘锦、阜新、营口部分...
01-28
  海报新闻记者:张金秋 ...
01-21
  中新经纬1月17日电 (林琬斯)近日,日本资生堂集团官网发布“价格调整通知”称,自2025年4月17日(星期四)起,由于原材料成本上涨,资生堂将对部分产品价格进行调整。  通知显...
01-21
[本站 资讯] 本站新闻团队策划了《2025新车大爆料》系列内容,我们将为大家盘点各个车企的最新动向,重点展望2025年新车。目前已经上线10篇内容,覆盖新势力品牌和中国品...
01-21
1 月 24 日消息,奥迪(Audi)昨日(1 月 23 日)在 Facebook 上发布动态,展示了一款基于 Q6 Sportback e-tron 打造的越野概念车。这款概念车外观炫酷,配备了门式车桥和巨大的...
01-25
  张硕  近年来,剧集市场出现了一种“历史考据+悬疑叙事+当下表达”的微观历史剧,在真实的历...
01-22
最近正在热播的《陌上又花开》吸引了许多观众,不仅因为演员的颜值和演技,还有引人入胜的剧情。剧中关于偷酱牛肉的情节引起了广泛讨论。故事发生在一家名为陌...
02-22
  近期,流感等呼吸道疾病进入高发期。全国流感病毒阳性率上升,尤以甲流多发。  中国疾控中心1...
01-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局药审中心发布《地中海贫血基因治...
02-10
北京大学北京国际数学研究中心 日前发布2024年工作亮点回顾 文章提到,科学...
01-21
大连理工大学认真贯彻落实党的二十大、二十届三中全会和全国教育大会精神,在教育强国建设新征程上,紧紧围...
01-21
  财联社2月5日讯(记者 夏淑媛)春节前夕,金融监管总局副局长肖远企在国新办会议上提出“两个力争...
02-06
经济观察网 邢祺欣/文 6月19日,惠誉评级在北京举行的“2024惠誉看中国”会议上,发布《中国主权评级及宏观经济前景展望》报告。对中国政府近期采取的支持经济的措施,惠誉评级中...
02-13
水瓶座的男生通常被认为是聪明、独立和创新的人。他们对于自由和个人空间有着强烈的需...
01-22
冷战是一种常见的情感处理方式,但对于狮子男他们往往更难以忍受这种冷漠的态度。如果你...
01-22
中国女明星:璀璨星河中的风采与成就说到中国女明星,大家脑海中浮现的或许是她们在荧幕上婀娜多姿的形象,或是精致的红毯造型。实际上,这些才华横溢的女性背后,往往承载着不为人知...
02-12
魅力无限:帅气女明星带给我们的时尚风潮在当今娱乐圈,女明星们不仅仅是表演艺术的展现,更是时尚与个性的一种引领。在我看来,帅气女明星之所以吸引眼球,不仅在于她们的才华与美貌...
02-12
2月9日消息,苏宁易购日前与海信召开2025战略启动会,双方明确2025年百亿目标,聚焦换新消费趋势,将深化产品共创、场景升级、本地化经营、破圈营销,提升全品类经营效率。开工抢先机...
02-09
2月12日消息,情人节前夕,淘宝首次推出礼品卡,同品类可跨店使用。淘宝App显示,目前淘宝礼品卡设有美妆护肤卡、母婴亲子卡,面值共有四档,分别为600、800、1000、2000元。针对即将到...
02-13
据中国铁路公众号消息,2025年铁路春运1月14日开始,至2月22日结束,为期40天,全国铁路预计发送旅客5.1亿人次,日均发送1275万人次,节前客...
02-08
2月28日消息,继1月发布五大举措严厉打击“幽灵外卖”后,美团外卖宣布在首页显著位置上线“明厨亮灶”专区,鼓励餐饮商家通过后厨直播的形式,全面展示食品加工过程,为消费者提供清...
03-01
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
英伟达芯片“倒爷”们,开始不发朋友圈了。2023年大模型火热的时候,“倒爷”们朋友圈的画风是“欲购从速、30%定金,有实力的老板来!”到了2024年就变成...
02-07
在《GTA5》中为魅力主角之一崔佛配音的男演员史蒂文·奥格(Steven Ogg)希望能在《GTA6》中最后一次扮演这个疯子角色。史蒂文·奥格希望崔佛能在游戏早期的某个...
01-29
《狙击精英》系列最新作《狙击精英:抵抗》已于1月30日正式发售,Steam国区定价168元,豪华版268元。截至目前,该作在Steam上仅收获了698个评价,好评率也不高,仅68%,为褒...
02-03
极目新闻记者 丁伟街头套圈可以套到豪车玛莎拉蒂?近日,在河南商丘柘城县,一个套圈摊位吸引不少游客前来打卡和碰运气。2月6日,摊位老板告诉极目新闻记者,这是一辆二手的玛莎拉蒂,...
02-06
干惊天动地事,做隐姓埋名人。中国共产党优秀党员,中国工程院院士,共和国勋章、国家最高科学技术奖获得者,全国道德模范,中国第一代核潜艇工程总设计师,中国船舶集团有限公司第七一...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮