“北京造”大模型GLM-4.5开源 综合性能世界领先

1个月前 来源:千龙网 观看:50

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。ibc即热新闻——关注每天科技社会生活新变化gihot.com

图片1ibc即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。ibc即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。ibc即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)ibc即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。ibc即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。ibc即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”ibc即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。ibc即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。ibc即热新闻——关注每天科技社会生活新变化gihot.com

图片2ibc即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。ibc即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。ibc即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。ibc即热新闻——关注每天科技社会生活新变化gihot.com

图片1ibc即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。ibc即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。ibc即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)ibc即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。ibc即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。ibc即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”ibc即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。ibc即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。ibc即热新闻——关注每天科技社会生活新变化gihot.com

图片2ibc即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。ibc即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。ibc即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3196-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
Roguelike类RPG游戏赛道再迎出海黑马!近日,第三方机构Sensor Tower发布了2024年12月中国手游产品在海外市场收入及下载量排行榜,海彼...
01-22
技术进步是降低人工智能应用门槛的关键。这有待加大科研投入,强化自主研发能力,在智能芯片、操作系统等关键领域取得更多突破。夯实算力、算法、数据...
01-27
  今天(1月23日)至27日,今年首场寒潮将携大范围雨雪来袭,西北地区东部、华北、东北等地有较强降雪...
01-24
  今天(1月24日)至27日,今年首场寒潮天气过程继续影响我国,中东部大部地区将陆续出现雨雪天气,西北...
01-24
  1月20日,北京住房公积金管理中心(以下简称“公积金中心”)发布《关于开展提取住房公积金直付...
01-21
  近日,全国多地气温偏高,很多地区没有降水或降水稀少。中央气象台数据显示,19日又是雨雪非常稀少的一天,上午10时,只有6个国家级气象站降水量达到0.1毫米。为什么会出现这...
01-21
[本站 国内谍照] 1月18日,我们从相关渠道获取到了一组疑似吉利银河旗下全新轿车的路试谍照。从多处细节来看,该车或将归属星舰系列的全新插混车型,从而与星舰7 EM-i等车...
01-21
1 月 24 日消息,小鹏汽车 MONA 产品负责人@XP-杨光 今日分享视频介绍了 MONA 车型的第五次大规模 OTA。他称“工程团队在原计划的基础上,全力做了压缩,终于赶在了春节...
01-25
近期播出的《消失的明月》特别受欢迎,无数观众深陷其中,无法自拔。许多人都渴望了解这部剧的剧情。主演是林思彤和徐世鑫,上线时间为每天10:00。该剧属于女频...
02-20
在娱乐圈这个光芒四射的舞台上,何炅以其出色的主持能力和温文尔雅的气质,长久以来深受观众喜爱。然而,近日他再次成为话题焦点,并非因为新的节目或作品,而是他那令人惊叹的健身成...
02-22
1月22日,国家卫健委、国家中医药局联合发布《流行性感冒诊疗方案(2025年版)》,新增玛巴洛沙韦、法维拉韦两种抗流感病毒药物,并明确不建议联合...
01-23
  编者按:春节临近,年味愈浓。红彤彤的糖葫芦,酸甜交织的滋味在舌尖绽放;家中盛放的年宵花,寄托着...
01-23
为进一步提升班主任管理水平,探索班级管理的新方法,营口市中等专业学校学生科和FF名班主任工作室于2024年...
01-21
1月15日,正值习近平总书记考察皇姑区三台子街道牡丹社区三周年之际,辽宁大学纪检监察学院与皇姑区三台子...
01-21
  中国网财经1月21日讯 2024年12月权益市场震荡上行,资产管理标品信托市场的产品发行数量环比...
01-23
  近日,多家消费金融公司围绕春节购物、出行、旅游等消费需求,打造多样化服务和优惠举措,推出满...
01-24
水瓶座男生通常被认为是理性、独立和冷静的人。他们不容易表达自己的情感,因此要判断一...
01-22
水瓶座的男生通常被认为是聪明、独立和有点神秘的人。他们喜欢自由和独处的时间,所以在...
01-22
T恤穿搭技巧? 男士t恤衫穿搭技巧?一、T恤穿搭技巧?01 T恤+吊带裙简约T恤与长款吊带连衣裙搭配,优雅大气,而且能凸显优美的身材曲线。手臂粗的姑娘们,可以选择袖子宽松的T恤,腰部较...
02-12
揭示女明星穿衣风格的秘密:如何借鉴她们的时尚灵感当我们翻看杂志或者社交媒体时,常常会被一位位女明星的穿衣风格所吸引。她们的时尚选择不仅体现了个人魅力,更在无形中影响了...
02-17
1月27日消息,“2024年中国产业互联网垂直细分行业TOP10企业”榜单近日发布。卓尔智联及旗下中农网、卓钢链、化塑汇、CIC、华纺链、海上鲜分别入选综合型、农业、钢铁、化工...
02-07
1月20日消息,猎芯近日与深圳市矽睿半导体有限公司(以下简称:矽睿半导体)达成授权代理合作。矽睿半导体全系列产品已上线至猎芯网平台商城,含磁传感器、电源管理、锂电池保护芯片...
02-07
2月24日消息,叮当健康科技集团有限公司公告称,相对于截至2023年12月31日止年度净亏损约2.31亿元,公司预期2024财年净亏损将增加64%以上。图源:东方财富网叮当健康表示,以上亏损主...
02-25
3月2日消息,银联-Visa“北京中轴线无障碍支付服务旅游示范区”启动仪式日前在北京坊举行。北京市文化和旅游局将携手中国银联与Visa,合作共建银联-Visa“北京中轴线无障碍支付...
03-03
2025年1月21日,深圳市聚心教育科技有限公司今日正式官宣,以5000万人民币估值已顺利完成500万元人民币A轮融资。本轮投资是由采纳资本领投,由金伯乐创投、美城创投、领创ITVC、...
01-23
近日,智能科技领域企业——青岛明邦智能科技有限公司(简称“明邦智能”)宣布,成功完成1000万元人民币的融资。此次融资由广东南方秭方投资集团(简称“...
02-07
今日(2月5日),关注焦虑情绪的2D互动叙事游戏《焦虑小狗》Steam页面开放,年内发售,游戏支持简繁体中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《焦虑...
02-06
今日(2月5日),雅达利经典打砖块游戏《Breakout Beyond》Steam页面开放,发行日期待定,游戏暂不支持中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《Bre...
02-06
今明两天(2月7日至8日),寒潮继续影响我国,中东部气温将陆续迎来这轮过程的最低点,并将大面积创今冬以来气温新低。同时,全国降水范围有所缩减,主要出现在东北地区、西南地区东部、...
02-07
近期,国家安全机关第一时间侦破一起重要涉密人员主动投靠境外间谍情报机关的重大间谍案件,及时制止卖密行为,有力维护了国家安全。潜滋暗长生邪念韩某某,案发前在某重要涉密单位...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮