“北京造”大模型GLM-4.5开源 综合性能世界领先

9个月前 来源:千龙网 观看:102

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。0p8即热新闻——关注每天科技社会生活新变化gihot.com

图片10p8即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。0p8即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。0p8即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)0p8即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。0p8即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。0p8即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”0p8即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。0p8即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。0p8即热新闻——关注每天科技社会生活新变化gihot.com

图片20p8即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。0p8即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。0p8即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。0p8即热新闻——关注每天科技社会生活新变化gihot.com

图片10p8即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。0p8即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。0p8即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)0p8即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。0p8即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。0p8即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”0p8即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。0p8即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。0p8即热新闻——关注每天科技社会生活新变化gihot.com

图片20p8即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。0p8即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。0p8即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3196-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
“任何一条聚变路线都面临挑战,但商业化首先要考虑燃料‘卡脖子’问题。”日前,在位于河北省廊坊市的新奥聚变技术研发中心,新奥能源研究院...
01-24
  近日,辽宁省防减救灾办与相关成员单位进行会商,对近期全省自然灾害风险形势开展了研判分析,结合实际对...
01-24
图为在中欧班列(沈阳)集结中心,电梯零部件、汽车等货物正在装车。记者 杨靖岫 摄  2月8日,记者从沈阳海关...
02-09
原标题:新就业群体“新”在哪、“难”在哪、关爱工作“落”在哪积极回应新就业群体期盼(青年观察·关注新就业群体)——访中央社会工作部副部长赵世堂数据来源:中央社会工作...
01-21
全国多个省份陆续进入“两会时间”。1月13日,黑龙江省第十四届人民代表大会第三次会议开幕。根据2025年黑龙江省政府工作报告,2025...
01-21
1 月 29 日消息,据汽车研究机构 Rho Motion 预测,到 2025 年,全球电动汽车(EV)的销量将突破 2000 万辆,这标志着该行业又将迎来一年的增长。注意到,Rho Motion 几周前曾报...
01-29
2 月 3 日消息,特斯拉官网显示,特斯拉现已在美国上线推出针对FSD用户的保险优惠政策,车主在车辆激活FSD系统并保持90分以上安全驾驶评分的前提下,最高可获得 7 折-8 折...
02-04
《难哄》穆承允喜欢的女生是谁?穆承允和温以凡是什么关系?《难哄》中穆承允喜欢的女生是温以凡。‌在小说中,穆承允对温以凡有一定的好感,但这种好感并未发展成...
02-19
在娱乐圈这个星光灿烂的舞台上,何炅以其非凡的主持能力和温文尔雅的形象,赢得了广泛的认可与尊敬。更令人钦佩的是,他展现出的自律精神和健康的身体状态,成为了公众关注的焦点。...
02-22
21世纪经济报道记者季媛媛 上海报道自1981年首例艾滋病病例报告以来,人类和艾滋病的抗争已持续40余年。时至今日,尚无可以根治艾滋病的药物,...
01-21
21世纪经济报道记者闫硕 北京报道1月17日上午,由中国肥胖联盟和广东省二十一世纪教育基金会共同主办的关于《柳叶刀-糖尿病与内分泌学》重...
01-21
  2025年1月20日,“霓裳万象”首届高校汉服设计大赛在陕西西安唐乐宫圆满收官,观众们在颁奖典礼现场欣赏了由参赛者和表演者共同呈现的诗画汉服国风大秀,感受华章之美、国风...
01-21
近期,阜新市第一职专刘艳霞名班主任工作室阶段汇报会在学校一楼礼堂举行。会议由工作室成员冯宇老师主持...
01-21
  1月21日上午10点,贵州亨特房地产开发有限公司(简称“亨特地产”)持有的贵州花溪农村商业银行股...
01-23
  财联社1月26日讯(记者 邹俊涛)宜宾银行(2596.HK)近3.52%股权流拍,超千次围观却无人出价。  1月...
01-28
天秤座男生通常具有温和、友善、善解人意的性格,他们注重平衡和公正,喜欢与人和谐相处。...
01-22
在星座中,有一个特别能够理解和欣赏射手男性格的星座女子。她们与射手男之间有着特殊的...
01-22
世界油品排名?2020世界10大石油品牌出炉!中石油、中石化再度上榜近日,全球著名品牌评价机构BrandFinance发布了《2020年全球最具价值品牌500排行榜》。作为全球品牌评价的风向...
02-07
独特魅力:韩国牛仔裤模特精彩T台走秀每年的时尚周总是让人期待不已,尤其是那些展现出独特风格的服装秀。我记得第一次观看韩国牛仔裤模特的T台走秀时,那种体验简直酣畅淋漓。牛...
02-17
2月5日消息,苏宁易购发布的春节消费大数据显示:春节期间,本地以旧换新消费需求进一步扩大,苏宁易购门店迎来销售“小高峰”,全国门店客流同比提升80%,以旧换新订单量同比增长92%。...
02-07
2月9日消息,天猫近日发布一则内测文档,宣布“天猫旗舰店会员活动现在可以直投微信私域”,即允许品牌直接将微信私域流量引导至天猫旗舰店,实现会员招募、购买转化及销量回流。目...
02-09
2月11日消息,“市象”公众号发文称,美团内部正在进行一场AI“大跃进”。有美团内部员工透露,今年年初定的大OP(目标计划)就是四个All in,分别是海外市场、下沉市场、无人机、AI。...
02-11
2月26日消息,在第18个国际罕见病日来临之际,病痛挑战基金会、阿里巴巴公益及阿里健康公益共同发起“柠檬宝宝新生无限关爱倡议”,获得24家新生儿筛查中心及综合性儿科医院响应...
02-27
【#吉利旗下极光湾在上海成立汽车零部件公司# 注册资本2000万】天眼查App显示,1月20日,上海极光湾汽车零部件有限公司成立,法定代表人为WANG RUI PING,注册资本2000万人民币,经营...
01-21
伴随着7.53亿个心愿,淘宝第四次回到春晚这个互联网企业的核心战场,登上舞台中央,带来了一种前所未有的互动方式——许愿红包。不再“摇一摇”,不再“红包雨”,不再是直给的金钱诱...
02-09
快科技2月5日消息,据灯塔专业版实时数据,截至2月5日1时3分,影片《哪吒之魔童闹海》票房突破50亿。 《哪吒之魔童闹海》也正式杀入中国影史票房榜第五,而第四就是《...
02-05
近日,国产独立黑暗武侠动作游戏游戏《乂闻录:轮回》(《义闻录:轮回》)官宣了发售日期,该作将于4月18日发售,登陆Steam,售价78元,首周折扣价66元,首个版本将提供20+小时的...
02-10
极目新闻通讯员 凌丽万“巳”大“集”闹新春,非遗技艺过大年。2月3日,正月初六,又恰逢二十四节气之首“立春”,为庆祝首个“非遗版”春节,弘扬中华优秀传统文化,寄托岁首美好期盼,...
02-04
2月5日傍晚,小米创始人雷军在社交媒体上发文:这是金的。转发的视频里有人介绍,小米SU7 Ultra车标变成了碳纤维+金色,兄弟们这个如何?来源:当事人社交账号今日上午,雷军又连发多条微...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮