“北京造”大模型GLM-4.5开源 综合性能世界领先

4个月前 来源:千龙网 观看:98

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。79V即热新闻——关注每天科技社会生活新变化gihot.com

图片179V即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。79V即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。79V即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)79V即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。79V即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。79V即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”79V即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。79V即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。79V即热新闻——关注每天科技社会生活新变化gihot.com

图片279V即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。79V即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。79V即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。79V即热新闻——关注每天科技社会生活新变化gihot.com

图片179V即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。79V即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。79V即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)79V即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。79V即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。79V即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”79V即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。79V即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。79V即热新闻——关注每天科技社会生活新变化gihot.com

图片279V即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。79V即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。79V即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3187-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
2015年,包括195个国家和欧盟在内的各方共同签署了《巴黎协定》,承诺将制定并实施一系列计划,旨在将全球平均气温升幅严格限制在1.5℃以内。然而,到了20...
01-21
“春运期间带孩子出门,最担心的就是孩子吵闹影响周围的乘客。但是这趟列车上设置了‘遛娃舱’,不仅空间大、环境好,而且孩子们玩得也很开心...
01-21
  近日,辽宁省防减救灾办与相关成员单位进行会商,对近期全省自然灾害风险形势开展了研判分析,结合实际对...
01-24
注意啦沈阳市皇姑区、浑南区面向社会公开招聘博士人才事业单位编制发放生活补贴提供住房保障为随迁家属...
02-14
  研究发现,消费券能显著增加交易活跃程度,且对低收入人群增加消费,可以有明显的提振作用。但要让消费券发挥理想的效果,不仅要精准把握发放的时间节点,还要确保民众有稳定...
01-21
现代快报讯(记者刘伟娟文/摄)票价8.5元,行程4小时41分钟,你会从南京硬坐到上海吗?1月21日,现代快报记者从铁路12306获悉,部分硬座票“骨折价”,引起网友关注。铁路12306显示,南京到上...
01-22
1 月 24 日消息,汽车媒体 Car Magazine 于 1 月 22 日发布博文,报道称奥迪 RS 7 将告别 V8 引擎,采用 V6 插电混动系统,预计输出功率接近 725 马力。新款奥迪 RS 7 将拥...
01-25
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上线超过 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,这距离年初公布的2000 站的建站目标...
01-25
《余烬之上》美华姐是干嘛的?美华姐的结局是什么?‌《余烬之上》中的美华姐,即戚美华,是廖思远的养母,经营着一家药铺‌。她性格豪放,喜欢享受生活,交际广泛,对廖思...
02-21
《六姊妹》现在在哪里拍摄?六姊妹大结局怎么样?电视剧《六姊妹》的拍摄已经完成,其主要拍摄地在安徽淮南。是该剧的核心拍摄地,全剧主场景何家楼房便在此拍摄,“...
02-22
  降糖药物的选择应根据糖尿病患者的自身病情、经济条件,潜在性副作用等因素综合考虑。通过这篇文章,希望帮助更多糖尿病患者达到...
01-21
  大城市就医紧张,一些大型三甲医院常年“一床难求”,患者住院经常需要漫长等待。能不能“哪里有床住哪里”?   试点医院住院“...
01-21
作者:贾德忠(北京外国语大学党委副书记、马克思主义学院教授)在全球治理体系和国际秩序加速变革的大背景下...
01-22
1月22日,香港科技大学上海中心在徐汇滨江成立,港科大将与上海合作打造人才...
01-23
  1月17日,中国人民银行北京市分行发布行政处罚信息,北京农村商业银行股份有限公司因提供虚假的...
01-22
  三分之一董事会成员变更,净息差仅为0.93%,不良率达2.57%,遭遇盈利能力挑战的南粤银行如何自救?...
01-22
天蝎座的男生通常都很神秘、独立而又有魅力,他们对感情非常认真,因此要想让一个天蝎男心...
01-22
天蝎座男生通常被认为是神秘、深沉而又充满魅力的存在。他们对爱情有着极高的要求,很难...
01-22
小小模特的梦想舞台:CIP国际少儿模特T台走秀揭秘在璀璨的时尚界,模特的身影总是让人心驰神往。不过,当我们谈到模特时,脑海中浮现的往往是那些身材高挑的成年模特。在这里,我想分...
02-17
小小模特的魅力:少儿泳装T台秀的精彩瞬间当阳光洒下,波光粼粼的泳池边,无疑是一次充满活力的少儿泳装T台走秀的最佳场域。想象一下,小朋友们穿着色彩斑斓的泳装,自信地走上T台,仿...
02-17
2月5日消息,微信团队发布2025春节数据报告《微信里的赛博年味儿》,展示基于除夕至初五的多项数据。春节期间,微信里共诞生了1亿+款用户自己创作的红包封面,约有3.9亿人收到含有...
02-07
2月18日消息,京东宣布与学而思签订战略合作协议,明确了未来三年内,学而思在京东全渠道销售50亿元、覆盖超100万用户的目标。根据协议,双方将聚焦“人、货、场”的全面协同,通过产...
02-18
2月18日消息,京东健康于2024年7月推出了直接面向消费者的AI健康智能体“康康”,截至今年2月中旬,“康康”在近半年时间内已累计服务超3000万人次,成为国内AI健康第一入口。据介...
02-18
3月3日消息,饿了么将正式启动“优店腾跃计划”:面向商家投入超过10亿元,在费率优惠、专项补贴、专属流量、数字化运营服务和硬件设施以及AI技术能力等多方面,持续加大对商家支持...
03-04
【#荣耀申请注册无极引擎商标#】天眼查知识产权信息显示,近日,荣耀终端股份有限公司申请注册一枚“无极引擎”商标,国际分类为科学仪器,当前商标状态为等待实质审查。荣耀终端股...
01-21
蛇送金光兆五湖,安凯客车驰四海。2月4日,安凯客车“贺新春全球行”批量发车仪式在安凯厂区隆重举行。开工即迎大单,安凯客车党委书记、董事长、总经理黄李平携公司领导班子,以及...
02-09
随着工作室将全力转向《质量效应5》,EA正在缩减BioWare的规模。 BioWare总经理Gary McKay在一篇博客文章中表示,在《龙腾世纪:影障守护者》于2024年底发售后,工作...
01-30
近日据外媒报道称,RTX 5090、5080虽然上市还没有半个月,但已有不少用户反映显卡出现崩溃黑屏问题。 报道中提到,全球多地用户近日集中报告称(故障报告已超千例),这...
02-10
极目新闻记者 陈凌燕收集整理2月7日晚,第九届亚冬会在哈尔滨开幕。关于这场冰雪盛会,这些“热知识”赶紧分享给你。哈尔滨冰雪大世界园区内的第九届亚冬会会徽冰建景观(新华社...
02-08
2月9日,哈尔滨亚冬会速度滑冰男子5000米决赛,中国队包揽金银铜牌。吴宇夺得金牌,刘瀚彬获得银牌,哈那哈提·木哈买提获得铜牌。...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮