“北京造”大模型GLM-4.5开源 综合性能世界领先

4个月前 来源:千龙网 观看:72

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。4M5即热新闻——关注每天科技社会生活新变化gihot.com

图片14M5即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。4M5即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。4M5即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)4M5即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。4M5即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。4M5即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”4M5即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。4M5即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。4M5即热新闻——关注每天科技社会生活新变化gihot.com

图片24M5即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。4M5即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。4M5即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。4M5即热新闻——关注每天科技社会生活新变化gihot.com

图片14M5即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。4M5即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。4M5即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)4M5即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。4M5即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。4M5即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”4M5即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。4M5即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。4M5即热新闻——关注每天科技社会生活新变化gihot.com

图片24M5即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。4M5即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。4M5即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3196-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
昆虫即使在弱光条件下也能表现出极其优秀的敏捷性和反应能力。秘密在于它们的复眼能以惊人的速度和灵敏度检测运动。韩国科学技术院研究人员模仿这...
01-21
1月13日,由浙江大学杭州国际科创中心(以下简称“科创中心”)人形机器人创新研究院联合镜识科技有限公司、杭州凯达尔焊接机器人股份有限公司研发的四...
01-21
  我国铁路实行“实名购票”政策,旅客在购票、进站、乘车等环节都需要刷身份证。返程途中,旅客...
02-08
  国家移民管理局10日发布公告,即日起,实施东盟国家旅游团入境云南西双版纳免签政策,10个东盟国...
02-11
新闻记者 曹磊通讯员 王璐 吕巍在手机上登录各大外卖、团购、电商平台,搜索“江城百臻”,就能立即下单,10分钟至30分钟内就能够拿到最地道的武汉地理农产品。1月21日,新闻记者从...
01-21
近年来,短小精悍、剧情跌宕的短剧,发展成网络影视的一种新业态,短剧出海也成为我国文化产业的一个新风向。截至2024年8月,头部海外短剧App的地区数据中,美国的收入达1.51亿美元(约...
01-22
  据外媒报道,加拿大政府日前表示,一旦可用资金耗尽,将“暂停”其零排放车辆补贴计划,取消对符合...
01-21
1 月 30 日消息,特斯拉CEO埃隆・马斯克(Elon Musk)在昨天的财报电话会议上表示,特斯拉将于 6 月在美国得克萨斯州奥斯汀推出“无人监督、无人驾驶”的 Robotaxi 出租车...
01-31
《六姊妹》房子给了谁?六姊妹大结局介绍‌《六姊妹》的房产最终给了何家喜‌。在大结局时,母亲刘美心将老宅过户给了何家喜,起因是因为何家丽。刘美心在退休后...
02-22
在娱乐圈这个光芒四射的舞台上,何炅以其出色的主持能力和温文尔雅的气质,长久以来深受观众喜爱。然而,近日他再次成为话题焦点,并非因为新的节目或作品,而是他那令人惊叹的健身成...
02-22
  近日,我国发现一起猴痘病毒Ⅰb亚分支聚集性疫情,传染源为1位外籍人员,有刚果(金)旅居史。发现疫情后,国家及浙江、广东、北京、天津等省(市)迅速启动联防联控机制,开展流调...
01-21
21世纪经济报道记者 唐唯珂 广州报道随着全国生物药联盟集采的临近,生物类似药市场正面临一场重大变革。2025年1月14日,安徽省医保工作会议...
01-23
  大众网记者 秦瑾 通讯员 朱睿斌 报道  近日,济南市教育局公布了2024年度市校融合发展战略工程支持项目名单,齐鲁师范学院科学教育和基础学科创新后备人才培养市校共...
01-21
为了进一步做好辽宁省普通高等学校专科层次起点升本科教育(以下简称“专升本”)考试招生工作,从2025年起,辽...
01-21
  财联社1月15日讯(编辑 李响)当前,信托行业正处于转型发展的关键时期,信托公司迎来了新一轮发展...
01-22
  □记者 钟源 北京报道  国务院办公厅近日转发国家金融监管总局《关于加强监管防范风险推...
02-05
天蝎座的男生通常以冷静、深沉而闻名。当他们遇到问题或者感到困惑时,他们往往需要一段...
01-22
天秤男是十二星座中最具有浪漫气质的一位,他们善于表达情感,对待爱情充满了热情和渴望。...
01-22
外科风云获奖? 外科风云真相?一、外科风云获奖?获得第31届电视剧飞天奖提名和第四届亚洲彩虹盛典优秀电视剧男配角奖项。该剧讲述了空降到仁合医院美籍华裔医生庄恕(靳东 饰)与胸...
02-07
解读米雅潮流服饰:追寻时尚与个性的完美结合时尚界总是瞬息万变,品牌如雨后春笋般涌现,但能让人铭记的却屈指可数。米雅潮流服饰,这个新兴品牌,凭借其独特的风格与设计理念,迅速吸...
02-07
1.抖音再次下调商家保证金随着春节假期临近尾声,大家也都开始陆续复工。而为了鼓励商家以更加饱满的热情投入到工作中,抖音电商再次出手,推出了一系列扶持商家的新举措。近日,抖...
02-08
2月9日消息,从年初五到开工第一周,天猫上开运工位装饰用品同比增长超50%,迎来正式开工的年轻职场人把办公桌变成了许愿池,乐高招财猫、故宫金桂盆景香氛、朱炳仁聚宝盆等“祈福...
02-09
随着2025年1月的新年序曲轻轻响起,一批精选的冬季好物如约而至。《消费者报道》在这个岁末年初的温馨时刻,精心策划并发布了本年度1...
02-07
2月21日消息,春节假期落下帷幕,机酒价格双双下降,节后错峰出游成为趋势。美团旅行数据显示,2月5日以来,全国文旅订单量较上月同期上涨24%,南京、西安、洛阳、北京、开封、哈尔滨、...
02-22
12月3日消息,悦点科技宣布公司完成数千万人民币的天使轮融资。此次融资由云启资本独家投资,本轮融资将主要用于悦点科技在企业级GenAI应用平台的进...
02-07
【#合肥市创业投资引导基金公司增资至59亿# 增幅23%】天眼查App显示,近日,合肥市创业投资引导基金有限公司发生工商变更,注册资本由约48.2亿人民币增至约59.2亿人民币,增幅约23%...
02-09
根据《毁灭战士:黑暗时代》Steam页面,这款FPS游戏将采用第三方DRM:D加密。考虑到《夺宝奇兵:古老之圈》没有使用D加密,因此这多少有点让人意外。 所以这意味着《毁...
01-31
近日据外媒报道称,RTX 5090、5080虽然上市还没有半个月,但已有不少用户反映显卡出现崩溃黑屏问题。 报道中提到,全球多地用户近日集中报告称(故障报告已超千例),这...
02-10
当地时间2月2日,美国华盛顿消防部门表示,已确定两机相撞事故中55名遇难者的身份。当地时间1月29日,一架美国国内支线客机在罗纳德·里根华盛顿国家机场同一架美军直升机在半空...
02-03
极目新闻记者 周治涛“这一杯要敬侄女,感谢去年直播帮我卖山货赚了几千元。”大年初二,家住湖北宜昌鄂西山区五峰土家族自治县的曾春林,到舅舅家拜年,饭桌上舅舅对她连连致谢。...
02-04
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮