“北京造”大模型GLM-4.5开源 综合性能世界领先

10个月前 来源:千龙网 观看:146

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。Phl即热新闻——关注每天科技社会生活新变化gihot.com

图片1Phl即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。Phl即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。Phl即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)Phl即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。Phl即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。Phl即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”Phl即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。Phl即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。Phl即热新闻——关注每天科技社会生活新变化gihot.com

图片2Phl即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。Phl即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。Phl即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。Phl即热新闻——关注每天科技社会生活新变化gihot.com

图片1Phl即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。Phl即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。Phl即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)Phl即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。Phl即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。Phl即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”Phl即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。Phl即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。Phl即热新闻——关注每天科技社会生活新变化gihot.com

图片2Phl即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。Phl即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。Phl即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3187-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
图源:图虫创意 还有10天就是除夕,作为2025蛇年春晚独家电商...
01-21
昆虫即使在弱光条件下也能表现出极其优秀的敏捷性和反应能力。秘密在于它们的复眼能以惊人的速度和灵敏度检测运动。韩国科学技术院研究人员模仿这...
01-21
  2月5日,文化和旅游部公布2025年春节假期文化和旅游市场情况。经文化和旅游部数据中心测算,春...
02-08
  日前,记者从省国资委获悉,去年省属企业再接再厉,实现利润总额80.55亿元,同比增长75.2%,利润增速全国排名...
02-10
▲某地一中考考点,考生走出考场。新京报资料图 据央视新闻客户端消息,近日,中共中央、国务院印发了《教育强国建设规划纲要(2024-2035年)》(以下简称《纲要》),《纲要》明确,压减重复...
01-21
  中新经纬1月17日电 据国家统计局网站17日消息,2024年12月份,规模以上工业(以下简称规上工业)原煤、原油、天然气、电力生产平稳增长。  原煤、原油和天然气生产及相关情...
01-21
2 月 1 日消息,东风风行宣布旗下星海S7中大型轿车新增“555 鸿运版”上市,指导价为 10.99 万元,该版本车型定位入门,整理目前东风风行星海S7 具体车型定价如下:555鸿运版...
02-02
  特斯拉在加拿大市场大幅涨价了。  1月23日,特斯拉加拿大网站显示,将于2025年2月1日对主力车...
02-05
《六姊妹》为什么叫刘晓玲?刘小玲汤振民结局是什么在电视剧《六姊妹》中,角色叫刘小玲而不姓何,是因为以下原因:出生惊险致母怒:刘小玲是何家老五,她出生时难产,是...
02-20
《余烬之上》男主是谁啊?余烬之上背后的boss是谁?‌《余烬之上》的男主角是王子奇和孙阳。‌王子奇饰演的廖思远是一个天才破案少年,因童年创伤患上“解离性人...
02-21
  本报北京1月5日电(中青报・中青网记者 刘昶荣)“目前是儿童呼吸道感染的高发期,病原(体)还是以病毒和肺炎支原体为主,病毒主要以流感病毒为主。”在国家卫生健康委今天...
01-21
关于实施2025年卫生健康系统为民服务实事项目的通知国卫办函〔2025〕25号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、中医药局、...
02-14
  大众网记者 张明明 报道  11月11日至14日,由教育部高等教育司指导、中国高等教育学会主办的第四届全国高校教师教学创新大赛产教融合赛道全国赛在重庆邮电大学举行...
01-21
  大众网记者 秦瑾 通讯员 朱睿斌 报道  近日,济南市教育局公布了2024年度市校融合发展战略工程支持项目名单,齐鲁师范学院科学教育和基础学科创新后备人才培养市校共...
01-21
  摘要  【每日龙虎榜】周一商品期货综合指数下跌0.43%,日内资金净流出76.44亿元。一文带你...
01-21
  本报记者 冷翠华 见习记者 杨笑寒  2024年四季度偿付能力报告陆续披露,非上市财险公司的“...
02-11
双子座的男生聪明、机智,善于交际,对新鲜事物充满好奇。如果你想让他爱上你,就需要用一些...
01-22
金牛座男生通常对于女生有着独特的偏好和要求。他们喜欢一种特定类型的女生,下面将介绍...
01-22
日系穿搭特点?一、日系穿搭的特点在穿搭方面日系风简直把休闲做到了极致,要说亚洲潮流文化发祥地,原宿绝对是一大圣地这里除了有常见的时尚大牌,还有亲民的牌子,日系穿搭的主要特...
02-07
明星魅力解析:那些令人倾倒的女神们在光影交错的舞台上,女明星们以她们的美丽和才华征服了无数观众。无论是荧幕上的风情万种,还是红毯上的璀璨夺目,明星的魅力总是让人心醉神迷...
02-12
2月12日消息,情人节前夕,淘宝首次推出礼品卡,同品类可跨店使用。淘宝App显示,目前淘宝礼品卡设有美妆护肤卡、母婴亲子卡,面值共有四档,分别为600、800、1000、2000元。针对即将到...
02-13
2月20日消息,苏宁易购与西门子家电将于2月21日起联合启动“德系精工智能·开年大赏”专属品牌节,通过新品首发、超级工厂直播、门店体验等系列活动,助力消费者解锁智慧生活新方...
02-21
2月25日消息,携程集团公布2024年第四季度及全年财务业绩。四季度,携程集团净营业收入为127亿元,同比增长23%;净利润为22亿元,2023年同期净利润为13亿元;经调整EBITDA为30亿元,2023...
02-25
3月5日消息,抖音生活服务南部大区日前推出“萤光计划”,2025年将投入亿级流量、百万货补,帮助中小商家快速掌握运营技能、降低经营成本、获得交易增长。该计划将从资源激励、产...
03-05
由爱奇艺出品,新力量文化、新影方舟、老有影视联合出品,新力量文化承制,爱奇艺奇正工作室打造,惠楷栋执导,解嬿嬿编剧,谭卓、高叶、刘奕君领衔主演,林雨申特邀领衔出演,扈耀之、田小...
01-21
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
RTX 5090已于1月30日在全球开卖,但因为货源稀少,导致全球各地掀起抢购潮。 据媒体报道,日本东京秋叶原一家名为“电脑工房秋叶原零件馆”的店家限量发售10张RTX...
02-03
近几年育碧的表现相当糟糕,几乎每款新作都以失败告终,比如《碧海黑帆》《星球大战:亡命之徒》《阿凡达:潘多拉边境》等,《不羁联盟》也被关服停运。最近育碧还解雇...
02-03
2月9日是哈尔滨亚冬会开幕后的第二个比赛日,中国代表团以15金15银14铜继续领跑奖牌榜。在滑雪登山女子短距离、滑雪登山男子短距离、越野滑雪女子5公里(自由技术)、自由式滑雪...
02-10
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮