“北京造”大模型GLM-4.5开源 综合性能世界领先

6个月前 来源:千龙网 观看:119

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。USU即热新闻——关注每天科技社会生活新变化gihot.com

图片1USU即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。USU即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。USU即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)USU即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。USU即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。USU即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”USU即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。USU即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。USU即热新闻——关注每天科技社会生活新变化gihot.com

图片2USU即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。USU即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。USU即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。USU即热新闻——关注每天科技社会生活新变化gihot.com

图片1USU即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。USU即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。USU即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)USU即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。USU即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。USU即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”USU即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。USU即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。USU即热新闻——关注每天科技社会生活新变化gihot.com

图片2USU即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。USU即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。USU即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3187-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
2025年1月16日,华为车BU业务“继承者”引望迎来了成立的第一周年。引望全名为深圳引望智能技术有限公司,成立于2024年1月16日,彼时为...
01-21
锣鼓一响,秧歌上场!锦州新春,喜气洋洋;杀年猪、冬捕鱼,锦州年味儿到底有多热闹?剪纸、撕纸、葫芦烙画冻梨、炸...
01-22
  据网络平台数据,截至2月7日21时,电影《哪吒之魔童闹海》票房(含预售)突破67.922亿,超过《星球...
02-08
  1月20日,北京住房公积金管理中心(以下简称“公积金中心”)发布《关于开展提取住房公积金直付...
01-21
  春运第5日铁路客流开始呈现大幅上升趋势  中新网广州1月18日电(郭军 任永霜 李格格)1月18日,2025年春运进入第五日。据广铁集团数据显示,从当日开始,铁路整体客流开始呈...
01-21
[本站 资讯] 日前,小米YU7实车图再度曝光,这组实车图展示给我们新车的更多细节,新车定位为中大型SUV,售价预计会在30-40万之间,并将在2025年6月-7月份正式上市。此次最新...
01-24
1 月 27 日消息,据《读卖新闻》今日报道,日本经济产业省计划从今年 4 月起提高对电动汽车等环保车辆购车者的补贴。对采用了低碳钢材(绿色钢铁)作为车身的车型,补贴金额...
01-28
最近《树下有片红房子》的讨论度非常高,每一次更新都能引发观众长时间的热议。剧中的各种发展牵动着大家的心,尤其是第11集的剧情。景栖迟参加特训选拔,陈欢尔...
02-21
《重症外伤中心》一经播出便迅速登上各大平台的热门榜单,吸引了众多观众的关注。这部电视剧中,白江赫医生在医疗事故后遭受误解与危机的故事引起了广泛讨论。...
02-22
  “在基本医保现有的甲乙分类基础上,我们正在研究制定丙类药品目录,这是完善我国医疗保障药品...
01-21
21世纪经济报道记者季媛媛 日本报...
02-04
  大众网记者 司心鹏 报道  12月24日至12月26日,第三届全国职业技能大赛化学实验室技术赛项山东省选拔赛在山东化工技师学院世界技能大赛化学实验室技术项目中国集训...
01-21
  大众网记者 司心鹏 报道  近日,教育部发布了《关于推荐国家特殊教育改革实验区的通知》,旨在适应特殊教育改革发展的新形势新要求,在全国范围内设立一批特殊教育改革...
01-21
  摘要  当前中美棉花交易的逻辑有两条,一是产量明显增加后的库存消化情况,以及对2025/2026年...
01-21
  摘要  【黄金价格再攀新高足金首饰价格冲破830元/克】COMEX黄金价格报2762美元/盎司,创近...
01-24
射手男是一个热爱自由、追求刺激的星座,他们喜欢冒险和探索未知的领域。因此,对于射手男...
01-22
狮子座的男生通常都有着强烈的个人魅力和自信心,他们喜欢成为众人关注的焦点。当狮子男...
01-22
魅力无限:帅气女明星带给我们的时尚风潮在当今娱乐圈,女明星们不仅仅是表演艺术的展现,更是时尚与个性的一种引领。在我看来,帅气女明星之所以吸引眼球,不仅在于她们的才华与美貌...
02-12
矮个子男生穿搭? 155矮个子男生穿搭?一、矮个子男生穿搭?1.腰部高出5cm-7cm矮个子男生选择男士裤子时,腰部高出5cm-7cm是最好的。这样的选购小心机,对小个子男生来说很适用。2.脚...
02-17
2月8日消息,淘宝数据显示,由导演饺子创作的哪吒系列形象授权周边在平台上销售额目前已经突破了5000万。其周边种类也覆盖了盲盒、卡牌、毛绒、搪胶娃娃、胶片卡、冰箱贴、徽章...
02-09
2月16日消息,淘宝香港站近日宣布与一站式家居维修平台Papabo达成合作,将在信和集团旗下尖沙咀中港城开设“PapaHome淘宝家具实体店”,计划于2月22日开业,首阶段营运面积超过2.5...
02-17
中国火锅品牌正在逐步打开中东市场的大门。近年来,刘一手、海底捞、小龙坎、哥老官等在中国各城市常见的连锁火锅品牌,纷纷进入中东...
03-01
“老花眼”是随着年龄增长而自然出现的一种视觉问题,通常在40岁左右开始显现。为解决这一问题,专为老视人群设计的光学眼镜——老花...
03-04
从学生成长需求出发,用专业研发与科学配比为学生群体提供全方位护航的食用植物油方案——自2024年8月上市以来,中粮福临门学生营养餐专用食用植物调和油在学生油市场中反响热...
01-21
近日,朴烯晶新能源材料(上海)有限公司(以下简称“朴烯晶”)完成数亿元B轮融资。本轮融资由国科东方领投,大零号湾策源基金、尚研莘工基金、民银国际跟投...
02-07
谷歌于上个月与三星和高通合作,推出了安卓扩展显示(AndroidXR)平台。 公司称它是“为下一代计算构建的新操作系统”,并且目前收购了 HTC Vive 的部分工程团队,他们...
01-25
曾为《上古卷轴》系列献声的资深游戏配音演员韦斯·约翰逊突发重病入院,其家人已在GoFundMe平台发起医疗费募捐。截至发稿时,该活动已筹得超5.2万美元(最初目标5...
01-31
来自2025年综合运输春运工作专班数据显示,2025年2月4日(春运第22日,农历正月初七),全社会跨区域人员流动量预计34611万人次。其中,铁路客运量1690万人次,公路人员流动量32556万人次...
02-04
随着电影《哪吒之魔童闹海》热映,“哪吒”系列导演饺子也走进了大众视野,大家对这位“半路出家”的“细节控”颇感兴趣,在一些饺子接受媒体采访的视频片段下,总能看到不少网友的...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮