“北京造”大模型GLM-4.5开源 综合性能世界领先

7个月前 来源:千龙网 观看:122

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。3U8即热新闻——关注每天科技社会生活新变化gihot.com

图片13U8即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。3U8即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。3U8即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)3U8即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。3U8即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。3U8即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”3U8即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。3U8即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。3U8即热新闻——关注每天科技社会生活新变化gihot.com

图片23U8即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。3U8即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。3U8即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。3U8即热新闻——关注每天科技社会生活新变化gihot.com

图片13U8即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。3U8即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。3U8即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)3U8即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。3U8即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。3U8即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”3U8即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。3U8即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。3U8即热新闻——关注每天科技社会生活新变化gihot.com

图片23U8即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。3U8即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。3U8即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3187-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
从空间太阳能发电到破解大脑基因密码,再到由真菌制造的自我修复材料,《欧盟研究与创新》杂志盘点了2025年有望大放异彩的创新技术。这些成果拥有广阔...
01-21
当下,IP成为了企业品牌发展的主旋律,而创始人IP更是企业品牌营销中常见的一个名词。2024年12月26日至28日,全球创始人IP领袖高峰论坛顺应时势,围绕“创...
01-21
  受东北地区强冷空气影响,近期,渤海辽东湾海域海冰发展迅速,面积将达到今冬以来的最大值。...
01-28
  至1月27日10时40分,经与交警部门协商,沈阳、葫芦岛、铁岭、锦州、大连、抚顺、盘锦、阜新、营口部分...
01-28
过去半年,为防治部分地方政府招商“内卷化”,遏制拼优惠、拼“政策洼地”式的政府招商模式,一系列文件、法规密集推出。 “去年8月拼...
01-21
  一场公交车小型化潮流,正在席卷全国部分城市。  “宝宝巴士”越来越多  2025年初,不少青岛居民发现,新的公交车“缩水”了。  以前那种“巨无霸”的公交车越来越...
01-21
  日前,中国汽车流通协会发布的《2024年12月中国汽车保值率报告》(以下简称《报告》)显示,2024...
01-24
2024传统汽车品牌不断退出转投新势力的消息,接踵而至,不断见诸报道,造成了市场对传统汽车品牌不振的直观感受。事实上,在激烈的车市大浪淘沙阶段,无论是传统品牌和新势力,开店或闭...
01-25
  范志忠  剧本是一剧之本。夏衍在《写电影剧本的几个问题》一书中曾说,“一个剧的成败,大部...
01-24
近日,海口市公安局龙华分局宣布,知名导演郑某某因涉嫌猥亵儿童罪已被刑事拘留。这一消息迅速在社交媒体上发酵,引发了广泛关注和讨论。据了解,郑某某在电影《美人鱼》中曾扮演过...
02-22
21世纪经济报道记者李佳英、季媛媛 广州、上海报道 细胞疗法,作为新一代精准医疗技术的典范,正在推动全球生物制药行业的最新一轮发展和变革...
01-25
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家医保局发布2025年度第一批重点事项清单2...
02-17
  大众网记者 秦瑾 通讯员 李永添 报道  12月24日,德州学院董仲舒书院揭牌开班仪式在厚德楼第二报告厅举行。德州市人民政府原副市长、一级巡视员董绍辉,上海交通大学...
01-21
  教学和布置作业不依赖电子产品,使用电子产品开展教学时长原则上不超过教学总时长的30%……近日,省教...
01-21
  中国网财经1月15日讯 持牌消金进入纵深发展阶段后,在重塑业务模式的过程中,消费金融公司们既...
01-22
  本报记者 熊悦  当前正值“开门红”销售旺季,一批中小银行的大额存单产品陆续上新。  春...
02-08
天秤男是一个追求平衡和和谐的星座,他们善于处理人际关系,注重公正和公平。然而,在与天秤...
01-22
天秤男是一个追求平衡和和谐的星座,他们喜欢美丽、优雅的事物。当他们遇到某个特定的星...
01-22
2017 T台上的风潮:皮裤模特的时尚之旅回顾2017年,时尚界交相辉映,各大品牌在T台上用于展示最新潮流的方式层出不穷。而在这个过程中,皮裤作为一种独特的时尚单品,成功吸引了观众...
02-07
165男士成熟稳重穿搭攻略?一、165男士成熟稳重穿搭攻略?165男生穿衣搭配技巧:①:165男生在穿衣搭配方面要注意最好穿同色系的衣服、短款上衣,此外,不要穿的太花哨。总之,选择适合自...
02-17
网约车市场正在悄然发生变化,如同暴风雨来临前的宁静,让人恐惧。1、抖音上线打车服务抖音不仅能刷短视频,现在还能直接打车了。据Tech星球独家消息,抖音在近日上线了打车服务,入...
02-07
2月16日消息,淘宝香港站近日宣布与一站式家居维修平台Papabo达成合作,将在信和集团旗下尖沙咀中港城开设“PapaHome淘宝家具实体店”,计划于2月22日开业,首阶段营运面积超过2.5...
02-17
3月1日消息,在北京大学国家发展研究院【承泽论坛】第32期,智联招聘集团总裁张月佳指出,在数字技术的加持下,更多职场人有机会成为“超级个体”,而HR是寻找与培养超级个体的关键。...
03-01
2月27日消息,第二十六届哈尔滨冰雪大世界正式闭园,宣告本期冰雪季结束,途牛《2024-2025国内冰雪旅游消费盘点》数据显示,2024年12月以来,冰雪旅游市场人气与热度不断攀升,并呈现出...
03-01
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
《漫威蜘蛛侠2》PC移植版因为优化和其他技术问题而遭到大面积的批评。Steam中文区评价“多半差评”,好评率仅仅33%,被玩家吐槽优化太烂! 而在海外PC社群中,《漫威...
02-03
Too Kyo Games工作室宣布,旗下新游《百日战纪-最终防卫学园-》PC体验版将于2月19日登场,存档可继承到正式版,Switch版的试玩稍后发布,敬请期待。 《百日战纪-最终...
02-13
极目新闻记者 陈凌燕WTA官方社交平台截图2月6日,郑钦文抵达多哈。WTA1000多哈站是2025赛季首个1000级别赛事,郑钦文的亮相,引发大量球迷关注。眼尖的球迷更发现,郑钦文团队中添...
02-06
2025年综合运输春运工作专班数据显示,预计2025年2月9日(春运第27日,农历正月十二),全社会跨区域人员流动量20629万人次,其中,铁路客运量1330万人次,公路人员流动量18983万人次(高速公...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮