“北京造”大模型GLM-4.5开源 综合性能世界领先

3周前 来源:千龙网 观看:37

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。DKR即热新闻——关注每天科技社会生活新变化gihot.com

图片1DKR即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。DKR即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。DKR即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)DKR即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。DKR即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。DKR即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”DKR即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。DKR即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。DKR即热新闻——关注每天科技社会生活新变化gihot.com

图片2DKR即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。DKR即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。DKR即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。DKR即热新闻——关注每天科技社会生活新变化gihot.com

图片1DKR即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。DKR即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。DKR即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)DKR即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。DKR即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。DKR即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”DKR即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。DKR即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。DKR即热新闻——关注每天科技社会生活新变化gihot.com

图片2DKR即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。DKR即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。DKR即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3196-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
随着人类探索太空的脚步迈得越来越大,在月球上,甚至在火星上驻留并建设基地成为可能。想在月球上居住和旅行,水、氧气等生存资源和交通工具就不可或缺...
01-21
来自美国亚利桑那大学的天文学家团队使用大型双筒望远镜干涉仪,在红外波段捕捉到了迄今为止最清晰的活动星系核(AGN)图像,并将研究结果发表在最新一期...
01-21
  【带你一起看大展】  光明日报记者李韵王笑妃  1月21日,记者走进中国国家博物馆北3展厅,...
01-23
针对即将到来的寒潮大风天气为保障海上人命安全1月24日天津海事局、辽宁海事局河北海事局、山东海事局...
01-27
新闻记者 康旭阳 通讯员 沈商轩实习生 何世银1月21日,全国手机、平板、智能手表(手环)购新补贴政策实施暨“年在荆楚 巳巳如意”湖北新春消费季启动仪式在武汉举行。新闻记者获...
01-22
  中新经纬1月16日电 商务部流通发展司司长李佳路表示,手机等3类数码产品的补贴为购新补贴,不是以旧换新,不以“交旧”为前提。  16日,商务部召开手机等数码产品购新补贴组...
01-21
在全球汽车产业风起云涌的变革浪潮中,中国汽车品牌正以坚定的步伐和昂扬的姿态,向世界展示着中国力量。1月22日,一场以“心所向,自纵横”为主题的盛会在北京国家会议中心隆重举...
01-24
1 月 24 日消息,据国家市场监督管理总局消息,近日,国际标准化组织批准由我国牵头的 7 项新能源汽车领域国际标准项目立项,涉及电动汽车整车、动力电池、燃料电池及换电 ...
01-24
  1、《五福临门》中官家没有妹妹,剧中更没有官家和妹妹相认的情节。  2、网传郦家三娘康宁是官家的妹妹,这种说法完全是网友杜撰出来的,郦三娘是郦娘子亲生女儿,她跟郦士...
02-14
《180天重启计划》播出后受到了观众的喜爱和追捧。剧中第5集的剧情引起了广泛讨论,以下是该集的主要内容。吴俪梅叫醒顾云苏,让她好好打扮去见一个重要的人。...
02-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家医保局预设“互联网首诊”价格项目日前,...
01-24
  回望现代医学的发展,我们不得不承认有一些“疾病”是和时代捆绑在一起的,但也有一些,似乎像是...
02-08
  大众网记者 杨涛报道  近日,在第十六届山东省大学生科技节——山东省大学生消防安全技能大赛中,青岛港湾职业技术学院应急管理学院23级建筑消防技术与应急救援技术专...
01-21
1月22日,香港科技大学上海中心在徐汇滨江成立,港科大将与上海合作打造人才...
01-23
  中国经济网北京1月21日讯 A股五大上市保险公司近日纷纷“晒”出2024年全年保费收入(指原保险...
01-21
  近日,多家消费金融公司围绕春节购物、出行、旅游等消费需求,打造多样化服务和优惠举措,推出满...
01-24
每个人都有自己的喜好和偏好,而星座也可以给我们一些线索,帮助我们了解一个人的性格特点...
01-22
双鱼座的男生通常是浪漫、敏感且富有想象力的人。他们渴望与一个特别的女生建立深厚的...
01-22
她是当今最美的女明星,你同意吗?在娱乐圈,讨论“谁是最美的女明星”一直是个热门话题。从银幕上闪耀的光芒到红毯上的璀璨,每位女明星都有她独特的魅力和风格。但在这其中,究竟谁...
02-07
潮流时尚从婷婷姐开始:揭秘最新服饰趋势在这个瞬息万变的时尚界,寻找一位真正能够引领潮流的时尚达人并不容易。而我最近接触到的婷婷姐,正是这样一位充满魅力的时尚先锋。她的...
02-07
2月13日消息,常州同惠电子股份有限公司日前与京东工业品举行战略合作签约仪式,同惠电子董事长赵浩华与京东工业品副总裁郭晓博代表双方签署协议。图源:Tonghui同惠公众号根据协...
02-14
2月15日消息,1688数据显示,2024年1688跨境生意订单规模同比增长超70%,2025年1688将进入海外15个国家和地区。“过去,许多工厂因缺乏外贸经验,只能依赖外贸公司或放弃海外市场。如...
02-15
2月6日消息,及时用车日前宣布,平台自2月3日起,全国统一上线“司机每日提现”权益,以解决司机资金周转难题,提升车辆运维效率,保障车辆资产安全。即日起,无论工作日还是节假日,司机师...
02-07
2月20日消息,高德地图近日联合国家信息中心大数据发展部、清华大学土木水利学院、同济大学智能交通运输系统(ITS)研究中心、未来交通与城市计算联合实验室等机构共同发布《2024...
02-21
空调界“价格屠夫”要来了。作者 | 笔锋来源 | 投资家(ID:touzijias)空调界“价格屠夫”要来了。12月底,70岁的董明珠在访谈中被问及退休问题时,她意味深长地暗示“明年可能会退...
01-21
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
《狙击精英》系列最新作《狙击精英:抵抗》已于1月30日正式发售,Steam国区定价168元,豪华版268元。截至目前,该作在Steam上仅收获了698个评价,好评率也不高,仅68%,为褒...
02-03
根据SE的最新财报显示,《勇者斗恶龙3:HD-2D重制版》的销量超过了公司预期,该作的成功也推动了SE游戏部门的营收增长,净销售额总计高达600亿日元,营业利润为46亿日元...
02-10
中央气象台今早6点继续发布大风黄色预警和寒潮蓝色预警。大风黄色预警:预计今天8点到明天8点,华北、内蒙古中部、宁夏、陕西北部、黄淮等地的部分地区有5~6级、阵风7~8级的偏...
02-06
据新加坡《联合早报》网站2月4日报道,台湾女星大S(徐熙媛)春节期间因流感并发肺炎病逝,震惊岛内,台湾多地近日出现抢打疫苗潮。2月3日,《康熙来了》节目组发文称,小S(徐熙娣)证实大S(...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮