“北京造”大模型GLM-4.5开源 综合性能世界领先

1个月前 来源:千龙网 观看:71

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。9lz即热新闻——关注每天科技社会生活新变化gihot.com

图片19lz即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。9lz即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。9lz即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)9lz即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。9lz即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。9lz即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”9lz即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。9lz即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。9lz即热新闻——关注每天科技社会生活新变化gihot.com

图片29lz即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。9lz即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。9lz即热新闻——关注每天科技社会生活新变化gihot.com

7月28日晚,北京智谱华章科技股份有限公司(以下简称"智谱AI")发布其新一代旗舰大模型GLM-4.5,这是一款专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上实现能力融合与技术突破,综合测试性能已跻身全球领先行列。9lz即热新闻——关注每天科技社会生活新变化gihot.com

图片19lz即热新闻——关注每天科技社会生活新变化gihot.com

这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。9lz即热新闻——关注每天科技社会生活新变化gihot.com

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。9lz即热新闻——关注每天科技社会生活新变化gihot.com

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)9lz即热新闻——关注每天科技社会生活新变化gihot.com

该款旗舰大模型发布仅十小时,便引发全球外媒关注。价格因素同样是关注焦点,报道普遍聚焦该模型 “成本更低、性能更优” 的特性,部分媒体还对其参数进行了详细解析与同类对比。目前该系列模型API调用价格低至输入0.8元/百万tokens、输出2元/百万tokens,远低于市场主流价格。9lz即热新闻——关注每天科技社会生活新变化gihot.com

28日模型发布后不到两个小时,X平台就在首页推荐了这款中国大模型。CNBC在28日报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。” 路透社28日在报道中提到,作为中国 “AI 六小虎” 之一的智谱,自今年6月被OpenAI“点名”后便备受关注。彭博社表示,OpenAI的挑战者智谱AI发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。另一家美国知名科技媒体VentureBeat则在文章中指出:“GLM-4.5的发布为企业团队提供了一个可行的、高性能的基础模型。对于平衡创新和运营限制的团队来说,这是一个令人信服的选择。”发布后不到12小时,GLM-4.5模型已经位列国际开源社区Hugging-Face榜单全球第二。《环球时报》针对于该款模型进行整版报道,受到国内外业界高度关注。9lz即热新闻——关注每天科技社会生活新变化gihot.com

美国科技网站Techi 认为,中国AI发展正清晰呈现 “易获取” 的趋势:“智谱努力与深度求索、OpenAI等行业巨头同台竞技。随着更多企业推出开源模型并压低价格,中国正逐步成为全球AI竞争的核心参与者,力争占据领先地位。未来几个月,这些快速变化将带来何种影响——是催生新的监管政策,还是推动新的技术创新,仍有待观察。”9lz即热新闻——关注每天科技社会生活新变化gihot.com

受到大模型关注的除了这款大模型的性能,还有一个最大亮点是这是首款原生融合模型,首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。9lz即热新闻——关注每天科技社会生活新变化gihot.com

大语言模型的目标是在广泛领域达到人类认知水平。然而,现有模型仍然算不上真正的通用模型:有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。GLM-4.5正是朝着统一各种能力这一目标努力,力求在一个模型中集成所有这些不同的能力。大模型的下一个范式,一定是把各种能力整合到一起,成为一个“全优生”。9lz即热新闻——关注每天科技社会生活新变化gihot.com

图片29lz即热新闻——关注每天科技社会生活新变化gihot.com

其次这款模型拥有更高的参数效率。GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-bench Verified 榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,这表明在相同规模下,GLM-4.5系列实现了最佳性能。9lz即热新闻——关注每天科技社会生活新变化gihot.com

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。用户可通过智谱大模型开放平台使用该模型,其开源版本也将同步登陆Hugging Face与ModelScope平台。9lz即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3187-0.html“北京造”大模型GLM-4.5开源 综合性能世界领先

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:调查|外骨骼机器人火了!能干啥?哪儿能买?贵不贵?

下一篇:清华突破软体机器人操控难题 磁性机器人像“液滴”般移动

为你推荐
  据国务院国资委8月6日消息,近日,国务院国资委、国家发展改革委印发《关于规范中央企业采购管...
01-21
1月21日,记者从福州大学获悉,该校物理与信息工程学院森林火灾智能防控科研团队首次利用计算机视觉和人工智能技术,通过无人机从空中采集火场的可见光...
01-22
  1月22日,腊月二十三,这一天是北方传统的小年,而南方传统的小年则在腊月二十四。小年到,甲辰龙年...
01-23
  尼泊尔一名官员22日说,尼政府已提高从南坡攀登世界最高峰珠穆朗玛峰的许可费。  尼泊尔文...
01-24
新闻通讯员 王伟2025年1月20日,“国补”政策首次扩围至消费电子行业。对个人消费者购买华为手机、平板、智能手表手环等3类数码产品(单件销售价格不超过6000元),按产品销售价格...
01-21
  如何避免“每逢佳节胖三斤”  ◎本报记者 张佳星  不少人都有“每逢佳节胖三斤”的经历。传统佳节将至,亲友聚会增多,外出餐饮频繁,如何在过好节日的同时保持健康体...
01-21
1 月 27 日消息,今日,极氪海外第 15000 台汽车在澳洲正式交付。极氪表示将在 2025 年持续深化国际化战略,重点关注销售和服务网络的拓展与升级,计划 2025 年在海外建设 ...
01-28
1 月 27 日消息,特斯拉副总裁陶琳今日发文对焕新 Model Y 的空调系统进行了介绍,这款新车预计 3 月开始交付,后轮驱动首发版(593km 标准续航)26.35 万元,全轮驱动首发版(71...
01-28
  1、《爱你》电视剧定档于2025年2月25日上映,张凌赫和徐若晗领衔主演。  2、张凌赫饰演的何苏叶是个温柔坚韧的中医院肿瘤科医生,徐若晗演的沈惜凡有重度失眠,在看诊的时...
02-20
《余烬之上》颂恩被谁杀了?颂恩是凶手吗?在《余烬之上》中,颂恩没有被人杀死,而是疯了。颂恩是一个从事操纵少女卖卵代孕黑产业的无良医生。在剧情中,颂恩在路边...
02-20
21世纪经济报道记者武瑛港 北京报道近日,羟基磷灰石的使用问题在医美行业内快速升温。记者获悉,2025年1月21日,深圳市市场监督管理局、深圳市...
01-23
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向两部门:2025年底前 所有省份要将省内异地住院...
02-05
  大众网记者 王一刚 报道  在深化教育改革、全面提升教育质量的背景下,燕山小学教育集团积极响应国家号召,致力于探索并实施具有前瞻性和创新性的教育理念,以培养全面...
01-21
近日,人民网辽宁频道、中央广播电视总台辽宁总站、光明日报辽宁记者站、中国日报辽宁记者站、中新社辽宁...
01-21
   当地时间1月24日(周五),美股三大指数收跌,道指跌0.32%,标普500指数跌0.29%,纳指跌0.5%。美国1月...
01-27
  原标题:1月份信托产品发行规模超300亿,基础产业类及金融类非标信托产品热度提升  财联社2月...
02-11
狮子男是十二星座中最有自信和魅力的一位,他们对于爱情充满了激情和渴望。当一个狮子男...
01-22
天秤座的男人通常被认为是温和、理性、追求平衡的代表。他们对于爱情有着独特的追求和...
01-22
男生夏季穿搭推荐? 男生夏季长裤穿搭推荐?一、男生夏季穿搭推荐?男生夏天穿搭可以很好看。因为夏天的气温高,要考虑到透气性和舒适感。一些好看的夏季着装包括T恤配休闲裤或牛仔...
02-12
领略T台魅力:模特背后的故事与时尚之舞我记得第一次走进一个时尚秀场,那时的我只是个对时尚充满好奇的观众。随着模特们优雅地走过T台,身上闪烁的华美服装在灯光下折射出迷人的...
02-12
库克打出2025年第一张王牌。一、新款iPhone SE,售价不到4000?苹果新机马上来了!库克发文吊人胃口。就在今日凌晨时分,苹果CEO蒂姆·库克在社交媒体上发布了一段简短却充满悬念的...
02-15
2月20日消息,闲鱼数据显示,过去一年中,平台上的循环订单量同比增长近50%,覆盖手机数码、家具家电、服饰、图书等品类。在线上,超1亿人在闲鱼挂出闲置物品,每天都有超400万件闲置物...
02-21
2月10日消息,四川省发展改革委(省数据局)公布2024年度四川省数字化转型促进中心名单,共有18家申报单位获得批复认定,四川合纵药易购医药股份有限公司入选名单。这是四川省新修订...
02-11
被业内称为“开店狂魔”的库迪咖啡正在频频试水新业态,以期实现门店规模的快速增长及门店收入的提升。 2月13日,库迪咖啡宣布推出新...
02-15
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
【#浙创浙江自贸区股权投资基金登记成立# 出资额10亿】天眼查App显示,近日,浙创(浙江自贸区)股权投资基金合伙企业(有限合伙)成立,执行事务合伙人为北京浙商华盈创业投资管理有限公...
02-09
今日(1月26日),女性向视觉小说《Thesis of Love 心动论证》Steam页面开放,2026年发售,游戏支持简体中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 在千...
01-28
2025年开年最成功的中世纪背景角色扮演游戏《天国:拯救2》,目前已在Steam平台连续两周登顶销量榜榜首,在线峰值也突破了25万人。 近日有玩家发现这款热门游戏还...
02-13
极目新闻记者 陈凌燕收集整理2月7日晚,第九届亚冬会在哈尔滨开幕。关于这场冰雪盛会,这些“热知识”赶紧分享给你。哈尔滨冰雪大世界园区内的第九届亚冬会会徽冰建景观(新华社...
02-08
记者从四川省通信管理局获悉,2025年2月8日,四川省宜宾市筠连县沐爱镇金坪村发生山体垮塌,受灾区域累计退服基站3个,光缆受损7.5公里。灾害发生后当地进行抢修,截至2月9日16时,退服...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮