北京AI破壁之路 端侧小模型跑出大能量

2个月前 来源:北京日报 观看:56

jpf即热新闻——关注每天科技社会生活新变化gihot.com

在清华科技园科建大厦3楼,面壁智能联合创始人、CEO李大海的办公室中央挂着一幅大型拼图,一艘船在风雨中劈波斩浪。jpf即热新闻——关注每天科技社会生活新变化gihot.com

今年已是李大海来到中关村的第23年。jpf即热新闻——关注每天科技社会生活新变化gihot.com

2006年,从北京大学数学系毕业后,李大海加入谷歌中国,成为创始员工之一。后来他又参与了云云网、豌豆荚、知乎的创业。2023年,一场大模型掀起的技术风暴席卷而来,时任知乎CTO的李大海决定投身其中。当年4月,在李大海的推动下,知乎完成了对面壁智能的独家天使轮投资。jpf即热新闻——关注每天科技社会生活新变化gihot.com

李大海看好面壁智能,是因为其创始人、青年科学家刘知远是国内首批开展大模型研究的研究者之一。2020年12月,刘知远团队发布了全球第一个中文开源大模型“CPM”,这一项目也是后来中国奠基性大模型“悟道”的前身。两年后,刘知远发起成立面壁智能。jpf即热新闻——关注每天科技社会生活新变化gihot.com

投资一家优秀的大模型企业,对李大海来说绝非终点。大模型掀起的汹涌浪潮让他兴奋得难以入睡。“这是一场堪比蒸汽机改变世界的大变革!”一次次在深夜爬起来看代码、追踪大模型前沿进展的李大海,决定从大厂高管转身,再次创业。2023年6月,李大海出任面壁智能CEO。jpf即热新闻——关注每天科技社会生活新变化gihot.com

彼时,大模型领域激战正酣,一场前所未有的“百模大战”正在上演。与此同时,随着大模型迅猛发展,作为大模型“燃料”的算力告急,行业内出现GPU“一卡难求”“排队预定”的局面。如何才能从白热化的竞争中杀出重围?jpf即热新闻——关注每天科技社会生活新变化gihot.com

高效——是李大海与团队给出的答案。“与其盲目地把模型做大,不如花更多精力让模型变好,以同样的模型参数量实现更高的智能与知识密度。”基于对大模型本质规律的观察,他们提出了大模型的密度定律(DensingLaw):大模型知识密度每3.3个月翻一番,大模型将变得越来越“小”,同时能力越来越强。jpf即热新闻——关注每天科技社会生活新变化gihot.com

基于这一理念,团队选择避开同质化严重的对话式AI聊天机器人,将视野转向了一个在当时看来不算热门的方向——端侧大模型。李大海认为,人们的生活早已离不开手机、平板、汽车等各种各样的硬件终端设备,而在不久的将来,这些智能终端都将拥有具备自主思考能力的“超级大脑”。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“我们要让小模型跑出大能量,让本地模型能力满足日常绝大多数的智能需求。”李大海坚信,相比于时下最火热的跑在“云”上,并且需要大量算力的千亿级超大模型,在“断网、弱网”环境下,仍然能让各种智能终端具备自主思考能力的端侧大模型,将成为面壁独特的竞争力。jpf即热新闻——关注每天科技社会生活新变化gihot.com

用更小的参数、更高的效率、更低的成本,实现更好的智能——达到这个目标,并不容易。“模型能力日新月异,但模型效率的领先如同芯片制程一般,须形成比较硬的相对优势。我们要攻克的,就好比大模型行业的‘光刻机’。”李大海说。jpf即热新闻——关注每天科技社会生活新变化gihot.com

拿算法来说,过去,由于模型训练过程中充满不确定性,传统的大模型训练被业界戏称为“炼丹”。而面壁研发团队通过上千次模型沙盒实验,在算法的各种细节上摸索出了一系列最优配置,大幅优化了模型效果。jpf即热新闻——关注每天科技社会生活新变化gihot.com

为了打磨大模型“光刻机”,从高质量的数据原材料,到模型训练与调校,一个个环环相扣的细节,研发人员都细细打磨。2024年初,面壁推出了端侧大模型MiniCPM,用仅仅24亿参数实现了超过百亿参数大模型的性能。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“超级大脑”仍在不断进化。今年1月,面壁智能发布MiniCPM-o2,这也是全球首个达到OpenAI公司GPT-4o水平的端侧多模态大模型。这款仅有80亿参数量的模型,能够实时流式处理文本、图像、音频和视频信息,“视、听、说”都很伶俐。jpf即热新闻——关注每天科技社会生活新变化gihot.com

在今年中关村论坛年会期间,面壁又发布了一项领先业界的成果——首个纯端侧超级智能助手,可应用于汽车智能座舱。在端侧大模型的支撑下,即便车辆没有网络,超级智能助手也能随时“在线”,实现从车外到车内的各种感知并执行任务。jpf即热新闻——关注每天科技社会生活新变化gihot.com

由于在安全性、实时性等方面的巨大优势,面壁的端侧模型一经推出就很快获得了法律、消费电子等行业用户的认可。就在上月,面壁与合作伙伴发布了首个纯端侧大模型量产车型。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“2026年,装上面壁端侧模型的设备数将达2025年的10倍。”放眼未来,李大海的眼中是更广阔的星辰大海——未来全球将有400亿的设备终端,它们都有望装上一个个“超级大脑”。jpf即热新闻——关注每天科技社会生活新变化gihot.com

独角兽“秘笈”jpf即热新闻——关注每天科技社会生活新变化gihot.com

冷静取舍 以小博大jpf即热新闻——关注每天科技社会生活新变化gihot.com

智谱、月之暗面、百川智能、零一万物、面壁智能……在今年年初第三方机构公布的国内大模型独角兽排行榜中,多家北京企业赫然在列,显示出创新资源高度集聚的效应。jpf即热新闻——关注每天科技社会生活新变化gihot.com

在被人们称为“宇宙中心”的五道口一带,办公租金并不便宜,李大海坦言,背靠五道口周边极强的人才优势,是成立仅三年的面壁得以迅猛发展的重要原因。jpf即热新闻——关注每天科技社会生活新变化gihot.com

身处北京,依靠全国领先的AI人才资源和“AI第一城”的创新生态,与行业巨头凭借巨额资金和海量算力投入“大力出奇迹”的发展路径不同,以面壁为代表的北京人工智能初创企业,向世界展现出高效创新、“以小博大”的创新范式。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“对创业公司来说,‘不做什么’和‘做什么’都很重要,‘不做什么’甚至更重要。”李大海说。面对巨大机遇,创业公司需要注意的是“专注一个点做透”,并在此过程中不断辨别哪些是应勇于“取”的机遇,哪些是要勇于“舍”的诱惑。在“大炼模型”的风潮下,面壁就曾先后做出不做AI聊天机器人、放弃大模型基础设施等重要决策,专注打磨端侧模型,提升模型效率与知识密度,“以小博大”。jpf即热新闻——关注每天科技社会生活新变化gihot.com

蛇年春节,DeepSeek旋风席卷全球。以低成本实现高性能,正是DeepSeek一鸣惊人之处。《麻省理工科技评论》随后刊发了一篇题为《关注DeepSeek之外的四家中国人工智能初创公司》的报道,点赞中国“四剑客”,其中就有面壁智能。jpf即热新闻——关注每天科技社会生活新变化gihot.com

勇于面壁,方能破壁——Deep-Seek和面壁智能,都在用实际行动印证着一个道理,不盲目跟风,勇于探索新路径,即便在有限的资源环境下也能激发、倒逼出无限的创新潜力。jpf即热新闻——关注每天科技社会生活新变化gihot.com

jpf即热新闻——关注每天科技社会生活新变化gihot.com

在清华科技园科建大厦3楼,面壁智能联合创始人、CEO李大海的办公室中央挂着一幅大型拼图,一艘船在风雨中劈波斩浪。jpf即热新闻——关注每天科技社会生活新变化gihot.com

今年已是李大海来到中关村的第23年。jpf即热新闻——关注每天科技社会生活新变化gihot.com

2006年,从北京大学数学系毕业后,李大海加入谷歌中国,成为创始员工之一。后来他又参与了云云网、豌豆荚、知乎的创业。2023年,一场大模型掀起的技术风暴席卷而来,时任知乎CTO的李大海决定投身其中。当年4月,在李大海的推动下,知乎完成了对面壁智能的独家天使轮投资。jpf即热新闻——关注每天科技社会生活新变化gihot.com

李大海看好面壁智能,是因为其创始人、青年科学家刘知远是国内首批开展大模型研究的研究者之一。2020年12月,刘知远团队发布了全球第一个中文开源大模型“CPM”,这一项目也是后来中国奠基性大模型“悟道”的前身。两年后,刘知远发起成立面壁智能。jpf即热新闻——关注每天科技社会生活新变化gihot.com

投资一家优秀的大模型企业,对李大海来说绝非终点。大模型掀起的汹涌浪潮让他兴奋得难以入睡。“这是一场堪比蒸汽机改变世界的大变革!”一次次在深夜爬起来看代码、追踪大模型前沿进展的李大海,决定从大厂高管转身,再次创业。2023年6月,李大海出任面壁智能CEO。jpf即热新闻——关注每天科技社会生活新变化gihot.com

彼时,大模型领域激战正酣,一场前所未有的“百模大战”正在上演。与此同时,随着大模型迅猛发展,作为大模型“燃料”的算力告急,行业内出现GPU“一卡难求”“排队预定”的局面。如何才能从白热化的竞争中杀出重围?jpf即热新闻——关注每天科技社会生活新变化gihot.com

高效——是李大海与团队给出的答案。“与其盲目地把模型做大,不如花更多精力让模型变好,以同样的模型参数量实现更高的智能与知识密度。”基于对大模型本质规律的观察,他们提出了大模型的密度定律(DensingLaw):大模型知识密度每3.3个月翻一番,大模型将变得越来越“小”,同时能力越来越强。jpf即热新闻——关注每天科技社会生活新变化gihot.com

基于这一理念,团队选择避开同质化严重的对话式AI聊天机器人,将视野转向了一个在当时看来不算热门的方向——端侧大模型。李大海认为,人们的生活早已离不开手机、平板、汽车等各种各样的硬件终端设备,而在不久的将来,这些智能终端都将拥有具备自主思考能力的“超级大脑”。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“我们要让小模型跑出大能量,让本地模型能力满足日常绝大多数的智能需求。”李大海坚信,相比于时下最火热的跑在“云”上,并且需要大量算力的千亿级超大模型,在“断网、弱网”环境下,仍然能让各种智能终端具备自主思考能力的端侧大模型,将成为面壁独特的竞争力。jpf即热新闻——关注每天科技社会生活新变化gihot.com

用更小的参数、更高的效率、更低的成本,实现更好的智能——达到这个目标,并不容易。“模型能力日新月异,但模型效率的领先如同芯片制程一般,须形成比较硬的相对优势。我们要攻克的,就好比大模型行业的‘光刻机’。”李大海说。jpf即热新闻——关注每天科技社会生活新变化gihot.com

拿算法来说,过去,由于模型训练过程中充满不确定性,传统的大模型训练被业界戏称为“炼丹”。而面壁研发团队通过上千次模型沙盒实验,在算法的各种细节上摸索出了一系列最优配置,大幅优化了模型效果。jpf即热新闻——关注每天科技社会生活新变化gihot.com

为了打磨大模型“光刻机”,从高质量的数据原材料,到模型训练与调校,一个个环环相扣的细节,研发人员都细细打磨。2024年初,面壁推出了端侧大模型MiniCPM,用仅仅24亿参数实现了超过百亿参数大模型的性能。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“超级大脑”仍在不断进化。今年1月,面壁智能发布MiniCPM-o2,这也是全球首个达到OpenAI公司GPT-4o水平的端侧多模态大模型。这款仅有80亿参数量的模型,能够实时流式处理文本、图像、音频和视频信息,“视、听、说”都很伶俐。jpf即热新闻——关注每天科技社会生活新变化gihot.com

在今年中关村论坛年会期间,面壁又发布了一项领先业界的成果——首个纯端侧超级智能助手,可应用于汽车智能座舱。在端侧大模型的支撑下,即便车辆没有网络,超级智能助手也能随时“在线”,实现从车外到车内的各种感知并执行任务。jpf即热新闻——关注每天科技社会生活新变化gihot.com

由于在安全性、实时性等方面的巨大优势,面壁的端侧模型一经推出就很快获得了法律、消费电子等行业用户的认可。就在上月,面壁与合作伙伴发布了首个纯端侧大模型量产车型。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“2026年,装上面壁端侧模型的设备数将达2025年的10倍。”放眼未来,李大海的眼中是更广阔的星辰大海——未来全球将有400亿的设备终端,它们都有望装上一个个“超级大脑”。jpf即热新闻——关注每天科技社会生活新变化gihot.com

独角兽“秘笈”jpf即热新闻——关注每天科技社会生活新变化gihot.com

冷静取舍 以小博大jpf即热新闻——关注每天科技社会生活新变化gihot.com

智谱、月之暗面、百川智能、零一万物、面壁智能……在今年年初第三方机构公布的国内大模型独角兽排行榜中,多家北京企业赫然在列,显示出创新资源高度集聚的效应。jpf即热新闻——关注每天科技社会生活新变化gihot.com

在被人们称为“宇宙中心”的五道口一带,办公租金并不便宜,李大海坦言,背靠五道口周边极强的人才优势,是成立仅三年的面壁得以迅猛发展的重要原因。jpf即热新闻——关注每天科技社会生活新变化gihot.com

身处北京,依靠全国领先的AI人才资源和“AI第一城”的创新生态,与行业巨头凭借巨额资金和海量算力投入“大力出奇迹”的发展路径不同,以面壁为代表的北京人工智能初创企业,向世界展现出高效创新、“以小博大”的创新范式。jpf即热新闻——关注每天科技社会生活新变化gihot.com

“对创业公司来说,‘不做什么’和‘做什么’都很重要,‘不做什么’甚至更重要。”李大海说。面对巨大机遇,创业公司需要注意的是“专注一个点做透”,并在此过程中不断辨别哪些是应勇于“取”的机遇,哪些是要勇于“舍”的诱惑。在“大炼模型”的风潮下,面壁就曾先后做出不做AI聊天机器人、放弃大模型基础设施等重要决策,专注打磨端侧模型,提升模型效率与知识密度,“以小博大”。jpf即热新闻——关注每天科技社会生活新变化gihot.com

蛇年春节,DeepSeek旋风席卷全球。以低成本实现高性能,正是DeepSeek一鸣惊人之处。《麻省理工科技评论》随后刊发了一篇题为《关注DeepSeek之外的四家中国人工智能初创公司》的报道,点赞中国“四剑客”,其中就有面壁智能。jpf即热新闻——关注每天科技社会生活新变化gihot.com

勇于面壁,方能破壁——Deep-Seek和面壁智能,都在用实际行动印证着一个道理,不盲目跟风,勇于探索新路径,即便在有限的资源环境下也能激发、倒逼出无限的创新潜力。jpf即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-2594-0.html北京AI破壁之路 端侧小模型跑出大能量

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京市推动人工智能赋能新型工业化

下一篇:借助高科技 “慧眼”识文物

为你推荐
1月21日,国家国防科技工业局新闻宣传办公室正式对外发布2024年度国防科技工业十大新闻。2024年度国防科技工业十大新闻包括:嫦娥六号任务实现人类首...
01-22
近年来,AI客服的使用场景越来越丰富,多地却把人工客服岗位列入紧缺技能职业目录。记者采访了解到,人工客服从业者大多出身农村,岗位工作压力大、强度高...
01-27
  一辆辆卡车载着生产材料来回穿梭,机器设备的轰鸣声此起彼伏……中化扬农葫芦岛大型精细化工项目生产...
02-01
  春节后,辽宁各地开工复产节奏加速,用工需求量明显增加,辽宁多地工会及人社部门积极开展大型招聘会,保障...
02-18
1月21日晚间,美股三大指数集体高开。截至发稿,道指涨0.59%,纳指涨幅回落,标普500指数涨0.41%。黄金白银上涨。COMEX期金一度向上触及2750美元/盎司。热门中概股跳水。纳斯达克中...
01-22
  1月22日,腊月二十三,这一天是北方传统的小年,而南方传统的小年则在腊月二十四。小年到,甲辰龙年即将别去,乙巳蛇年日渐临近,天南海北的人们都在高高兴兴地迎新春。  民间...
01-22
刚过去的2024年,吉利银河以惊人的销量增速引起业界广泛关注,全年销量突破49.4万辆,同比增长约80%,几乎达到2023年的两倍。2025年刚开年,在1月第二周的销量排行榜上,吉利银河已在多...
01-21
1 月 24 日消息,岚图汽车 1 月 22 日宣布,岚图知音全球版开启海外交付,目前新车已经启程发运挪威,距离挪威、瑞典、芬兰三国同步上市发售仅 87 天。2024 年 12 月 19 日...
01-24
  1、《难哄》向朗喜欢温以凡,他对温以凡不仅仅是青梅竹马之谊,还有漫长的暗恋。  2、当年向朗出国之前本想送温以凡贵重的手链跟她表明心意的,但恰好当时是乔乔的生日,手...
02-22
人气演员王鹤棣近日现身上海,参与了一场备受瞩目的品牌盛事,现场发布的未经修饰的照片和视频迅速在网络上走红,引起了广泛热议。 活动中,王鹤棣以一袭粉色衬衫惊艳亮相,帅气形象...
02-22
  记者从国家医保局了解到,12月1日,全国医保正式上线慢性阻塞性肺疾病、类风湿关节炎、冠心病、病毒性肝炎、强直性脊柱炎等5种门...
01-21
21世纪经济报道记者武瑛港 北京报道近日,羟基磷灰石的使用问题在医美行业内快速升温。记者获悉,2025年1月21日,深圳市市场监督管理局、深圳市...
01-23
  大众网记者 王一刚 报道  冬日风雅,大雪知寒。一年岁暮风雪始,寒冬用最纯洁的底色酝酿世间最精彩的颂歌。  一、童言话大雪  孩子们对即将到来的“大雪”节气充...
01-21
根据国务院发布的《高等教育自学考试暂行条例》和《辽宁省高等教育自学考试学历认定和课程免考实施细则...
01-21
  中国经济网北京1月28日讯 江苏证监局网站近日披露了关于对南京银行股份有限公司采取出具警...
02-05
  险资在全国的收租版图有加速拓展的势头。近日,新华保险携手万科集团旗下住房租赁平台等,成立...
02-14
白羊座男生通常是直爽、热情和冲动的,当他们喜欢一个人时,往往会表现出以下几个特点: 1....
01-22
双子座的男生善于交际,聪明机智,喜欢追求新鲜刺激的感觉。然而,有时候他们也会变得烦躁不...
01-22
宿迁杉杉服饰最新招聘信息与职业发展机会在当前竞争激烈的就业市场中,寻找合适的工作机会总是让人感到兴奋与期待。今天,我想和大家分享的是宿迁杉杉服饰的招聘信息,以及在这家...
02-07
珠宝之乡:探寻云南最具魅力的珠宝品牌在我们平常的生活中,珠宝不仅是美丽的象征,更是文化与价值的承载。走进云南,这片自然风光壮丽的土地,不仅有着丰富的少数民族文化,还有着众多...
02-12
2月5日消息,苏宁易购发布的春节消费大数据显示:春节期间,本地以旧换新消费需求进一步扩大,苏宁易购门店迎来销售“小高峰”,全国门店客流同比提升80%,以旧换新订单量同比增长92%。...
02-07
1月23日消息,山东齐鲁漆业有限公司(以下简称:齐鲁漆业)总经理孙亮亮一行近日到访涂多多。涂多多副总裁、跨境产业总经理邵春生,涂多多副总裁、粉体产业链链主郑德莲代表公司与来...
02-07
2月28日消息,继1月发布五大举措严厉打击“幽灵外卖”后,美团外卖宣布在首页显著位置上线“明厨亮灶”专区,鼓励餐饮商家通过后厨直播的形式,全面展示食品加工过程,为消费者提供清...
03-01
2月27日消息,抖音生活服务举办“服务体验与治理开放日”,发布《2024抖音生活服务消费者权益保护年度报告》,公布了过去一年在消费者权益保障与生态治理方面的措施和阶段性成果...
03-01
春雪食品集团股份有限公司(证券代码:605567)于2025年1月20日发布了2024年年度业绩预盈公告,预计实现归属于母公司所有者的净利润670.00万元至800.00万元,与上年同期相比成功扭亏...
01-21
1月20日晚,游族网络发布2024年年度业绩预告,报告显示,2024年度预计营收13.8-14.6亿元 。报告期内,游族网络持续深耕全球化游戏研发与发行,保持在营产品长线运营的基础上,积极推动...
01-21
Epic Games 日前宣布,热门大逃杀射击游戏《堡垒之夜》即将与热门动漫《怪兽8号》进行联动,推出一系列基于动漫的外观饰品。 商品将在游戏内上架,持续至 2 月 1 日...
01-28
著名的主机大战时代如今失去了悬念,索尼PlayStation在本世代多个方面都拔得头筹,这并不令人意外。然而,多年来,这两大巨头在硬件销售上竟出现如此巨大的差距,着实出...
02-10
中央气象台今早6点继续发布大风黄色预警和寒潮蓝色预警。大风黄色预警:预计今天8点到明天8点,华北、内蒙古中部、宁夏、陕西北部、黄淮等地的部分地区有5~6级、阵风7~8级的偏...
02-06
近期,国家安全机关第一时间侦破一起重要涉密人员主动投靠境外间谍情报机关的重大间谍案件,及时制止卖密行为,有力维护了国家安全。潜滋暗长生邪念韩某某,案发前在某重要涉密单位...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮