DeepSeek “通情达理”这样炼成

1年前 来源:北青网 观看:136

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。ujA即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”ujA即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。ujA即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。ujA即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。ujA即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。ujA即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。ujA即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化ujA即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?ujA即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。ujA即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。ujA即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。ujA即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。ujA即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。ujA即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。ujA即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。ujA即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。ujA即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示ujA即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。ujA即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。ujA即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。ujA即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。ujA即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。ujA即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。ujA即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。ujA即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”ujA即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。ujA即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。ujA即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。ujA即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?ujA即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。ujA即热新闻——关注每天科技社会生活新变化gihot.com

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。ujA即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”ujA即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。ujA即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。ujA即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。ujA即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。ujA即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。ujA即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化ujA即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?ujA即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。ujA即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。ujA即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。ujA即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。ujA即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。ujA即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。ujA即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。ujA即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。ujA即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示ujA即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。ujA即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。ujA即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。ujA即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。ujA即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。ujA即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。ujA即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。ujA即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”ujA即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。ujA即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。ujA即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。ujA即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?ujA即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。ujA即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1081-0.htmlDeepSeek “通情达理”这样炼成

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京发布全球首个“一脑多能”、“一脑多机”通用具身智能平台“慧思开物”

下一篇:如何让AI成为孩子的帮手而非“枪手”

为你推荐
  在数据要素的充分流动下,“区块链医疗”正在应用端推出更多场景。  “数据要素要形成卫生...
01-21
1月初,因误信微信群虚假工作招募信息被诈骗团伙骗至缅甸园区的演员王星终于回到国内,网友提着的一颗心终于松口气。与此同时,围绕网...
01-21
  记者15日从国网辽宁省电力有限公司获悉,2024年,辽宁省绿电交易电量达127.83亿千瓦时,同比增长179.9%。...
01-21
  作者:本报记者李晓东《光明日报》(2025年02月16日05版)  乐山甜皮鸭。周艺珣绘  【至味人...
02-18
图源:图虫创意 第二个5000亿县级市诞生了。1月6日,江阴市第...
01-21
中新网江西永修1月21日电(卢梦梦)冬日清晨,赣北大地一片沉寂。在江西省九江市永修县涂埠镇,龙虾养殖户王贤荣一早便开始了日常巡塘工作。看到虾塘里的水草开始长根,王贤荣欣喜...
01-22
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上线超过 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,这距离年初公布的2000 站的建站目标...
01-25
2 月 4 日消息,多名用户今日在微博平台分享了鸿蒙智行问界 M8 汽车最新谍照,相关图片显示,该车内饰部分进行了重新设计,预计将采用三联屏设计。目前,鸿蒙智行问界 M8 汽...
02-04
《难哄》向朗人物介绍,向朗cp是谁和谁‌向朗‌是电视剧《难哄》中的一个角色,由翟潇闻饰演。向朗与温以凡和钟思乔从小一起长大,总是在朋友需要帮助时伸出援手...
02-19
《六姊妹》老四最后结局是什么?老四为什么进监狱?‌《六姊妹》中老四何家欢的最后结局是入狱‌。何家欢从小时候的烟花意外到后来的牢狱之灾,经历了太多起起落...
02-21
21世纪经济报道记者 唐唯珂 广州报道社会办医的洗牌期仍在继续。2025年1月,新华医疗挂牌转让旗下山东新华昌国医院投资管理有限公司55%股权...
01-25
21世纪经济报道记者 韩利明 上海报道随着四大跨国疫苗企业辉瑞、葛兰素史克(GSK)、默沙东、赛诺菲陆续发布2024年业绩,21世纪经济报道记者依...
02-11
近日,省委、省政府决定,单耀军同志任河北工程大学党委委员、常委、副书记,校...
01-21
  大众网记者 司心鹏 通讯员 邱文风 王琴 报道  12月5日,山东商业职业技术学院云计算技术与应用产业学院党总支与浪潮软件股份有限公司党委开展了“党建引领聚合力,双...
01-21
  摘要  【每日龙虎榜】豆油增仓近8万手,烧碱减仓2万余手,日内资金净流入86.15亿元。一文带你...
02-08
  “春节后,豆粕一天一个价,今天就涨了300元(每吨)。”提及近期豆粕价格情况,广东一家中型饲料企业...
02-13
水瓶座的男生通常被认为是聪明、独立和善变的。他们对待感情的态度也常常让人摸不透,有...
01-22
水瓶座的男生通常被认为是聪明、独立和有点神秘的人。他们喜欢自由和独处的时间,所以在...
01-22
聚光灯下的全女明星:她们的故事与智慧在娱乐圈中,有一类星光璀璨的女性,她们不仅在荧幕上展现了非凡的才华,也在生活中给人们带来了无尽的感动与启发。这便是我们常说的全女明星...
02-12
jeep品牌介绍? museum服饰品牌介绍?jeep品牌介绍?Jeep是一个具有历史和传奇色彩的汽车品牌,始于二战时期的美军轻型越野车。它的产品系列现包括了越野SUV、皮卡车和轿车等不同款...
02-12
赚钱,无孔不入。1.大小品牌挤进爆火直播间一切生意的本质都是流量,在抖音尤是如此。不知道大家有没有发现,从去年开始,大小品牌开始挤进抖音爆火直播间,通过砸钱给主播送礼物,以此...
02-11
2月15日消息,淘宝发布“情人节送礼榜”,护肤品、化妆品稳坐情人节礼物前排,淘宝天猫上的护肤类产品、唇部彩妆订单分别增长了124%、144%。口红、眼影、粉底液的“色号难题”,几...
02-16
图源:图虫创意 不断下行的猪价终于在2024年出现回升,A股生...
02-21
2月27日消息,《饿了么2024社会责任报告》今日正式发布。报告显示,在AI技术的助力下,饿了么“互联网 +明厨亮灶”识别能力已覆盖超过20万家商户,累计预警2,000余次食品安全隐患;20...
03-01
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
12月13日消息,深圳市光因科技有限公司(简称”光因科技”)近日完成数亿元A轮融资,本轮融资由徐州高新区产业投资母基金、梅花创投、科珹资本、神骐资本...
02-07
海外硬件网络零售平台 Newegg 近日报道称,在前几天英伟达 RTX 50 系列显卡上架销售后,仅在 20 分钟内就售罄。平台还分析了 RTX 5080 以及 5090 的用户活跃激增...
02-04
大坝年久大清扫,直接扫干净完事?那就浪费了,之前日本佐贺县就给常年积累苔藓以及赃物的大坝来了场特殊清扫,原本一年只有300个游客来看看大坝,现在变成了月活游客暴...
02-10
极目新闻记者 柯称通讯员 吴江龙 吴柳青“大家好,我是土生土长的湖北人!”2月5日上午,武汉大学刘胜院士团队研发的“天问”人形机器人,这一开场白逗乐了现场观众。当天是蛇年新...
02-05
要说今年春节档电影,不得不提的就是《哪吒之魔童闹海》。从大年初一上映以来,这部电影的票房一路高歌猛进。北京时间昨天(6日)中午,该影片以突破57.76亿元的成绩超过了2021年的电...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮