DeepSeek “通情达理”这样炼成

3个月前 来源:北青网 观看:34

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。FM3即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”FM3即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。FM3即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。FM3即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。FM3即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。FM3即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。FM3即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化FM3即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?FM3即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。FM3即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。FM3即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。FM3即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。FM3即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。FM3即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。FM3即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。FM3即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。FM3即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示FM3即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。FM3即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。FM3即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。FM3即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。FM3即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。FM3即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。FM3即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。FM3即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”FM3即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。FM3即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。FM3即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。FM3即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?FM3即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。FM3即热新闻——关注每天科技社会生活新变化gihot.com

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。FM3即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”FM3即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。FM3即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。FM3即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。FM3即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。FM3即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。FM3即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化FM3即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?FM3即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。FM3即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。FM3即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。FM3即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。FM3即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。FM3即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。FM3即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。FM3即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。FM3即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示FM3即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。FM3即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。FM3即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。FM3即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。FM3即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。FM3即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。FM3即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。FM3即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”FM3即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。FM3即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。FM3即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。FM3即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?FM3即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。FM3即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1081-0.htmlDeepSeek “通情达理”这样炼成

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京发布全球首个“一脑多能”、“一脑多机”通用具身智能平台“慧思开物”

下一篇:如何让AI成为孩子的帮手而非“枪手”

为你推荐
1月15日,记者从中国科学院大连化学物理研究所获悉,该所动力电池与系统研究中心主任陈忠伟团队与双登集团近日对外联合发布了最新一代智能电池管理系...
01-21
一项发表在《科学》杂志上的新研究,为脊髓损伤患者恢复复杂触觉感知带来了前所未有的希望。瑞典查尔姆斯理工大学研究团队首次推出一种可安装在椅子...
01-21
  从“人手一件”的冲锋衣,到火爆全网的始祖鸟、迪桑特、骆驼、伯希和,在服饰行业增速放缓的背...
01-21
  来自公安部交通管理局的消息显示:春节期间(截至2月4日18时),全国道路交通安全形势总体平稳,未接...
02-05
进入冰雪季,东北三省谁能成为新的“顶流”?它们亮出了不同的数据,各自展示自己的受欢迎程度。比如辽宁,元旦假期接待游客267.2万人次,...
01-21
  多地出现“俄罗斯商品馆”被查,俄罗斯驻华大使馆发声  中新网1月19日电 俄罗斯驻华大使馆微信公众号近日发布公告称,最近,中国一些城市出现了大量销售俄罗斯食品的商店。...
01-21
1 月 21 日消息,赛力斯今日公告,预计 2024 年度实现营业收入 1442 亿元到 1467 亿元,同比上升 302.32% 到 309.30%。从公告获悉,赛力斯预计 2024 年度实现归属于上市公...
01-22
2 月 2 日消息,比亚迪今日公布 1 月销售新车300538 辆,乘用车销售 296446 辆同比增长 47.5%。随后博主 @小迪快报 带来了具体销量明细。汇总各车型销量信息如下:王朝网...
02-03
《重症外伤中心》近期备受关注,播出后热度持续上升。剧中一个引人关注的情节是消防队为什么不给重症外科派直升机,以下将对此进行解析。在繁忙的城市角落,重症...
02-19
《难哄》电视剧是哪个小说改编的?剧版男主是谁?‌《难哄》电视剧是由竹已的同名小说改编‌‌。电视剧《难哄》的男主角是白敬亭‌‌。这部小说讲述了桑延和温...
02-20
21世纪经济报道 记者季媛媛 广州 上海报道岁末年初,多家疫苗企业纷纷发布了2024年度业绩预告,从数据来看,“承压”成为一众国产疫苗巨头面临...
01-25
   ——山东大学尼山学堂培养古典学术专门人才的探索  尼山学堂师生在曲阜游学考察。王薪...
01-21
  大众网记者 司心鹏 报道  近日,教育部发布了《关于推荐国家特殊教育改革实验区的通知》,旨在适应特殊教育改革发展的新形势新要求,在全国范围内设立一批特殊教育改革...
01-21
  今年以来,银行、理财子公司布局“理财夜市”热度持续。多家银行、理财子公司发布关于理财夜...
01-22
  中国经济网北京2月6日讯 国家金融监督管理总局网站近日发布的国家金融监督管理总局重庆监管...
02-07
双鱼座男生,总是给人一种神秘而迷人的感觉。他们性格中蕴含着浓厚的浪漫和敏感,仿佛是来...
01-21
白羊座男生是十二星座中最具有阳刚之气的一种类型,他们热情、积极、直接,对于喜欢的人往...
01-22
模特T台走秀效果大揭秘:音乐如何影响整个秀场氛围当我们在社交媒体上浏览顶级模特们在T台走秀的精彩瞬间时,或许会显得光鲜亮丽,难以想象,在这个过程中,还有一种不可见的力量同样...
02-07
男生穿搭显高推荐? 男生怎么穿搭显瘦显高?一、男生穿搭显高推荐?九分裤是现在很流行的一款裤子,设计非常的时尚,而且很好搭配,最重要的是它能够很好的修饰身材比例,让腿看起来更长,...
02-17
2月12日消息,苏宁易购将联合方太、老板、美的、博西等品牌启动春季厨卫家装节,持续助力以旧换新国补新政策。活动期间,苏宁易购将推出三重补贴至高立减40%,“免费检测、免费安装...
02-13
2月19日消息,抖音商城38好物节日前开启商家报名,活动时间为2月27日20:00:00至3月8日23:59:59。图源:抖音电商学习中心本次38大促无预售,全程为现货开卖,平台核心玩法是官方立减15...
02-20
紫锦城 图源:时代周报/摄  “金价涨疯了!2015年左右我们...
02-13
被业内称为“开店狂魔”的库迪咖啡正在频频试水新业态,以期实现门店规模的快速增长及门店收入的提升。 2月13日,库迪咖啡宣布推出新...
02-15
春雪食品集团股份有限公司(证券代码:605567)于2025年1月20日发布了2024年年度业绩预盈公告,预计实现归属于母公司所有者的净利润670.00万元至800.00万元,与上年同期相比成功扭亏...
01-21
近年来,浙江晨丰科技股份有限公司(以下简称“晨丰科技”)在复杂多变的市场环境中,凭借敏锐的市场洞察力和果断的战略布局,积极投身新能源领域,成功实现了业务多元化发展,展现出强大...
01-23
到目前未知,2025年最大的游戏新闻无疑是上周宣布的任天堂 Switch 2,但除了目前确认的只有一款在预告中出现的《马里奥赛车》新作以外,任天堂还没有宣布这款新硬件...
01-24
今日(2月5日),关注焦虑情绪的2D互动叙事游戏《焦虑小狗》Steam页面开放,年内发售,游戏支持简繁体中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《焦虑...
02-06
据新华社报道,美国总统特朗普2月1日签署行政令,对进口自中国的商品加征10%的关税。美国的这一最新贸易保护措施在国际社会和美国国内遭到广泛反对。 商务部回应美对华加征关税...
02-02
据中国日报等媒体报道,2月4日,美国企业家埃隆·马斯克在社交平台上发文称,按照这种取得成就的速度,特朗普总统应当在总统山有一席之地,并表示自己“想亲自来给他雕刻”。 马斯克...
02-05
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮