DeepSeek “通情达理”这样炼成

10个月前 来源:北青网 观看:118

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。dwr即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”dwr即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。dwr即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。dwr即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。dwr即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。dwr即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。dwr即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化dwr即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?dwr即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。dwr即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。dwr即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。dwr即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。dwr即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。dwr即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。dwr即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。dwr即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。dwr即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示dwr即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。dwr即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。dwr即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。dwr即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。dwr即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。dwr即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。dwr即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。dwr即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”dwr即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。dwr即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。dwr即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。dwr即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?dwr即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。dwr即热新闻——关注每天科技社会生活新变化gihot.com

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。dwr即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”dwr即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。dwr即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。dwr即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。dwr即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。dwr即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。dwr即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化dwr即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?dwr即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。dwr即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。dwr即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。dwr即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。dwr即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。dwr即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。dwr即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。dwr即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。dwr即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示dwr即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。dwr即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。dwr即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。dwr即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。dwr即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。dwr即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。dwr即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。dwr即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”dwr即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。dwr即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。dwr即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。dwr即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?dwr即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。dwr即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1081-0.htmlDeepSeek “通情达理”这样炼成

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京发布全球首个“一脑多能”、“一脑多机”通用具身智能平台“慧思开物”

下一篇:如何让AI成为孩子的帮手而非“枪手”

为你推荐
85后女董事长接班1年后,连续亏损的赛为智能要自救了?近日,赛为智能(300044.SZ)发布2024年度业绩预告。预告显示,赛为智能去年全年预计实...
01-23
  一些“萌萌的”文创你方唱罢我登场。苏州博物馆的“蟹黄黄”毛绒玩具、甘肃博物馆的麻辣烫...
01-21
  1月26日4时至1月27日早  辽宁西部、中北部、东南部地区  出现大雪到暴雪  其他大部地区出现...
01-28
  央广网北京1月17日消息(记者门庭婷)1月17日,国家统计局发布2024年全国房地产市场基本情况。 ...
01-21
  如何避免“每逢佳节胖三斤”  ◎本报记者 张佳星  不少人都有“每逢佳节胖三斤”的经历。传统佳节将至,亲友聚会增多,外出餐饮频繁,如何在过好节日的同时保持健康体...
01-21
1 月 24 日消息,岚图汽车 1 月 22 日宣布,岚图知音全球版开启海外交付,目前新车已经启程发运挪威,距离挪威、瑞典、芬兰三国同步上市发售仅 87 天。2024 年 12 月 19 日...
01-24
1 月 27 日消息,特斯拉现已公布了旗下Model 3 / Y车型 2025 年 2月购车权益,其中焕新款 Model 3(2025 款)和旧款(2024 款)Model Y 车型可享限时5年0息分期购车方案,而焕新...
01-28
  1、《难哄》桑延从上高中的时候就开始喜欢温以凡了,两人还约定要考同一所大学。  2、温以凡因为家庭变故以及在大伯家的经历,让她最终更改了志愿,还在高考结束后拒绝了...
02-15
《180天重启计划》播出后受到了观众的喜爱和追捧。剧中第5集的剧情引起了广泛讨论,以下是该集的主要内容。吴俪梅叫醒顾云苏,让她好好打扮去见一个重要的人。...
02-21
21世纪经济报道记者 唐唯珂 广州报道Deepseek持续搅动全球AI格局重塑之下,应用产业端连锁反应也在深入。在医疗端应用展开的讨论同样热闹。...
02-08
21世纪经济报道记者 韩利明 上海报道2025年作为“十四五”规划收官之年,正风肃纪反腐走向纵深。医药行业因资金链长、权力集中、利润空间大...
02-09
  大众网记者 司心鹏 报道  近日,教育部发布了《关于推荐国家特殊教育改革实验区的通知》,旨在适应特殊教育改革发展的新形势新要求,在全国范围内设立一批特殊教育改革...
01-21
  大众网记者 秦瑾 通讯员 李永添 报道  12月24日,德州学院董仲舒书院揭牌开班仪式在厚德楼第二报告厅举行。德州市人民政府原副市长、一级巡视员董绍辉,上海交通大学...
01-21
  近日,又有一家消费金融公司收到监管罚单。  根据国家金融监督管理总局四川监管局开出的罚...
01-22
  四家上市险企业绩预增  股债共振推动利润预期改善  □记者 张小洁 北京报道  中国太...
02-05
星座一直以来都是人们关注的话题,尤其是在恋爱和婚姻方面。每个星座都有自己独特的性格...
01-22
水瓶座的男生一向以理性和独立著称,他们对于感情的态度也显得冷漠和难以捉摸。然而,当一...
01-22
如何通过色彩搭配提升模特T台走秀的视觉效果在时尚界,**色彩搭配**的重要性不言而喻,尤其是在模特的T台走秀中。每一场走秀都是设计师创意的体现,但背后的色彩选择和搭配更是决...
02-12
魅力无限:帅气女明星带给我们的时尚风潮在当今娱乐圈,女明星们不仅仅是表演艺术的展现,更是时尚与个性的一种引领。在我看来,帅气女明星之所以吸引眼球,不仅在于她们的才华与美貌...
02-12
2月18日消息,京东宣布与学而思签订战略合作协议,明确了未来三年内,学而思在京东全渠道销售50亿元、覆盖超100万用户的目标。根据协议,双方将聚焦“人、货、场”的全面协同,通过产...
02-18
2月20日消息,闲鱼数据显示,过去一年中,平台上的循环订单量同比增长近50%,覆盖手机数码、家具家电、服饰、图书等品类。在线上,超1亿人在闲鱼挂出闲置物品,每天都有超400万件闲置物...
02-21
编者按:春节,中国人心中最传统、最具仪式感的节日。这是一场从异乡到故乡的归来,是小城里升腾起的烟火气,也是一场流动的消费盛宴。值...
02-07
3月3日,美的发布了DeepSeek智能空调——美的鲜净感空气机T6,宣称“迈入空气思考时代”。据现场体验视频,当厨房TVOC超标时,系统会快速...
03-05
近日,智能科技领域企业——青岛明邦智能科技有限公司(简称“明邦智能”)宣布,成功完成1000万元人民币的融资。此次融资由广东南方秭方投资集团(简称“...
02-07
随着特斯拉人形机器人Optimus量产计划临近,以及国内智元机器人、宇树机器人等大放异彩,全球科技界对这一领域的关注度持续升温。在此背景下,国内资本市场对人形机器人概念的...
02-09
近日,由国产人工智能初创公司杭州深度求索(DeepSeek)开发的大语言模型DeepSeek-R1引发了全球科技界的广泛关注。尤其是在中国与美国的技术竞争日益激烈的背景下,De...
01-29
近日,SE宣布《勇者斗恶龙11》将于2025年2月1日起在 Switch eShop 上暂时下架,重新上架时间待定。官方也解释了其暂时下架的原因,他们将对该作商店列表进行一些小...
02-02
外交部发言人宣布:应国家主席习近平邀请,巴基斯坦伊斯兰共和国总统阿西夫·阿里·扎尔达里将于2月4日至8日对中国进行国事访问。...
02-03
过去一年,鹊桥二号绕月搭桥,助力嫦娥六号实现了人类首次月球背面采样返回。随着嫦娥六号任务的圆满完成,嫦娥七号任务也已经被提上日程。按照计划,我国将在2026年发射嫦娥七号月...
02-03
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮