DeepSeek “通情达理”这样炼成

1年前 来源:北青网 观看:148

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。G28即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”G28即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。G28即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。G28即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。G28即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。G28即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。G28即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化G28即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?G28即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。G28即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。G28即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。G28即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。G28即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。G28即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。G28即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。G28即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。G28即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示G28即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。G28即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。G28即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。G28即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。G28即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。G28即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。G28即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。G28即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”G28即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。G28即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。G28即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。G28即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?G28即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。G28即热新闻——关注每天科技社会生活新变化gihot.com

AI的进化速度正超乎大家的想象。如今的DeepSeek,不仅为你答疑解惑,甚至还能通情达理,与人心意相通,在某些方面可以胜任心理咨询师的角色。作为一个异军突起的AI,DeepSeek的“才华”惊艳了众人,它有何独特之处,不妨从其成长的底层逻辑梳理。G28即热新闻——关注每天科技社会生活新变化gihot.com

看问题“更高一层”G28即热新闻——关注每天科技社会生活新变化gihot.com

当一个人感到困惑或焦虑时,和DeepSeek聊一聊,居然会有海阔天空的豁达感。G28即热新闻——关注每天科技社会生活新变化gihot.com

当你问它“战胜焦虑有什么办法吗”,它的回答是:放弃“立刻变好”的期待,允许自己带着焦虑生活,焦虑的消退像冰层融化,是悄无声息的过程。G28即热新闻——关注每天科技社会生活新变化gihot.com

你问它“养育孩子的意义是什么”,它会告诉你:请接受生命最温柔的“失败”。育儿手册里的标准答案并非万能,没有父母是完美的,总会遇到挫败,而这些挫败教会我们“爱不需要正确,只需要在场”。G28即热新闻——关注每天科技社会生活新变化gihot.com

还有人问它:一个人一生中没有挚友,也没有伴侣,能生活得开心吗?DeepSeek的回答是:人类对幸福的定义,从来就不是单行道。当我们剥离社会规训的滤镜,会发现生命的丰盛程度,远比传统叙事里的标配人生更为辽阔。有人在与星辰对话中获得灵魂共振,有人在古籍修复中触摸千年体温,更有人通过救助流浪动物构建情感网络。G28即热新闻——关注每天科技社会生活新变化gihot.com

你和它探讨“人生的意义是什么”,它认为:这不是一道填空题,而是一道论述题。它可能随着时间、经历而改变,少年时是梦想,中年时是责任,老年时是传承。它还告诉你,答案并不重要,这个问题本身会推动我们不断反思、连接他人,并在有限的生命里活得更清醒与热烈。G28即热新闻——关注每天科技社会生活新变化gihot.com

AI的自我进化G28即热新闻——关注每天科技社会生活新变化gihot.com

一些人在和DeepSeek聊天后不禁发出感慨:AI越来越知晓人情世故,人类却越活越像AI。DeepSeek的出现,改变了AI的哪些叙事逻辑?G28即热新闻——关注每天科技社会生活新变化gihot.com

不妨先从人工智能的发展主线说起。人工智能这一概念是在1956年达特茅斯学院研讨会上正式提出的。从此,AI便踏上了一条机器自我学习的新路线,即处理数据、提取特征、训练模型、改进性能、给出结果。G28即热新闻——关注每天科技社会生活新变化gihot.com

经历了若干代更迭后,一种新的算法出现,即具有记忆和优化功能的循环(递归)神经网络(简称为RNN)。可以把这种算法想象成一个有“记忆”的故事讲述者,它会把当前情节的信息和自己之前“记住”的信息结合起来,去理解和处理一些新情节。G28即热新闻——关注每天科技社会生活新变化gihot.com

20世纪80年代,人工智能界又出现了一种反向传播算法(简称BP算法)。想象一下,AI的BP算法就像是一个在迷宫中寻找出口的探险家,有了这种算法,探险家可以及时调整迷宫路线,让自己下次走的时候更容易找到出口。G28即热新闻——关注每天科技社会生活新变化gihot.com

进入21世纪后,大语言模型(LLM)成为AI界研究的主流。大语言模型就像一个知识渊博且能力不断突破的“超级大脑”——知识储备丰富,语言理解能力强,语言生成能力出色,学习和适应能力强,等等。G28即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek等AI的大语言模型,依赖的是算法、算力和数据三大基本要素。三者之间的关系可以用烹饪菜肴来形象地说明。G28即热新闻——关注每天科技社会生活新变化gihot.com

算法就像烹饪的菜谱,规定了食材(也就是数据)如何被处理和组合。菜谱详细介绍了每一步的操作步骤、调料用量以及烹饪的时间和火候等,就像算法规定了数据的处理流程、计算方法和逻辑顺序。G28即热新闻——关注每天科技社会生活新变化gihot.com

算力则是厨师的烹饪水平和厨房设备的性能。一个技艺高超的厨师(强大的算力)能够更快速、精准地按照菜谱的要求进行烹饪。同时,先进的厨房设备(高性能的计算硬件)也能帮助厨师更高效地完成烹饪任务。G28即热新闻——关注每天科技社会生活新变化gihot.com

数据就是烹饪所需的食材。没有丰富多样、高质量的食材,再精妙的菜谱和再厉害的厨师也无法做出令人满意的菜肴。G28即热新闻——关注每天科技社会生活新变化gihot.com

将“顿悟”精准展示G28即热新闻——关注每天科技社会生活新变化gihot.com

饺子导演的哪吒系列动画电影诞生了一句金句:“人心中的成见是一座大山”。DeepSeek以一己之力改变了AI领域的认知成见。G28即热新闻——关注每天科技社会生活新变化gihot.com

以前,AI领域普遍存在一种固化的技术认知,AI的大语言模型性能与算力投入呈正相关,他们强调“大力出奇迹”。而DeepSeek的出现直接证明了“算力不是唯一的标准”,算法创新也可以开出一条独辟蹊径的道路。G28即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek最让人惊艳的是向大家展示了它的思考过程。就像人类在解决难题时,意识到之前的思路有问题,还会停下来重新思考。这是AI首次展现出像人类一样的高阶思维和内心独白,这也是DeepSeek的独特之处。G28即热新闻——关注每天科技社会生活新变化gihot.com

其实这种现象是机器的“顿悟”,只不过DeepSeek将它进行了更为精确的表达。G28即热新闻——关注每天科技社会生活新变化gihot.com

对于这种现象,中国科学院院士陈润生曾这样解释:你训练神经网络的过程中,讲一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不明白,教到N+1遍突然就学会了。G28即热新闻——关注每天科技社会生活新变化gihot.com

“顿悟”并不是DeepSeek最先发现的,OpenAI团队在2023年就在大模型训练时发现这一现象。但是,DeepSeek把这种顿悟写进了公开的技术文档里,并体现在应用的思考流程上,让用户看得到并且可以评判。G28即热新闻——关注每天科技社会生活新变化gihot.com

有趣的是,机器的这种领悟不是渐进式的,而是瞬间、突破性的,就像一个人在长期思考一个难题后,突然灵感乍现,恍然大悟。G28即热新闻——关注每天科技社会生活新变化gihot.com

更好地传递“衣钵”G28即热新闻——关注每天科技社会生活新变化gihot.com

随着AI大模型的参数越来越多,应用端在处理某些领域问题时其实用不上如此庞大的模型。目前,各AI公司都在研究蒸馏模型,这是一种常用的技术方法。DeepSeek在做蒸馏模型时也进行了一些巧妙设计。G28即热新闻——关注每天科技社会生活新变化gihot.com

就像老师教学生知识,从易到难逐步深入,学生更容易接受。DeepSeek对一些大、小模型进行渐进式分层蒸馏,比如保留大部分架构特性,让学生模型有个好基础;提升推理速度,让学生掌握快速解题的方法;优化决策路径,提高任务准确率,这样学生就能学会更高效的思考方式,能花更少的精力答对题。G28即热新闻——关注每天科技社会生活新变化gihot.com

蒸馏后的小模型,在推理能力上得到了显著提升,甚至超越了这些小模型自我基础上进行强化学习的效果。这一过程就好像是从一大杯浓郁的咖啡中提取出一小杯精华的浓缩咖啡,保留了咖啡的风味和香气,也就是大模型的核心知识和能力。通过模型蒸馏技术,小模型可以在计算资源受限的设备上运行,如手机、智能手表等,实现快速推理。就好比学生继承了老师的衣钵,最后独当一面,解决各种问题。G28即热新闻——关注每天科技社会生活新变化gihot.com

许多人担心,AI今后会取代人类。DeepSeek的回答是:AI不会取代人类,就像望远镜不会取代天文学家。真正的危机是:当AI可以24小时创作莎士比亚风格的十四行诗时,人类是否还愿意在深夜为爱人写一首笨拙的情诗?G28即热新闻——关注每天科技社会生活新变化gihot.com

在AI这条赛道上,创造和坚持,或许才是人类最坚固的护城河。G28即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1081-0.htmlDeepSeek “通情达理”这样炼成

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:北京发布全球首个“一脑多能”、“一脑多机”通用具身智能平台“慧思开物”

下一篇:如何让AI成为孩子的帮手而非“枪手”

为你推荐
图源:pixabay1月17日晚间,思科瑞(688053.SH)发布公告称,公司收到四川证监局出具的《行政监管措施决定书》。据上述文件,思科瑞在2022年...
01-21
花江峡谷大桥是贵州省六枝至安龙高速公路的关键控制性工程,大桥全长2890米,桥面距离水面625米,建成后将成为“世界第一高桥”。花江峡谷大桥...
01-21
  记者1月15日获悉,辽宁邮政快递业迎来2025年“开门红”:1月1日-13日,辽宁省快递业务量和投递量较去年同...
01-21
  图为1月22日,在位于渤海辽东湾海域的中国海油锦州23-2油田平台,中海油海上平台生产操作工苏蔚正在对外...
01-27
  眼下流感等呼吸道传染病正处于季节性流行期。如何正确服用抗流感药物奥司他韦、玛巴洛沙韦?  北京佑安医院感染综合科主任医师 李侗曾:从疗效上来说,其实是一样的。新...
01-21
有海的城市,好像会更浪漫些。想象一下,坐在海边,感受着轻柔的海风,聆听着海浪拍打礁石的声音;在海水退潮时,踏入浅滩,翻开一块块礁石,寻找...
01-21
1 月 21 日消息,美国东部时间 20 日中午,特朗普在国会大厦圆形大厅宣誓就任美国第 47 任总统。特朗普随后发表就职演讲,他在一项行政命令中表示,将下令其政府“取消电动...
01-22
[本站 资讯] 日前,比亚迪官方宣布,2025款汉家族OTA升级内测,本次升级包含5项新增功能和6项优化体验。值得一提的是,本次OTA升级,涉及不同款型配置,以实际收到的OTA推送内容...
01-24
《难哄》温以凡经历了什么事情?在《难哄》中,温以凡经历了许多事情家庭变故父亲离世:温以凡高二时父亲生病去世,家庭的顶梁柱崩塌,原本被父母宠爱的她失去了重要...
02-19
《难哄》段嘉许谁饰演?段嘉许和桑稚相隔多少岁?在电视剧《难哄》中,段嘉许由吴宇恒饰演。段嘉许和桑稚相隔多少岁原著:段嘉许出生于1989年,桑稚出生于1997年,两人...
02-19
  新华社北京12月18日电 12月18日,《新华每日电讯》发表题为《人均预期78.6岁,如何迎接长寿“新常态”?》的报道。 &emsp...
01-21
  中新网上海1月29日电(李秋莹 周孙榆)春节是中华民族的传统节日,同时也是眼健康面临重大挑战的时段,在长假期间,一些眼科慢性疾病,像不可逆致盲性慢性眼病青光眼、眼底...
02-02
  大众网记者 司心鹏 报道  12月24日上午,廉洁文化进学校暨“青春·清菏韵泽”廉洁文化馆开馆仪式在菏泽职业学院举行。市委常委、市纪委书记、市监委主任赵永强、市...
01-21
  大众网记者 杨涛报道  12月10日,山东港口第二届青年志愿服务项目大赛决赛在潍坊市渤海湾航运举行,青岛港湾职业技术学院“德传巷陌 艺润万家”文化惠民志愿服务项目...
01-21
  乌鲁木齐银行再次因股权拍卖引发市场关注。2025年1月19日,该行第三大股东深圳君豪集团有限公...
01-22
  摘要  【多空交织纯碱持续上涨动力不足】纯碱期货自2025年1月8日触底反弹,2505合约从最低1...
01-24
双子座的男生一向以机智聪慧、善于交际而闻名,他们天生具备吸引人的魅力。当一个双子男...
01-22
天秤座男生是十分浪漫和迷人的,当他们喜欢上一个人时,会展现出一系列独特的行为和特点。...
01-22
选对尺码,让你的香奈儿鞋子更加完美对于许多香奈儿的爱好者来说,选购鞋子不仅仅是挑选一款时尚的鞋款,尺码的选择同样至关重要。无论是经典的香奈儿平底鞋、优雅的高跟鞋还是休...
02-12
领结婚证穿搭男士? 朋友结婚男士穿什么衣服?一、领结婚证穿搭男士? 领证当天男士最好穿白色的衬衫、粉色的衣服、浅蓝色的衣服,一来红底的照片看上去色彩突出明显;二来这些...
02-17
2月5日消息,朋湖网近日联合机器人开放社区发布“2024年度科技产业系列榜单”,商越科技凭借自身的采购数字化技术创新、服务能力、市场竞争力及社会价值,入选“2024企业服务创新...
02-07
2月9日消息,2025年春节假期落下帷幕,天猫数据显示,蛇年春节消费市场中,电子年货、非遗商品、黄金珠宝、户外运动装备等纷纷成为今年春节消费新潮中的热销爆款。国家补贴政策加力...
02-09
2月16日消息,爱彼迎发布2024年第四季度及全年财务业绩。四季度,爱彼迎收入约25亿美元,同比增长12%;净利润约4.61亿美元,同比扭亏为盈,净利润率达19%;经调整EBITDA(息税折旧及摊销前...
02-17
2月26日消息,在第18个国际罕见病日来临之际,病痛挑战基金会、阿里巴巴公益及阿里健康公益共同发起“柠檬宝宝新生无限关爱倡议”,获得24家新生儿筛查中心及综合性儿科医院响应...
02-27
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
02-09
【#中石油7.3亿在吉林成立新能源公司# 含新能源汽车相关业务】天眼查App显示,近日,中石油吉油(乾安)新能源有限公司成立,法定代表人为彭军,注册资本约7.3亿人民币,经营范围含发电业...
02-09
在今天的Xbox开发者直面会上,Xbox和光荣出乎所有人的意外公布了《忍者龙剑传2》的决定版,而且方式和之前的小体量游戏《完美音浪》一样采用公布即发售的模式。 ...
01-27
去年由Pocketpair打造的《幻兽帕鲁》在以抢先体验模式推出后,一度成为热门游戏,并且因为与《宝可梦》等游戏的内容相似性,而在2024年9月正式遭到任天堂与宝可梦公...
02-15
极目新闻记者 涂梦蝶非遗三节龙、傩仪舞蹈、广场烟花秀……走进湖北省云梦县祥云湾文旅度假区,仿佛参加一场战国游园会。近日,极目新闻记者了解到,春节期间,云梦县祥云湾文旅度...
02-04
2月8日,哈尔滨亚冬会冰壶混双铜牌赛,中国队战胜菲律宾队获得铜牌。这是中国代表团在哈尔滨亚冬会获得的首枚奖牌。...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮