反超ChatGPT,重创美股,DeepSeek除夕再放大招震动全球科技圈

1年前 来源: 观看:257

图源:图虫创意 Fc4即热新闻——关注每天科技社会生活新变化gihot.com

这两天,中国人工智能初创公司深度求索(DeepSeek)成为全球科技圈热议的主角。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

就在刚刚过去的24小时内,DeepSeek AI智能助手同时登顶中美iOS免费应用排行榜第一,刷爆国内外社交平台,应用更是多次被“挤”到宕机。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

美股半导体股受此冲击,芯片巨头英伟达(NVIDIA)股价历史性暴跌,纳斯达克综合指数大幅下跌。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

就在今日(1月28日除夕)凌晨,DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。像是送给科技圈的新春礼物。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek掀起的声量也受到了各界大佬高度关注。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

英伟达发言人回应时代财经记者称:“DeepSeek是一项卓越的人工智能进展,也是测试时扩展的绝佳范例。”他提到,推理过程还“需要大量英伟达GPU和高性能网络”。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI首席执行官萨姆·奥尔特曼发文称“有了新的竞争对手令人振奋”;美国总统特朗普在佛罗里达州迈阿密发表讲话时,谈到DeepSeek的出现“给美国相关产业敲响了警钟”,美国“需要集中精力赢得竞争。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

美股科技股巨震,DeepSeek再发新模型Fc4即热新闻——关注每天科技社会生活新变化gihot.com

美股1月27日收盘,纳斯达克综合指数下跌3.07%,标准普尔500指数跌1.46%,道琼斯工业平均指数逆势上涨0.65%。据外媒报道,道琼斯市场数据显示,当地时间周一的“市场大屠杀”总共使股市市值蒸发了约1万亿美元。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

其中,欧美科技股重挫。AI龙头英伟达暴跌16.97%,单日市值蒸发5890亿美元,创史上最大单日个股市值蒸发纪录。一夜之间,英伟达创始人黄仁勋的身家大幅缩水210亿美元。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

此外,甲骨文下跌13.78%,超微电脑下跌12.49%,芯片制造商博通下跌17.4%,台积电跌13%。当日,芯片指数大跌超9%。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

市场分析认为,核心原因是中国人工智能初创公司深度求索(DeepSeek)的最新突破,动摇了美国科技行业的“无敌”地位。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

消息面上,1月27日,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。这距离其1月20日新模型DeepSeek-R1的发布,才过去短短一周时间。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

就在1月28日,DeepSeek又抛出的新模型,再次引发市场高度关注。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

Github社区信息显示,Janus-Pro是去年发布的Janus的高级版本,可显著提高多模式理解和视觉生成。相比此前的Janus,Janus-Pro优化的训练策略、扩展的训练数据和扩展到更大的模型尺寸。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

在文生图GenEval和DPG-Bench基准测试中,Janus-Pro-7B的准确率较前代Janus大幅提高,准确率测试结果分别为80%和84.2%,高于包括OpenAI DALL-E 3在内的其他对比模型,Janus的准确率分别为61%和79.7%。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

简单来说,Janus-Pro模型既能让AI读图(基于SigLIP-L),又能让AI生图(借鉴LlamaGen),分1.5B和7B两个大小。而要知道的是,GPT-4o的图片生成多模态模型至今没开放。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

Janus与Janus Pro 7B生成图像的对比,来源:DeepSeek技术报告Fc4即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek对AI行业意义方面,dropbox AI 副总裁 Morgan Brown曾做了一系列总结:“DeepSeek 突然出现并说,如果我们花 500 万美元做这件事会怎么样?他们不只是说说而已——他们真的做到了。他们的模型在许多任务上匹敌甚至击败了 GPT-4 和 Claude。”“关键在于,DeepSeek 的团队不到 200 人,但 Meta 的团队仅薪酬就超过了DeepSeek 的整个培训预算……而且他们的模型并不那么好。”Fc4即热新闻——关注每天科技社会生活新变化gihot.com

最先感受到DeepSeek带来的压力的是硅谷。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

Information网站消息称,目前脸书母公司Meta已成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。其中两个小组正在试图了解幻方量化如何降低训练和运行DeepSeek的成本;第三个研究小组则正在研究幻方量化可能使用了哪些数据来训练其模型;第四个小组正在考虑基于DeepSeek模型属性重构 Meta 模型的新技术。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek所推动的低成本大模型训练方案,引发科技圈的思考:当仅凭相对有限的算力就能达到与OpenAI模型相媲美的性能水平时,这是否预示着以英伟达为代表的高端算力芯片市场正面临新的泡沫风险?Fc4即热新闻——关注每天科技社会生活新变化gihot.com

1月28日,萨姆·奥尔特曼在社交平台X发文肯定了DeepSeek的表现,并表态将加快产品发布速度。他在推文中写道:DeepSeek的推理大模型R1是一款令人印象深刻的模型,尤其是考虑到其性价比。显然,我们将推出更好的模型。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

不过,奥尔特曼特地强调,“我们很高兴能继续执行我们的研究路线图,并相信更多的算力比以往任何时候都更重要,以成功完成我们的使命。”Fc4即热新闻——关注每天科技社会生活新变化gihot.com

同样,英伟达发言人回应时代财经记者称:“ DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力,创建新模型。推理过程需要大量英伟达GPU和高性能网络。如今我们有三条扩展定律:持续适用的预训练和后训练定律,以及新的测试时扩展定律。”Fc4即热新闻——关注每天科技社会生活新变化gihot.com

不过,随着大量新用户的涌入,DeepSeek称近期线上服务受到“大规模恶意攻击”,1月28日官方公告称,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录,感谢理解和支持。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

反超ChapGPT,从“好学生”升级至“学霸”Fc4即热新闻——关注每天科技社会生活新变化gihot.com

随着DeepSeek-R1引爆大模型的舆论场,其背后的DeepSeek公司也随之受到更热烈的关注。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

DeepSeek,运营主体为杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术,其创始人梁文锋也是头部量化私募幻方量化的创始人。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

2015年,幻方量化正式成立,2019年,其资金管理规模就突破百亿元。幻方量化官网显示,其在2018年就确立以AI为公司的主要发展方向。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。仅仅不到一年的2024年5月,DeepSeek就推出了史无前例高性价比的DeepSeekV2,因此被外界成为“AI届的拼多多”。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

据DeepSeek官方表示,DeepSeek-V2采用了创新的架构,例如注意力机制方面的MLA(多头潜在注意力)和前馈网络方面的DeepSeekMoE架构等,以实现具有更高经济性的训练效果和更高效的推理。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

自去年12月DeepSeek-V3发布后,DeepSeek变得更加“惊艳”。AI数据服务公司Scale AI创始人Alexander Wang就曾发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”Fc4即热新闻——关注每天科技社会生活新变化gihot.com

而不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型,让这番关注量级再上一层楼。1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一;紧接着,1月27日,DeepSeek应用冲上苹果中美区免费APP下载排行榜。爆火的用户体验场面,更是直接导致DeepSeek1月26日、27日在两天之内接连出现服务宕机现象。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

新模型DeepSeek-R1引发国内外高度关注原因在与其性能和成本。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

“这就相当于是说,它(DeepSeek-R1)生成的内容不是仅依靠已经标注给它的数据,而是它可以根据标注内容去深度思考、反向标注更多的东西。”资深互联网分析师张书乐向时代财经记者表示。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

“它实际上提供了一个思路,就是人工智能如何完成从‘好学生’到‘学霸’的突破。我们之前的人工智能就像一个‘好学生’,通过深度学习,对资料进行反复的消化吸收,然后生成答案。这些资料就相当于是课本,好学生一旦遇到课本之外的超纲题就不会做了。而DeepSeek就像掌握了课本里方法论的‘学霸’,能够举一反三,通过学习课外读物,扩大知识面,而这些课外读物不一定是标注好的。”张书乐解释道。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

除了性能外,而更令市场惊讶的是,DeepSeek-R1的预训练费用不到600万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。 Fc4即热新闻——关注每天科技社会生活新变化gihot.com

据了解,随着数据规模效益的Scaling Law(模型规模定律)逼近极限,OpenAI去年9月发布采用RL训练的新推理模型o1,引领大模型领域“范式转移”。此前,国内大模型厂商无人能及OpenAI o1。而DeepSeek R1的问世,标志着国内首次突破OpenAI技术壁垒。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

可以说,DeepSeek大模型证明了在Scaling Law之外,AI大模型或许还有另一条制胜之道。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

“DeepSeek-R1的成功确实起到示范作用,它证明了AI初创公司确实能够在开源大模型上打破科技大厂垄断的局面,甚至在某些方面超越国内外科技巨头。这才是最刺激人心的东西。”张书乐分析道。Fc4即热新闻——关注每天科技社会生活新变化gihot.com

而在数日前,就有Meta的工程师们在匿名社交平台TeamBlind上表示DeepSeek所研发的AI模型为其带来了巨大压力。Meta首席AI科学家杨立昆(Yann LeCun)在其发表在Threads上的一篇文章中指出,比起“中国AI超越了美国”的观点,DeepSeek-R1更重要的是证明了“开源模型正在超越专用模型”:“DeepSeek得益于开源研究和开源项目(例如PyTorch和来自Meta的Llama)。这就是开放研究与开源的力量。”Fc4即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-359-0.html反超ChatGPT,重创美股,DeepSeek除夕再放大招震动全球科技圈

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:量子材料领域十年难题获破解,理想外尔半金属首次合成

下一篇:AI眼中的中国|开开心心过大年

为你推荐
1月16日,有消息称美团正在试水“浣熊食堂”放心外卖店业务。对此,记者联系美团获悉,“浣熊食堂”是美团投入资金和人力,深度参与餐饮上下游建设探索的...
01-21
近年来,日本在人工智能应用方面积极探索,在制造业、农业、教育等诸多领域都涌现出一些创新案例。但整体而言,日本社会对AI科技的接受程度并不高。在全...
01-27
  近日,工业和信息化部公布了2024年实数融合典型案例名单,我省5家企业上榜,分别为大连亚明汽车部件股份...
02-17
  中央气象台2月16日18时继续发布大风蓝色预警:  预计,2月16日20时至17日20时,内蒙古中东部、辽宁、吉...
02-17
深谙电商平台使用法则的消费者,在看中一款商品后,往往会截图、识别,同款产品的不同价格呈现眼前,几番对比后,为最低价买单。 若再细心...
01-21
  加州又起大火:事发全球最大储能电厂,有数万块电池,马斯克急辟谣  澎湃新闻记者 贺梨萍  当地时间1月16日下午,美国加利福尼亚州莫斯兰丁(Moss Landing)储能电厂发生火灾...
01-21
1 月 22 日消息,特斯拉在去年推出了一款主打无人驾驶的 CyberCab出租车,这款小车取消了方向盘,座舱里只有一块中控屏,据称手动控制时需要类似于游戏手柄的控制器控制。...
01-23
2024传统汽车品牌不断退出转投新势力的消息,接踵而至,不断见诸报道,造成了市场对传统汽车品牌不振的直观感受。事实上,在激烈的车市大浪淘沙阶段,无论是传统品牌和新势力,开店或闭...
01-25
《难哄》向朗喜欢钟思乔吗?向朗和钟思乔什么关系?在《难哄》中,向朗不喜欢钟思乔。向朗是温以凡和钟思乔的发小,他与钟思乔只是朋友关系,没有爱情方面的感情。向...
02-19
《逃命游戏:无限重启》播出后,许多观众对剧情发展和角色命运产生了浓厚兴趣。该剧由夏婧苒和宋旭主演,于每天上午10点更新,属于复仇题材,在汪汪剧场播出。故事讲...
02-21
21世纪经济报道记者 闫硕 北京报道脑机接口领域再传利好消息。2月10日,据阶梯医疗StairMed微信公众号,近日,阶梯医疗宣布完成3.5亿元人民币B...
02-13
关于实施2025年卫生健康系统为民服务实事项目的通知国卫办函〔2025〕25号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、中医药局、...
02-14
  大众网记者 杨涛报道  近日,在第十六届山东省大学生科技节——山东省大学生消防安全技能大赛中,青岛港湾职业技术学院应急管理学院23级建筑消防技术与应急救援技术专...
01-21
日前,教育部召开2024年全国教育数字化工作总结会,会上宣布国家终身教育智慧教育平台正式上线。平台网址为...
01-21
  新华财经北京1月21日电(郭洲洋、吴郑思)国内商品期货市场1月21日涨跌互现,其中集运欧线主力合...
01-23
  摘要  【供需有望改善钢价或先抑后扬】1月上旬,炉料补库渐入尾声,下游需求处于淡季,炉料及钢...
02-05
星座一直以来都是人们关注的话题,尤其是在恋爱和婚姻方面。每个星座都有自己独特的性格...
01-22
双鱼男和白羊女是十二星座中的两个相邻星座,他们之间的配对关系备受关注。下面我们来分...
01-22
日系穿搭特点?一、日系穿搭的特点在穿搭方面日系风简直把休闲做到了极致,要说亚洲潮流文化发祥地,原宿绝对是一大圣地这里除了有常见的时尚大牌,还有亲民的牌子,日系穿搭的主要特...
02-07
女式黑色衬衫怎么搭配?一、女式黑色衬衫怎么搭配?1,搭一件米色,或者白色的外衣。把黑色的领子折出来,这样看起来就不单调,如果单是一身黑的话,就显得很单调了。2,或者找很帅气的皮带...
02-17
2月7日消息,东方甄选在微博发文称,近日,北京互联网法院就抖音用户崔某网络侵权案作出判决,认定被告发布言论不实,侵害了东方甄选名誉权,要求被告在抖音账号置顶道歉声明,并赔偿东方...
02-08
张一鸣:“做不好的就别做了,要做就必须做到非常好。”1.抖音电商跃居行业第三2024年,电商市场步入存量时代,竞争愈发白热化。那么,经过一整年的激烈厮杀,电商平台们的表现如何呢?据...
02-18
2月18日消息,据环球旅讯,携程集团近日宣布多名高层调整。截图图源:环球旅讯公众号任命公告具体为,陈刚出任集团首席产品官,将牵头集团AI相关产品的战略制订;谭煜东出任集团首席科...
02-19
3月2日消息,天猫健康滋补保健中药行业发展规划暨招商大会近日召开。天猫健康在会上发布保健行业加码新商培育、经营激励专项措施,2025年将投入5亿元惠商资金,扶持商家经营,实现...
03-03
AI领域再添新融资。1月22日,AI硬件公司未来智能完成数千万元人民币的Pre-A轮融资,由万物创投领投,初心资本跟投。这是未来智能继2021年种子轮融资、2023年天使轮融资后完成的第...
01-23
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
《最终幻想7:重生》PC版即将于北京时间1月23日晚上10点解锁,该作PC版媒体评分现已解禁,M站目前共收到29个评论,均分90,其中22个好评、1个中评,6个暂未给出评分。另外...
01-24
RTX 5090和RTX 5080显卡在今天正式开卖,由于货源稀少,性能强劲,一上市很快就被一扫而空,导致很多潜在买家只能“望卡兴叹”。 当然,这些抢显卡的人很多并不是真正...
02-03
极目新闻记者 宋枕涛2月2日,农历正月初五,武汉归元寺迎来一年一度的迎财神传统民俗活动。清晨6时,大批游客涌往汉阳归元寺,以敬香“迎财神”的方式为新年祈福。记者在现场看到,公...
02-02
新华社布宜诺斯艾利斯2月5日电(记者张铎)阿根廷政府5日宣布,阿总统米莱已决定该国退出世界卫生组织。阿根廷总统府发言人阿多尔尼当天在新闻发布会上说,阿根廷不允许任何国际组...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮