封面新闻丨Sora横空出世!它到底牛在哪?会带来哪些影响?

9个月前 来源:中国科技网综合 观看:52

p7V即热新闻——关注每天科技社会生活新变化gihot.com

2月16日凌晨,美国人工智能公司OpenAI在其官网发布了文生视频模型Sora,首次由AI生成了长达1分钟的多镜头长视频,镜头感堪比电影,引发关注。2月17日,据《纽约时报》和彭博社等媒体报道,OpenAI已完成一项允许员工出售公司股份的最新交易,使得这家AI公司的估值达到了860亿美元。何为Sora?Sora为何能引发关注?又将会产生哪些影响?p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

图源:Sorap7V即热新闻——关注每天科技社会生活新变化gihot.com

能生成60秒视频且对“物理规律”有超强学习能力p7V即热新闻——关注每天科技社会生活新变化gihot.com

从发布的视频来看,Sora 60秒的视频中,视频主体与背景保持了高度流畅性与稳定性;在一个视频里实现多角度镜头,分镜切换符合逻辑且十分流畅;此外,Sora对于光影反射、运动方式、镜头移动等细节处理非常到位。值得一提的是,在OpenAI公布的部分样片中,Sora还展现了对“物理规律”超强的学习能力,无论是飘逸的毛发还是水体波纹,Sora都能“合乎常理”地呈现出来。p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

图源:Sorap7V即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI究竟是怎么做到的?其官网介绍,通过一次性为模型提供多帧的预测,他们解决了一个具有挑战性的问题。p7V即热新闻——关注每天科技社会生活新变化gihot.com

总体而言,Sora是一个在不同时长、分辨率和宽高比的视频及图像上训练而成的扩散模型,同时采用了Transformer架构。展开讲,在视觉数据上,OpenAI把视频和图像分解为较小的数据单元Patches(补片),每个patches相当于GPT中的一个token(词元);在语言理解能力上,采用了DALL·E 3的重标注技术,通过为视觉训练数据生成详细描述的标题,使模型更加准确地遵循用户的文本指令生成视频。另外,Sora还能将现有的静态图像转化成视频,精准赋予图像中内容以生动的动作;模型还能扩展现有视频或补全缺失的帧。p7V即热新闻——关注每天科技社会生活新变化gihot.com

简单概括下来,Sora功能包括“文生视频、图生视频、扩展原视频”,长度最高可达60秒,视频更高清,细节更逼真,表现力更丰富。p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora生成的视频截屏p7V即热新闻——关注每天科技社会生活新变化gihot.com

技术报告揭秘Sora 6大优势p7V即热新闻——关注每天科技社会生活新变化gihot.com

在Sora推出后不久,OpenAI发布了这款新工具的技术报告。《每日经济新闻》经过对报告的梳理,总结出了Sora的6大优势。p7V即热新闻——关注每天科技社会生活新变化gihot.com

①准确性和多样性p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora的显著特征之一是能够准确解释长达135个单词的长提示。它可以准确地解释用户提供的文本输入,并生成具有各种场景和人物的高质量视频剪辑。它涵盖了广泛的主题,从人物和动物到郁郁葱葱的风景、城市场景、花园,甚至是水下的纽约市,可根据用户的要求提供多样化的内容。p7V即热新闻——关注每天科技社会生活新变化gihot.com

②强大的语言理解p7V即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI利用Dall-E模型的re-captioning(重述要点)技术,生成视觉训练数据的描述性字幕,不仅能提高文本的准确性,还能提升视频的整体质量。此外,与DALL·E 3类似,OpenAI还利用GPT技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。这使Sora能够精确地按照用户提示生成高质量的视频。p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

图源:Sorap7V即热新闻——关注每天科技社会生活新变化gihot.com

③以图/视频生成视频p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora除了可以将文本转化为视频,还能接受其他类型的输入提示,如已经存在的图像或视频。这使Sora能够执行广泛的图像和视频编辑任务,如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。p7V即热新闻——关注每天科技社会生活新变化gihot.com

④视频扩展功能p7V即热新闻——关注每天科技社会生活新变化gihot.com

由于可接受多样化的输入提示,用户可以根据图像创建视频或补充现有视频。作为基于Transformer的扩散模型,Sora还能沿时间线向前或向后扩展视频。p7V即热新闻——关注每天科技社会生活新变化gihot.com

⑤优异的设备适配性p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora具备出色的采样能力,从宽屏的1920×1080p到竖屏的1080×1920,两者之间的任何视频尺寸都能轻松应对。这意味着Sora能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前,Sora还能以小尺寸迅速创建内容原型。p7V即热新闻——关注每天科技社会生活新变化gihot.com

⑥场景和物体的一致性和连续性p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora可以生成带有动态视角变化的视频,人物和场景元素在三维空间中的移动会显得更加自然。Sora能够很好地处理遮挡问题。现有模型的一个问题是,当物体离开视野时,它们可能无法对其进行追踪。而通过一次性提供多帧预测,Sora可确保画面主体即使暂时离开视野也能保持不变。p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora生成的视频中,主角脸上的雀斑清晰可见。图片来源:OpenAI官网p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora模型的实际生成效果仍是未知数p7V即热新闻——关注每天科技社会生活新变化gihot.com

OpenAI官网称,Sora模型可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系。p7V即热新闻——关注每天科技社会生活新变化gihot.com

在OpenAI发布的技术报告中有一段Sora模型生成的错误视频,展示了桌上的水杯会先从底部流出果汁,然后沿着错误的方向和角度倒在桌上。p7V即热新闻——关注每天科技社会生活新变化gihot.com

根据OpenAI官网的描述,Sora模型在模拟复杂场景时仍会出错,并不总能准确呈现物体状态的改变。比如,它不能准确地模拟许多日常的基本物理过程,像是玻璃破碎过程、吃食物后表面没有咬痕、凭空生成并不需要的重复或变形画面等。p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

图源:Sorap7V即热新闻——关注每天科技社会生活新变化gihot.com

此外,Sora模型的安全性、对于有害内容的把控、对于偏见和歧视内容的筛查,目前仍处于摸索当中。Sora模型目前还处于测试阶段,预计再经过一段时间的安全测试和用户反馈后才会正式提供服务,因此还无法了解Sora模型的实际效果。p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

图源:Sorap7V即热新闻——关注每天科技社会生活新变化gihot.com

或对影视、广告、游戏、新闻、教育、VR/AR等行业产生深远影响p7V即热新闻——关注每天科技社会生活新变化gihot.com

Sora会给人类带来哪些影响?p7V即热新闻——关注每天科技社会生活新变化gihot.com

北京邮电大学人机交互与认知工程实验室主任刘伟表示,Sora在短期内可能会对短视频制作、影视行业以及视觉交互界面应用产生较为显著的影响;从长期来看,这项技术会为自动驾驶、数字仿真、场景模拟等领域带来改变。p7V即热新闻——关注每天科技社会生活新变化gihot.com

中国企业资本联盟副理事长柏文喜表示,Sora作为一种强大的视频生成工具,可以极大地降低视频制作的门槛和成本,使得更多人能够轻松创建高质量的视频内容。这将对影视、广告、游戏、新闻、教育、VR/AR等诸多行业产生深远的影响,具有广泛的应用前景。p7V即热新闻——关注每天科技社会生活新变化gihot.com

例如在影视行业,人人都是导演的时代即将来临,Sora可以快速生成逼真的场景和特效,帮助制作人员更好地实现创意,提高制作效率。在广告行业,Sora可以根据品牌需求和营销目标,快速生成高质量的广告。p7V即热新闻——关注每天科技社会生活新变化gihot.com

内容创作的方式变革后,文学创作领域也将迎来复兴,小说可以直接生成动漫、电视剧。视频内容集中爆发,自媒体行业也将迎来重新洗牌。随着技术的不断深挖,未来Sora会将在更多领域得到推广应用。p7V即热新闻——关注每天科技社会生活新变化gihot.com

技术的变革是把双刃剑。也许有人会问Sora的出现会对哪些岗位产生冲击?p7V即热新闻——关注每天科技社会生活新变化gihot.com

从上述专家的分析来看,目前最容易受到影响的或许是影视行业的从业者。例如视频剪辑师、后期制作这类岗位,Sora能够自动或半自动地生成视频,这可能会导致传统的视频制作和编辑职位的需求下降。后期制作包括剪辑、特效、音效等环节,这些工作也可以通过AI技术进行自动化或半自动化处理。再比如新闻主持人这一岗位,Sora可以根据输入的文本自动生成视频新闻报道,一些简单的新闻报道任务可能会被Sora所取代。此外,游戏动画师、广告创意和设计岗位、内容创作者等岗位都有可能受到冲击。p7V即热新闻——关注每天科技社会生活新变化gihot.com

p7V即热新闻——关注每天科技社会生活新变化gihot.com

图源:Sorap7V即热新闻——关注每天科技社会生活新变化gihot.com

大模型的竞争正在加剧p7V即热新闻——关注每天科技社会生活新变化gihot.com

AI的世界,日新月异。p7V即热新闻——关注每天科技社会生活新变化gihot.com

与其他文生视频大模型仅能生成3至4秒的视频相比,Sora模型生成的60秒视频实现了明显提升。p7V即热新闻——关注每天科技社会生活新变化gihot.com

不过,OpenAI虽然遥遥领先,却也不是没有压力。近几个月来,科技巨头们也纷纷宣布将带着自己的模型进入该领域,例如字节跳动的MagicVideo-V2和谷歌的Lumiere。p7V即热新闻——关注每天科技社会生活新变化gihot.com

值得关注的是,就在Sora发布的同日,谷歌也发布其最新力作——Gemini 1.5 Pro,其将稳定处理上下文的上限扩大至100万Tokens(词元),这代表它能一次处理大量的信息——包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。p7V即热新闻——关注每天科技社会生活新变化gihot.com

大模型的竞争正在加剧。p7V即热新闻——关注每天科技社会生活新变化gihot.com

(中国科技网综合蓝鲸财经、新民晚报、每日经济新闻、上海证券报、经济观察报、潇湘晨报、北青网、潮新闻等)p7V即热新闻——关注每天科技社会生活新变化gihot.com

责任编辑: 王倩

本文链接:http://www.gihot.com/news-2-3168-0.html封面新闻丨Sora横空出世!它到底牛在哪?会带来哪些影响?

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:歼20战机最新训练大片来了!

下一篇:300多只东方白鹳现身河北南大港湿地

为你推荐
额度套出来的最新方法,请认准靠谱提在线客服24小时在线为您服务【V杏2561663326电15580821310】在现代生活中,金融工具的多样化让我们的生活变得更加便捷,而白条作为一种新兴...
08-25
揭秘:白条出库秒商家,取现最关键的点是方法还是商家在这个科技飞速发展和金融创新层出不穷的时代,京东白条作为一种便捷的消费信贷工具,已经深入到了许多人的日常生活中。然而,...
08-12
言必信,行必果。——《论语》  译:说了的话,一定要守信用;确定了要干的事,就一定要坚决果敢地干下去。 满招损,谦受益。——《尚书》  译:自满于已获得的...
08-07
一分钟开元财务清算不给提款怎么解决追回【微信chuhei816】 为加快推进浙江省数字经济创新提质“一号发展工程”,激励社会各界发挥数据要素乘数效应赋能经济社会发展,近日,我市...
08-04
  中新经纬10月24日电(闫淑鑫)提起柠檬,很多人的第一反应是“酸”。柠檬一定是酸的吗?为什么说柠檬越酸越好呢?  近日,中新经纬走进“中国柠檬之乡”――四川省资阳市安岳县...
10-25
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【得物佳物分期购可以提现吗】【得物的分期购额度怎么套出来...
08-17
9 月 27 日消息,宝马集团董事高乐(Jochen Goller)在今天的 2024 世界新能源汽车大会上发表演讲称:“坦白说,宝马支持自由贸易。我们有全球的价值链,我们在中国采购之后造...
09-30
5 月 9 日消息,蔚来今日宣布第 50 万台量产车(全新 ES8)在位于安徽合肥新桥智能电动汽车产业园区的蔚来第二工厂下线,并将于 5 月 15 号正式推出旗下的第二品牌 —— 乐...
05-09
蒸蒸日上~怎么用花呗借钱到微信,轻松7种方法提现它可以让用户在不支付押金的情况下获得信用额度,用户可以在支付宝的合作商家购物或支付服务费用时使用花呗支付 在当今社会对...
09-02
南通风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-23
恩西地平(Enasidenib)恩昔地平代购多少钱一盒,恩西地平(Enasidenib)的版本有:1、老挝卢修斯制药版本;2、孟加拉ZISKA版本。代购价格是3800元左右,不同版本价格不同,以实际为准...
08-05
北方冬季,天气是非常寒冷的,要比南方地区冷很多的。因此,北方人在养生方面,也要注意御寒为主、健脾为辅,尤其是男性朋友,冬季到来容易肾虚、脾胃虚弱,在饮食方面,也要注意多喝汤,那么...
04-02
扬州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
09-01
厦门风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-28
苏州风控花呗白条套取秒到账:【181 181 43671微信同号】微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已实名安全的很。十...
08-31
哈尔滨风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息...
08-25
京东白条是京东推出的一种“先消费,白条秒到微:188-5555-8835 后付款的”的支付方式。和分付差不多,白条扫码是安全秒到的。白条提现回款安全吗?白条出库秒是怎么操作的,据了解,...
07-31
  原标题:董事长拟8亿元增持遭质疑报喜鸟回应:定增资金成本及风险高于普通投资者  每经记者 ...
10-31
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮