昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

10个月前 来源: 观看:116

2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1。dUL即热新闻——关注每天科技社会生活新变化gihot.com

1. SkyReels-V1:Human-Centric Video Foundation Model,中国首个面向AI短剧创作的开源视频生成模型dUL即热新闻——关注每天科技社会生活新变化gihot.com

SkyReels-V1可实现影视级人物微表情表演生成,支持33种细腻人物表情与400+种自然动作组合,高度还原真人情感表达。正如以下视频所示,SkyReels-V1支持生成大笑、怒吼、惊讶、哭泣等微表情,展现出人物情感丰沛的表演细节。即使有大幅度肢体动作,SkyReels-V1生成的微表情也完美贴合人物肢体表演。dUL即热新闻——关注每天科技社会生活新变化gihot.com

dUL即热新闻——关注每天科技社会生活新变化gihot.com

同时,SkyReels-V1为AI视频生成带来了电影级光影美学,基于好莱坞级的高质量影视数据训练,当前SkyReels生成的每一帧画面,在构图、演员站位、相机角度等都具备电影级的质感。无论是单人镜头表演细节,还是多人构图,当前已具备精准的表情控制和高质感画面。dUL即热新闻——关注每天科技社会生活新变化gihot.com

更重要的是,SkyReels-V1不仅支持文生视频、还能支持图生视频,是开源视频生成模型中参数最大的支持图生视频的模型,在同等分辨率下各项指标实现开源SOTA。dUL即热新闻——关注每天科技社会生活新变化gihot.com

dUL即热新闻——关注每天科技社会生活新变化gihot.com

图1丨SkyReels-V1文生视频指标对比(来源:昆仑万维SkyReels)dUL即热新闻——关注每天科技社会生活新变化gihot.com

能够实现这样的SOTA级别,不仅依赖于昆仑万维SkyReels团队基于自研的高质量数据清洗和人工标注管线,构建了千万级的高质量电影&电视剧&纪录片数据。更依托团队自研「Human-Centric」的视频理解多模态大模型,大幅提升视频中人物相关的理解能力,尤其是自研人物智能解析系统。dUL即热新闻——关注每天科技社会生活新变化gihot.com

综上所述,得益于扎实的数据工作和先进的人物智能解析系统,SkyReels-V1可以实现:dUL即热新闻——关注每天科技社会生活新变化gihot.com

影视化表情识别体系:11种针对影视戏剧中的人物表情理解,如不屑、不耐烦、无助、厌恶等表情的理解;dUL即热新闻——关注每天科技社会生活新变化gihot.com

人物空间位置感知:基于人体三维重建技术,实现对视频中多人的空间相对关系理解,助力模型生成影视级人物站位;dUL即热新闻——关注每天科技社会生活新变化gihot.com

行为意图理解:构建超过400种行为语义单元,实现对人物行为的精准理解;dUL即热新闻——关注每天科技社会生活新变化gihot.com

表演场景理解:实现人物-服装-场景-剧情的关联分析。dUL即热新闻——关注每天科技社会生活新变化gihot.com

SkyReels-V1不仅是全球极少数开源的视频生成模型,还是围绕人物表演、开源视频生成模型中性能最强的。dUL即热新闻——关注每天科技社会生活新变化gihot.com

在自研推理优化框架「SkyReels-Infer」的加持下,大幅提升推理效率,实现544p分辨率,推理基于单台4090只需80s,还支持分布式多卡并行,支持Context Parallel,CFG Parallel,和 VAE Parallel。此外,采取fp8 quantization以及parameter-level offload,满足低显存用户级显卡运行需求;支持flash attention、SageAttention,模型编译优化等,进一步优化延迟;基于开源diffuser库,提升易用性。dUL即热新闻——关注每天科技社会生活新变化gihot.com

正如下图2所示,在同等RTX4090资源情况下对比(4卡),SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s);SkyReels-Infer版本具备更鲁棒的部署策略,支持用户级别显卡1卡-8卡的推理部署。dUL即热新闻——关注每天科技社会生活新变化gihot.com

dUL即热新闻——关注每天科技社会生活新变化gihot.com

图2丨推理生成544p视频,使用相同卡数的RTX 4090,SkyReels-Infer版本端到端延迟优于HunyuanVideo官方(xdit) 58.3%dUL即热新闻——关注每天科技社会生活新变化gihot.com

在同等A800资源情况下对比,SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少14.7%~28.2%(如图3所示),SkyReels-Infer版本具备更鲁棒的多卡部署策略。dUL即热新闻——关注每天科技社会生活新变化gihot.com

dUL即热新闻——关注每天科技社会生活新变化gihot.com

图3丨推理生成544p视频,SkyReels-Infer版本具备更鲁棒的多卡部署策略,支持8卡部署dUL即热新闻——关注每天科技社会生活新变化gihot.com

2.SkyReels-A1:首个SOTA级别的基于视频基座模型的表情动作可控算法dUL即热新闻——关注每天科技社会生活新变化gihot.com

为了实现更加精准可控的人物视频生成,昆仑万维还开源了SOTA级别的基于视频基座模型的表情动作可控算法SkyReels-A1,对标Runway的Act-One,SkyReels-A1支持视频驱动的电影级表情捕捉,实现高保真微表情还原。能够基于任意人体比例(包括肖像、半身及全身构图)生成高度逼真的人物动态视频,其真实感源自对人物表情变化和情绪的精准模拟、皮肤肌理、身体动作跟随等多维度细节的深度还原。dUL即热新闻——关注每天科技社会生活新变化gihot.com

SkyReels-A1不仅支持侧脸的表情控制生成、还能实现更加逼真的眉眼微表情生成和更大幅度的头部与自然身体动作。SkyReels-A1能够实现更大幅度的人物表情驱动。相比Runway的Act-One,SkyReels-A1可以迁移更复杂的表情动作,生成的人物面部神情可以配合肢体及画面内容实现更栩栩如生的表演。dUL即热新闻——关注每天科技社会生活新变化gihot.com

3.以开源之姿,以破局之势,昆仑万维致力于推动全球AI短剧创作生态繁荣发展dUL即热新闻——关注每天科技社会生活新变化gihot.com

昆仑万维一直坚持开源,推动技术平权。昆仑万维同时将SOTA级别的SkyReels-V1和SkyReels-A1进行开源,是AI短剧行业首例,也是昆仑万维SkyReels回馈行业迈出的一小步,更是促进AI短剧创作和视频生成行业枝繁叶茂的一大步。dUL即热新闻——关注每天科技社会生活新变化gihot.com

我们相信在进行推理优化的升级和可控算法的开源后,它们将为用户带来低成本、可控性更强的AIGC能力。昆仑万维希望通过更多优秀视频生成模型的开源和极致的AI短剧产品能力,为用户带来低成本实现AI短剧创作的可能性、突破行业目前视频生成一致性差的问题,让大众通过自己的电脑生成精细且可控的人物表演。dUL即热新闻——关注每天科技社会生活新变化gihot.com

此次开源的视频大模型,不仅是一次技术突破,有助于缩小全球内容产业的数字鸿沟,更是文化产业生产力的一次革命。未来,短剧与游戏、虚拟现实等领域的跨界发展,将会加速产业融合。AI短剧也有希望从“技术实验”迈向“主流创作”,成为全球文化输出的新载体。dUL即热新闻——关注每天科技社会生活新变化gihot.com

“实现通用人工智能,让每个人更好地塑造和表达自我”是公司的使命,未来,昆仑万维及SkyReels还将开源更多视频生成模型和算法、通用模型,通过开源实现AGI平权,推动AI短剧生态的持续建设和繁荣,促进开源社区、开发生态以及AI行业的发展。(中国网)dUL即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-1-40779-0.html昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:续创佳绩! 轻喜到家与顺丰、跨越等一同入选“2024年航城街道服务业十强”

下一篇:英莱科技激光视觉焊缝跟踪系统全新PF系列新品发布,三大技术融合,强悍来袭

为你推荐
极目新闻记者 宋枕涛2月2日,农历正月初五,武汉归元寺迎来一年一度的迎财神传统民俗活动。清晨6时,大批游客涌往汉阳归元寺,以敬香“迎财神”的方式为新年祈福。记者在现场看到,公...
02-02
近日,山西大同古城某商户因未按要求亮灯,遭多名工作人员撬锁并强制开灯一事,引发广泛关注。2月7日,山西大同平城区古城街道发布致歉信。致歉信称,因古城街道工作方法失当,引起“破...
02-07
图源:Pixabay 寒武纪(688256.SH)的股价还在震荡,股民心情“过...
01-21
  据国务院国资委8月6日消息,近日,国务院国资委、国家发展改革委印发《关于规范中央企业采购管...
01-21
当前正值春运为保障广大交通参与者平安出行辽宁省公安厅交通安全管理局针对下列8类交通安全风险较高的...
01-21
  今后三天(2月18日至20日),南方将维持多阴雨的天气格局,北方今夜起降水也将发展增多,西北地区东部...
02-18
泰国旅游安全信心下降之际,从旅游业内到社媒大众都在推测:三亚旅游将迎“泼天富贵”。 喧嚣背后,近期三亚旅游热度究竟如何?时代周报...
01-21
  多款iPhone优惠价下破6000元!明天起买手机有补贴,这样操作最划算!补贴怎么领?北京公布细则   明天(1月20日)开始,购买手机、平板电脑和智能手表等将能享受到国家补贴。  ...
01-21
[本站 资讯] 日前,比亚迪官方宣布,2025款汉家族OTA升级内测,本次升级包含5项新增功能和6项优化体验。值得一提的是,本次OTA升级,涉及不同款型配置,以实际收到的OTA推送内容...
01-24
2 月 2 日消息,上汽通用别克品牌宣布别克 GL8 陆尊 PHEV 八方来财版上市。该车以“八方来财”套件形式提供,GL8 陆尊 PHEV 全系款型均可免费选装(限量 888 辆)。作为比...
02-02
最新播出的《仙台有树》收获了观众的一致好评。薛冉冉在剧中的表白引起了大家的兴趣,以下是对这一情节的分析。《仙台有树》的故事扣人心弦,薛冉冉和苏易水之...
02-19
随着电视剧的热播,“夜魔侠重生上映时间是什么时候”这一话题逐渐吸引了众多粉丝的目光。该剧播出后,凭借其精彩的剧情、精良的制作和演员们的精湛表演,赢得了...
02-21
美国时间1月13日至16日,一年一度的摩根大通医疗健康会议(J.P. Morgan Healthcare Conference,简称JPM大会)在加利福尼亚州旧金山成功举办。JPM...
01-21
21世纪经济报道记者武瑛港 实习生张烁 李依浓 房思宇 北京报道近日,有医美业内人士告诉21世纪经济报道记者,1月14日左右已经有医美机构收到...
01-21
    陈清泉受访者供图  ■本报记者韩扬眉  今年6月,第36届世界电动汽车大会时隔3年在美...
01-21
根据国务院发布的《高等教育自学考试暂行条例》和《辽宁省高等教育自学考试学历认定和课程免考实施细则...
01-21
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮