可灵AI基础模型「双子星」重磅更新!快手盖坤:让每个人都能用AI讲出好故事

10个月前 来源: 观看:104

4月15日,可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

数据显示,自去年6月发布以来,可灵AI已累计完成超20次迭代,截至目前,全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户,将可灵的API应用于不同的行业场景中。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

一直以来,可灵AI致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。快手高级副总裁、社区科学线负责人盖坤表示,可灵希望让每个人都能用AI讲出好故事,实现更加精准的复杂创意表达。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

可灵AI全系模型进入2.0时代,定义人和AI交互的全新方式ruZ即热新闻——关注每天科技社会生活新变化gihot.com

4月15日,可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布。据悉,可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模式)以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

作为全球首个用户可用的DiT视频生成模型,截至目前,可灵AI全球用户规模已突破2200万,累计生成1.68亿个视频及3.44亿张图片素材。自去年6月上线至今的10个月时间里,可灵AI的月活用户数量增长25倍。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

ruZ即热新闻——关注每天科技社会生活新变化gihot.com

(图说:快手高级副总裁、社区科学线负责人盖坤)ruZ即热新闻——关注每天科技社会生活新变化gihot.com

盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤指出,MVL由TXT(Pure Text,语义骨架)和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现AI创作者们的创意表达。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

基于MVL理念,可灵AI正式推出多模态编辑功能。“从今天起,大家可以在可灵AI的平台上体验我们的多模态编辑能力。用户可以非常直接地把自己的想法用图像等方式作为输入,生成符合自己想法的创意视频。”盖坤介绍,MMW(多模态描述子)将不只局限于图片和视频,也可以引入其它模态的信息,例如声音、运动轨迹等,让用户实现更加丰富的表达。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

ruZ即热新闻——关注每天科技社会生活新变化gihot.com

(图说:“灵感成真”可灵AI2.0发布会现场)ruZ即热新闻——关注每天科技社会生活新变化gihot.com

可灵2.0大师版正式发布,全新上线多模态视频编辑功能ruZ即热新闻——关注每天科技社会生活新变化gihot.com

基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

ruZ即热新闻——关注每天科技社会生活新变化gihot.com

(图说:快手副总裁、可灵AI负责人张迪)ruZ即热新闻——关注每天科技社会生活新变化gihot.com

值得一提的是,可灵2.0大师版全面升级视频及图像创作可控生成与编辑能力,上线全新的多模态视频编辑功能,能灵活理解用户意图。支持在一段视频的基础之上,通过输入图片或文字,对生成的视频内容实现元素的增加、删减、替换,帮助创作者们实现更加灵活的二次编辑和处理。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

ruZ即热新闻——关注每天科技社会生活新变化gihot.com

(图说:可灵2.0大师版操作界面)ruZ即热新闻——关注每天科技社会生活新变化gihot.com

张迪披露,当前,图生视频约占到可灵AI视频创作量的85%,图片质量也对视频的生成效果产生重要作用。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

在图像生成大模型领域,快手的可图2.0处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于Midjourney V7、FLUX1.1 [pro]以及Reve等行业领先的图像模型,均保持明显优势。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

同时,可图2.0也上线了实用的图像可控编辑功能——局部重绘和扩图,支持图片的增加、修改和修复。在图像的多模态可控生成中,可图2.0还上线了全新的风格转绘功能,只需要上传一张图片加上风格描述,就能一键切换图片的艺术风格,同时精准保留原图的语义内容。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

AIGC技术迅猛发展,为全行业发展注入全新活力ruZ即热新闻——关注每天科技社会生活新变化gihot.com

除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

如今,可灵正在成为AI时代视频创作的新基础设施。AIGC技术的迅猛发展,也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

以二次元AI创作社区产品狸谱为例,其产品负责人一休介绍,可灵AI为狸谱带来了创新突破。其1.6版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图 - 影 - 音”快速创作,后者在春节期间引发60万用户转播。未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动AI成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态,携手开启二次元内容产业的新篇章。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

“可灵AI可全面融入剧集级创作流程”。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇在分享中介绍,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

从剧本创作到内容发行,异类Outliers团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。“我们实践之后发现,可灵AI是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。”陈翔宇认为,在AI的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,“AIGC也许是下一代内容结构的雏形”。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

ruZ即热新闻——关注每天科技社会生活新变化gihot.com

(图说:可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇)ruZ即热新闻——关注每天科技社会生活新变化gihot.com

为了进一步激发AI爱好者们的创作热情,快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。ruZ即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1765-0.html可灵AI基础模型「双子星」重磅更新!快手盖坤:让每个人都能用AI讲出好故事

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:“清华系”又将跑出一个IPO?今年已拿下三地国资投资, 智谱启动上市辅导备案

下一篇:PGT技术为胚胎做“健康体检”

为你推荐
美国科学家开展的一项研究发现,从栀子花中提取的京尼平化合物可促进神经再生。实验室研究显示,当受损且发育迟缓的神经元接触京尼平时,竟然重新焕发生...
01-23
  按照《自然资源部关于印发〈矿业权出让交易规则〉的通知》(自然资规〔2023〕1号)、《辽宁省自然资源...
01-21
  尼泊尔一名官员22日说,尼政府已提高从南坡攀登世界最高峰珠穆朗玛峰的许可费。  尼泊尔文...
01-24
  春运期间,乘坐高铁动车组列车时,您会看到在座位上方、行李架的下方有一串圆点状指示灯,分为红、绿、黄三种颜色。这些指示灯是干什么用的?不同颜色指示灯代表什么意思?掌...
01-21
  中新经纬1月17日电 2024年全国营业性演出票房收入579.54亿元,同比增长15.37%。  据中国演出行业协会微信号17日披露,根据中国演出行业协会票务信息采集平台数据监测和调...
01-21
1 月 24 日消息,据“特斯拉”官方新闻稿,特斯拉宣布旗下首批V4超级充电站将于国内落地,相应充电站也将支持第三方汽车充电。▲ 特斯拉 V4 充电桩V4 超级充电桩号称特斯...
01-25
2 月 3 日消息,近年来随着汽车辅助驾驶技术的不断发展,越来越多的司机依赖这些系统来减轻驾驶负担,有些人甚至在某些情况下完全放手不管,然而这种行为相当危险,极易引发...
02-04
  近来,“C-Drama”(Chinese Drama,中文电视剧)成为海外新热词,讨论日益火爆。  前段时间,由《...
01-22
《难哄》穆承允说了什么?穆承允结局是什么?在《难哄》中,穆承允说过的话虽没有大面积的详细描写,但有一些关键话语能体现他的人物特点和相关情节对温以凡表达关...
02-19
  大城市就医紧张,一些大型三甲医院常年“一床难求”,患者住院经常需要漫长等待。能不能“哪里有床住哪里”?   试点医院住院“...
01-21
21世纪经济报道记者 闫硕 北京报道原研仿制之争已然“破圈”,成为社会各界热议的话题。近日,在一场同学聚会上,众人向21世纪经济报道记者抛出...
01-31
作者:郁建兴(浙江工商大学党委书记)习近平总书记在2024年9月召开的全国教育大会上指出,建设教育强国是一项...
01-22
  大众网记者 王一刚 报道  为进一步贯彻落实济南高新区教育文体部“三美”教师师德专题培训内容,加强师德师风建设,提升教师队伍素质,济南高新区玺悦幼教集团(玺悦园、...
01-21
  在我国人口老龄化加速的大背景下,养老金融成为社会关注的焦点。中共中央、国务院近日出台的...
01-21
  中国网财经2月8日讯 日前,国家金融监督管理总局上海监管局核准高建辉中海信托股份有限公司总...
02-11
在爱情的世界里,有时候我们会遇到一些花心的男人。其中,双子座的男生就以善变、多情而著...
01-22
狮子座男孩通常自信、勇敢,喜欢成为众人焦点。然而,有时候我们可能想开个玩笑或者捉弄一...
01-22
穿搭化妆风格? 菲律宾穿搭风格?一、穿搭化妆风格?每个人的气质不同,在穿搭上有很多种风格,所以,妆容方面也是有很多风格的。那么,接下来我们一起来看看妆容有哪些风格吧!感兴趣的朋...
02-07
魅力绽放:模特T台走秀背后的故事在时尚界,有一种声音永远不会被忽视,那就是模特T台走秀。这个将创意与自信结合的空间,不仅展示着设计师的想象力,还体现着模特们的努力与魅力。走...
02-12
2月9日消息,齐心集团数字化运营平台近日接入DeepSeek大模型,推动AI大模型在数字化采购场景中的深度应用,为客户提供更全面、高效、完善的数智化解决方案。在DeepSeek技术的加持...
02-09
2月18日消息,总部位于班加罗尔的B2B电子商务公司Udaan近日从现有投资者Lightspeed Venture Partners和英国M&G Prudential处募集到7500万美元资金。据悉,该公司有望在下一季度...
02-19
2月10日消息,元宵将至,同程旅行发布的《2025年元宵节非遗灯会赏灯地图》显示,元宵灯会热门TOP10城市分别是:沈阳、南宁、镇江,成都、广州、开封、苏州、上海、南京、杭州。从北国...
02-11
2月14日消息,情人节到来,饿了么联合战略咨询公司OC&C共同发布的《情人节即时零售礼赠趋势与品类机遇洞察》显示,过去三年情人节当天,重点礼赠品类的外卖单量较12日环比增长超过3...
02-15
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
近日,PlayStation Network(PSN)遭遇严重宕机,至今已超过24小时未恢复正常服务,导致全球玩家无法访问在线内容,甚至连单人数字游戏也受到影响。这一事件迅速在社交媒...
02-10
近日据外媒报道称,RTX 5090、5080虽然上市还没有半个月,但已有不少用户反映显卡出现崩溃黑屏问题。 报道中提到,全球多地用户近日集中报告称(故障报告已超千例),这...
02-10
今天下午,商务部召开例行新闻发布会,新闻发言人在会上表示,今年春节假期,消费市场总体实现平稳开局。后期来看,一季度消费市场总体将继续呈现平稳增长态势。根据商务部商务大数据...
02-06
2月8日,哈尔滨亚冬会短道速滑混合团体2000米接力决赛,韩国夺得该项目金牌,这也是本届亚冬会的首枚金牌。中国队在比赛中出现失误,排名第四。...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮