对话商汤科技首席科学家林达华:生成不等于完成,AI创作的关键是理解人的意图

9个月前 来源: 观看:89

在AIGC技术快速迭代的当下,图生视频正在从实验室走进创作室、工作坊和工业一线。cxp即热新闻——关注每天科技社会生活新变化gihot.com

2025世界人工智能大会(WAIC 2025)期间,商汤科技联合创始人、执行董事、首席科学家林达华博士在接受时代周报等媒体采访时,深入剖析了多模态大模型的演进趋势、技术挑战与商汤的战略布局。他强调:“多模态能力是通向通用人工智能(AGI)的必经之路。”cxp即热新闻——关注每天科技社会生活新变化gihot.com

今年5月,CreateAI发布《多模态生成技术在动画制作领域的应用与发展白皮书》,该报告首次以中国动漫电影《哪吒2》为案例,结合权威数据,揭示了AI在激发创意与优化流程方面如何实现“降本增效”。cxp即热新闻——关注每天科技社会生活新变化gihot.com

林达华认为,生成式AI的未来,不应仅仅追求“从文字直接生成图像或视频”的技术炫技,而应聚焦于创作者意图与结果之间的精准对接。“AIGC的终极形态,是一个真正服务创作过程的交互工具。”cxp即热新闻——关注每天科技社会生活新变化gihot.com

商汤科技联合创始人、执行董事、首席科学家林达华博士 cxp即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:从技术角度来看,在视频生成过程中,如何实现对空间结构和物理逻辑的有效把控?cxp即热新闻——关注每天科技社会生活新变化gihot.com

cxp即热新闻——关注每天科技社会生活新变化gihot.com

林达华:商汤很早就布局了数字人、三维建模等方向,因此在三维空间建构方面积累深厚。在Sora引发关注时,我们也研究了它的视频质量,的确在视觉效果上令人惊艳,但它在物理规律的掌握上存在明显不足——它采用的是基于时间的一帧帧生成逻辑,本质上并不具备三维结构的建模与控制能力。相比之下,商汤内部一直在探索如何将三维结构能力应用于视频合成,让生成视频在空间结构和物理逻辑上都更加真实可控。cxp即热新闻——关注每天科技社会生活新变化gihot.com

这一优势也体现在我们参与的奥运场景应用中。例如在去年奥运会乒乓球等项目中,我们把三维的结构的这种信号,用于控制视频的生成,使得它生成的结果符合物理的结构、物理的规律。成功实现对球拍与球体轨迹的精准还原,为赛事回放与辅助判罚提供了强有力的技术支持。cxp即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:在实际运用中视频生成结果“符合物理逻辑”有多重要?cxp即热新闻——关注每天科技社会生活新变化gihot.com

林达华:这是我们高度重视的关键能力。生成内容不仅要“看起来真实”,更要“逻辑上成立”。例如,商汤的“开悟”世界模型,在某种意义上,也可被视为一种视频生成模型,但它对三维结构生成的准确性和物理性的要求极为严格。若生成的结果不符合物理规律,将其用于驾驶训练,将导致灾难性的后果。所以,相较于一些AI公司追求生成画面越“炫”越好,商汤更强调结果的正确性:我们生成的画面必须符合物理规律、空间逻辑,并具备可解释性。cxp即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:图生视频较文生视频有哪些提升?图生视频具体有哪些典型应用场景?在哪些环节真正能发挥价值?cxp即热新闻——关注每天科技社会生活新变化gihot.com

cxp即热新闻——关注每天科技社会生活新变化gihot.com

林达华:相较于文生视频,图生视频显然具备更坚实的依托。以文字为例,若要生成一只在空中飞翔的鸟,单凭文字描述,系统难以构思出丰富的细节。然而,若有一张图片作为基础,生成的结果便会日新月异。例如,要求系统生成“我妈妈微笑的照片”,若系统未曾见过你母亲,又怎能凭空创造?显然,必须有一张实际图像作为参考。因此,我认为真正的个性化生成,不应仅依赖文字描述,而需以真实影像为支撑,方能实现这一可能性。cxp即热新闻——关注每天科技社会生活新变化gihot.com

从图生视频的角度来看,最直接的莫过于C端应用场景。假设你家中存有大量照片,希望让它们“动”起来,这无疑是一个极具吸引力的创意。早期,我的团队开发了AnimateDiff,影响力较大。如今,许多后续的图生视频研究都与AnimateDiff有着千丝万缕的联系。我们注意到,这项于2023年开源的技术,被广泛用于创作各类充满想象力的视频,用户仅需几张照片便能展开创作。cxp即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:图生视频价值在哪里?您怎么看AI和人类创作者的关系?cxp即热新闻——关注每天科技社会生活新变化gihot.com

cxp即热新闻——关注每天科技社会生活新变化gihot.com

林达华:我们一直认为,文生视频也好,图生视频也好,都不是生成式AI的终极形态。真正的理想状态,是将创作者的意图与生成过程深度融合,把AI当作一个真正服务创作流程的“工具”。cxp即热新闻——关注每天科技社会生活新变化gihot.com

在我理解,包括我们刚刚发布的视频平台上的Seko AI,它是一个交互式创作工具,我们将视频的制作视为一种创作,而不是仅仅输入一句话后就不管不顾,等待它生成一个结果。这个结果很可能并不符合你的预期,也不一定能直接使用。cxp即热新闻——关注每天科技社会生活新变化gihot.com

真正有价值的是,它能大幅减少你的工作量,同时你仍能对最终的生成内容进行把控。当发现生成内容不合适时,你可以指导它进行修改,掌控生成的脉络,这就是交互式生成的核心所在。cxp即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3129-0.html对话商汤科技首席科学家林达华:生成不等于完成,AI创作的关键是理解人的意图

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:京东AI爆发:“狂扫”机器人赛道后,官宣与数十家机器人品牌达成合作

下一篇:落地工业场景,大模型要闯这三关?

为你推荐
1月初,因误信微信群虚假工作招募信息被诈骗团伙骗至缅甸园区的演员王星终于回到国内,网友提着的一颗心终于松口气。与此同时,围绕网...
01-21
记者从中国载人航天工程办公室获悉,我国2025年计划发射神舟二十号、神舟二十一号两艘载人飞船和天舟九号货运飞船。1月20日,三次飞行任务的任务标识...
01-21
  当前春运返程以务工和学生客流为主。记者发现,一些务工出发地的火车票依然紧俏,而从大城市出...
02-14
  记者近日获悉,辽宁省就业和人才服务中心自2月7日至3月6日组织开展“冰雪辽宁·温暖就业”专项直播带...
02-17
“电子处方”新规施行,核实患者信息真伪、处方流转不畅等问题待解网络购药挺便民,但开方“别随意”1月12日,家住山东省德州市的李先生因急性咽喉炎到该市德城区中医医院门诊...
01-21
  中新经纬1月17日电 (林琬斯)近日,日本资生堂集团官网发布“价格调整通知”称,自2025年4月17日(星期四)起,由于原材料成本上涨,资生堂将对部分产品价格进行调整。  通知显...
01-21
  近日,丰田中国宣布雷克萨斯中国执行副总经理李晖升任总经理,这是丰田入华以来首次由非日本籍...
01-21
1 月 21 日消息,赛力斯今日公告,预计 2024 年度实现营业收入 1442 亿元到 1467 亿元,同比上升 302.32% 到 309.30%。从公告获悉,赛力斯预计 2024 年度实现归属于上市公...
01-22
自从《痞子无间道》播出以来,该剧在抖音、微博和B站等社交媒体平台上以及各大媒体和论坛上引发了广泛的关注和热议。其中,第9集的剧情介绍成为许多观众关注的...
02-19
近期备受瞩目的电视剧《难哄》中,郑可佳和温以凡的关系成为热门话题。这部剧在开拍前就吸引了大量粉丝关注,随着剧情推进,更多观众加入讨论,大家都对这对角色之...
02-20
据国家卫生健康委消息,1月22日,国家卫生健康委办公厅、国家中医药局综合司发布流行性感冒诊疗方案(2025年版)。国家卫生健康委表示,为进一步提...
01-23
关于实施2025年卫生健康系统为民服务实事项目的通知国卫办函〔2025〕25号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、中医药局、...
02-14
诗韵东湖,文润华章。2025年1月19日,第二届“东湖杯”校园现代诗歌大赛颁奖典礼在沈阳化工大学新时代雷锋...
01-21
大连理工大学认真贯彻落实党的二十大、二十届三中全会和全国教育大会精神,在教育强国建设新征程上,紧紧围...
01-21
  中国网财经1月15日讯 持牌消金进入纵深发展阶段后,在重塑业务模式的过程中,消费金融公司们既...
01-22
  在金融科技日新月异的今天,创新与发展如同双轮驱动,推动着金融行业不断前行。然而,在这股汹...
01-22
白羊男性格直爽、冲动,喜欢追求刺激和自由。如果你想要折磨一个白羊男,以下是一些方法可...
01-22
射手座男人是热情洋溢、乐观开朗的人,他们喜欢自由自在的生活方式。对于他们寻找一个能...
01-22
探索幻走服饰:蕴含个性与时尚的潮流选择在瞬息万变的时尚潮流中,服饰不仅是对外形象的展示,更是个性化风格的体现。今天,我想和大家聊一聊一个备受关注的服饰品牌――幻走服饰。...
02-07
儿童口号大全?  1、宝贝向前冲,这里属于你。  2、精彩艺术,尽放未来。  3、宝贝可爱,我们相伴。  4、来鹿优优,做全能宝宝。  5、希望,由此开始;未来,由此腾飞。  6、关...
02-12
2月15日消息,1688数据显示,2024年1688跨境生意订单规模同比增长超70%,2025年1688将进入海外15个国家和地区。“过去,许多工厂因缺乏外贸经验,只能依赖外贸公司或放弃海外市场。如...
02-15
2月16日消息,2月以来,淘宝平台上中式香订单量环比增长280%,香薰炉、香插等工具订单量环比大涨480%。从地域来看,广东、江苏、浙江、山东和上海的消费者更爱买中式香。在成交金额...
02-17
3月1日消息,同程旅行日前宣布,同程程心大模型将全面接入DeepSeek,成为首家接入DeepSeek大模型的OTA平台。同程程心是同程旅行自主研发的旅游行业专属模型,未来将与DeepSeek深度...
03-01
图源:图虫创意 华为手机再次迎来疯抢。3月5日,华为Mate70 P...
03-05
AI领域再添新融资。1月22日,AI硬件公司未来智能完成数千万元人民币的Pre-A轮融资,由万物创投领投,初心资本跟投。这是未来智能继2021年种子轮融资、2023年天使轮融资后完成的第...
01-23
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
由Mega Cat Studios进行开发、Retroware负责发行的喷神James宇宙平台冒险游戏《Angry Video Game Nerd 8-bit》。现已上线Steam平台。 本作以知名游戏评论节...
01-24
《原子之心》DLC3“深海迷情(Enchantment Under the Sea)”现已上线,售价10美元,国区售价40元,自带简体中文和中文配音。截止发稿时,该DLC已收录55篇评价,好评率94%,为...
01-31
随着人工智能技术的迅猛发展,AI大模型“深度求索 DeepSeek”凭借其突破性进展迅速走红,各种“培训课”马上就来了。学习人工智能一定要付费吗?消费者如何甄别纷繁的网课?有消费...
02-07
澎湃新闻记者 邹佳雯“回到2019年,总是在书本和新闻中出现的老人,就坐在我们面前,那是一位可爱的寻常老人,说话带笑意,脸色红润润的,身体随着讲述有小幅的晃动,故事讲得很有感染力,...
02-10
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮