对话商汤科技首席科学家林达华:生成不等于完成,AI创作的关键是理解人的意图

3周前 来源: 观看:14

在AIGC技术快速迭代的当下,图生视频正在从实验室走进创作室、工作坊和工业一线。pEa即热新闻——关注每天科技社会生活新变化gihot.com

2025世界人工智能大会(WAIC 2025)期间,商汤科技联合创始人、执行董事、首席科学家林达华博士在接受时代周报等媒体采访时,深入剖析了多模态大模型的演进趋势、技术挑战与商汤的战略布局。他强调:“多模态能力是通向通用人工智能(AGI)的必经之路。”pEa即热新闻——关注每天科技社会生活新变化gihot.com

今年5月,CreateAI发布《多模态生成技术在动画制作领域的应用与发展白皮书》,该报告首次以中国动漫电影《哪吒2》为案例,结合权威数据,揭示了AI在激发创意与优化流程方面如何实现“降本增效”。pEa即热新闻——关注每天科技社会生活新变化gihot.com

林达华认为,生成式AI的未来,不应仅仅追求“从文字直接生成图像或视频”的技术炫技,而应聚焦于创作者意图与结果之间的精准对接。“AIGC的终极形态,是一个真正服务创作过程的交互工具。”pEa即热新闻——关注每天科技社会生活新变化gihot.com

商汤科技联合创始人、执行董事、首席科学家林达华博士 pEa即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:从技术角度来看,在视频生成过程中,如何实现对空间结构和物理逻辑的有效把控?pEa即热新闻——关注每天科技社会生活新变化gihot.com

pEa即热新闻——关注每天科技社会生活新变化gihot.com

林达华:商汤很早就布局了数字人、三维建模等方向,因此在三维空间建构方面积累深厚。在Sora引发关注时,我们也研究了它的视频质量,的确在视觉效果上令人惊艳,但它在物理规律的掌握上存在明显不足——它采用的是基于时间的一帧帧生成逻辑,本质上并不具备三维结构的建模与控制能力。相比之下,商汤内部一直在探索如何将三维结构能力应用于视频合成,让生成视频在空间结构和物理逻辑上都更加真实可控。pEa即热新闻——关注每天科技社会生活新变化gihot.com

这一优势也体现在我们参与的奥运场景应用中。例如在去年奥运会乒乓球等项目中,我们把三维的结构的这种信号,用于控制视频的生成,使得它生成的结果符合物理的结构、物理的规律。成功实现对球拍与球体轨迹的精准还原,为赛事回放与辅助判罚提供了强有力的技术支持。pEa即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:在实际运用中视频生成结果“符合物理逻辑”有多重要?pEa即热新闻——关注每天科技社会生活新变化gihot.com

林达华:这是我们高度重视的关键能力。生成内容不仅要“看起来真实”,更要“逻辑上成立”。例如,商汤的“开悟”世界模型,在某种意义上,也可被视为一种视频生成模型,但它对三维结构生成的准确性和物理性的要求极为严格。若生成的结果不符合物理规律,将其用于驾驶训练,将导致灾难性的后果。所以,相较于一些AI公司追求生成画面越“炫”越好,商汤更强调结果的正确性:我们生成的画面必须符合物理规律、空间逻辑,并具备可解释性。pEa即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:图生视频较文生视频有哪些提升?图生视频具体有哪些典型应用场景?在哪些环节真正能发挥价值?pEa即热新闻——关注每天科技社会生活新变化gihot.com

pEa即热新闻——关注每天科技社会生活新变化gihot.com

林达华:相较于文生视频,图生视频显然具备更坚实的依托。以文字为例,若要生成一只在空中飞翔的鸟,单凭文字描述,系统难以构思出丰富的细节。然而,若有一张图片作为基础,生成的结果便会日新月异。例如,要求系统生成“我妈妈微笑的照片”,若系统未曾见过你母亲,又怎能凭空创造?显然,必须有一张实际图像作为参考。因此,我认为真正的个性化生成,不应仅依赖文字描述,而需以真实影像为支撑,方能实现这一可能性。pEa即热新闻——关注每天科技社会生活新变化gihot.com

从图生视频的角度来看,最直接的莫过于C端应用场景。假设你家中存有大量照片,希望让它们“动”起来,这无疑是一个极具吸引力的创意。早期,我的团队开发了AnimateDiff,影响力较大。如今,许多后续的图生视频研究都与AnimateDiff有着千丝万缕的联系。我们注意到,这项于2023年开源的技术,被广泛用于创作各类充满想象力的视频,用户仅需几张照片便能展开创作。pEa即热新闻——关注每天科技社会生活新变化gihot.com

时代周报:图生视频价值在哪里?您怎么看AI和人类创作者的关系?pEa即热新闻——关注每天科技社会生活新变化gihot.com

pEa即热新闻——关注每天科技社会生活新变化gihot.com

林达华:我们一直认为,文生视频也好,图生视频也好,都不是生成式AI的终极形态。真正的理想状态,是将创作者的意图与生成过程深度融合,把AI当作一个真正服务创作流程的“工具”。pEa即热新闻——关注每天科技社会生活新变化gihot.com

在我理解,包括我们刚刚发布的视频平台上的Seko AI,它是一个交互式创作工具,我们将视频的制作视为一种创作,而不是仅仅输入一句话后就不管不顾,等待它生成一个结果。这个结果很可能并不符合你的预期,也不一定能直接使用。pEa即热新闻——关注每天科技社会生活新变化gihot.com

真正有价值的是,它能大幅减少你的工作量,同时你仍能对最终的生成内容进行把控。当发现生成内容不合适时,你可以指导它进行修改,掌控生成的脉络,这就是交互式生成的核心所在。pEa即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-3129-0.html对话商汤科技首席科学家林达华:生成不等于完成,AI创作的关键是理解人的意图

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:京东AI爆发:“狂扫”机器人赛道后,官宣与数十家机器人品牌达成合作

下一篇:落地工业场景,大模型要闯这三关?

为你推荐
1月20日,我国首款起飞重量5.25吨、最大载重1.9吨的大型无人机鸿雁(HY100)在新疆石河子市天域航通石河子生产基地成功实现量产下线,其中3架顺利向客户完...
01-21
1月15日,“AI六小虎”之一的MiniMax发布并开源了新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型...
01-21
近日辽宁又一批事业单位发布招聘公告↓↓↓1辽宁石化职业技术学院  招聘岗位  本次公开招聘12个岗...
01-21
  今天(1月24日)至27日,今年首场寒潮天气过程继续影响我国,中东部大部地区将陆续出现雨雪天气,西北...
01-24
随着春节临近,大街小巷年味渐浓,人们也纷纷开始购置年货,线上线下都洋溢着火热气氛。近来,一些承载着“年味”和创新的中国年货也正火热出海,走俏全球。比如,自动麻将机。贵州松桃...
01-21
  当地时间20日,俄罗斯总统普京在联邦安全会议常务委员视频会议上表示,俄方对与美国新的行政当局就乌克兰冲突开展对话持开放立场。  普京表示,在调解乌克兰冲突中,最主...
01-22
1 月 30 日消息,韩国汽车制造商起亚此前宣称其电动汽车“将于2025年1月”在北美支持使用特斯拉北美超充站充电,不过起亚公司现发布声明,宣布相应适配计划推迟至3月,为购...
01-31
2 月 3 日消息,今年春节假期,七座以下(含七座)小型客车通行收费公路继续执行免收通行费政策,免费通行时段起止时间为1月28日(除夕)00:00至2月4日(正月初七,明天)24:00,共计8天...
02-04
正在播出的《五十岚夫妇是伪装的陌生人》受到了观众们的喜爱,每一集的情节都引人入胜,人物角色也十分贴合故事情节的发展,让观众在观看过程中不断产生好奇心。...
02-22
近日,黄明昊在北京成功举办了一场别开生面的个人演唱会,吸引了众多粉丝与圈内好友的关注。演唱会上,黄明昊展现出了他多变的舞台魅力,不断切换不同风格的造型,为观众带来了精彩绝...
02-23
21世纪经济报道记者林昀肖 北京报道1月14日,市场监管总局官网正式发布《医药企业防范商业贿赂风险合规指引》。《指引》共四章49条,其中包括...
01-21
21世纪经济报道记者季媛媛 上海报道 2025年,DeepSeek火爆出圈。借力DeepSeek技术的加持,人工智能(AI)技术正深度重塑医药健康行业格局。当下,...
02-18
  大众网记者 王一刚 报道  冬日风雅,大雪知寒。一年岁暮风雪始,寒冬用最纯洁的底色酝酿世间最精彩的颂歌。  一、童言话大雪  孩子们对即将到来的“大雪”节气充...
01-21
  大众网记者 王一刚 报道  为进一步贯彻落实济南高新区教育文体部“三美”教师师德专题培训内容,加强师德师风建设,提升教师队伍素质,济南高新区玺悦幼教集团(玺悦园、...
01-21
  摘要  【供应压力逐渐增大合成橡胶继续上涨的空间有限】受国内外原油期货价格大幅上涨带...
01-28
  2025年开年,保险资金等中长期资金入市迎来了更为广阔的政策空间。1月22日,中央金融办、中国证...
02-14
狮子男是十二星座中最有自信和魅力的一位,他们对于爱情充满了激情和渴望。当一个狮子男...
01-22
狮子座的男生通常都有着强烈的自尊心和自信心,他们很难接受失败或失去某个重要的人。当...
01-22
莆田珠宝产业:从传统手工到现代设计的华丽蜕变提到珠宝,许多人可能会想到璀璨夺目的钻石和繁复精致的手工艺品。然而,若我告诉你,在中国的莆田,这座城市正以其卓越的珠宝产业悄然...
02-07
lv包包和ysl包包哪个? ysl包包真假鉴定?lv包包和ysl包包哪个?看你买那种了,钱包很一般的两折的大概三千多,大点的自然就会贵很多,平时出门背的包我们国内买的最便宜的是五千多,经典...
02-17
2月13日消息,苏宁易购宣布全面启动“6000元以上手机补贴计划”,2月14日至3月16日期间,针对6000元以上机型追加250-1000元补贴,每人限购一台,苏宁易购全国直营店可用。2月14日零点...
02-14
2月16日消息,淘宝香港站近日宣布与一站式家居维修平台Papabo达成合作,将在信和集团旗下尖沙咀中港城开设“PapaHome淘宝家具实体店”,计划于2月22日开业,首阶段营运面积超过2.5...
02-17
2月10日消息,易生支付近日凭借在万事达卡(Mastercard)国际与国内收单市场的突出贡献,再度荣获由万事达卡颁发的年度“卓越合作伙伴奖”,并获得由万事达卡在华合资公司万事网联首...
02-11
京东阿里进一步开放合作。今年三八妇女节,“京东服务+”官方旗舰店正式入驻淘宝天猫。作为京东和淘宝天猫在该类目的首次合作,此举将进一步满足用户洗衣洗鞋、家纺清洗、家电...
03-09
【#吉利旗下极光湾在上海成立汽车零部件公司# 注册资本2000万】天眼查App显示,1月20日,上海极光湾汽车零部件有限公司成立,法定代表人为WANG RUI PING,注册资本2000万人民币,经营...
01-21
近来,交易领域的流行语不外乎是“技术”和“创新”。 虽然许多业内人士都在强调尖端解决方案,但本质上真正的进步是远非这些营销炒作所能比的。 名副其实的创新是能为交易者提...
01-21
由2K游戏工作室31st Union打造的免费“Roguelike英雄射击”游戏《Project Ethos》,去年10月正式亮相,由于在角色设计和战斗机制等方面与暴死的《星鸣特攻》有着...
02-07
世界流媒体巨头Netflix今后或许能够直接欣赏大型体育赛事直播了,日前有消息称Netflix正在考虑F1美国直播权,全面进军体育直播事业。 ·目前F1在美国的直播权是...
02-12
2月4日,据报道,《封神2》太原路演现场观众情绪失控,导演乌尔善被观众贴脸质问: “为什么封神的口碑两极分化,你想过没有? 我们作为路人一直在给你说好话,你有没有想过自己去解决这...
02-05
在2月9日的比赛中,中国代表团获得7金7银9铜。其中,中国短道速滑队以2金2银4铜收官。△点击图片,查看哈尔滨第九届亚冬会奖牌榜。2月10日,将决出7枚金牌。比赛有哪些精彩看点?一起...
02-10
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮