“换个角度”往往是颠覆性创新的起点

6个月前 来源:科技日报 观看:71

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。B7F即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。B7F即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”B7F即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。B7F即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。B7F即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。B7F即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。B7F即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”B7F即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。B7F即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。B7F即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?B7F即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。B7F即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。B7F即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。B7F即热新闻——关注每天科技社会生活新变化gihot.com

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。B7F即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。B7F即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”B7F即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。B7F即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。B7F即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。B7F即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。B7F即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”B7F即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。B7F即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。B7F即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?B7F即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。B7F即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。B7F即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。B7F即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。B7F即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1532-0.html“换个角度”往往是颠覆性创新的起点

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:新DNA显微镜“从内到外”绘制生命3D图

下一篇:感受生命科学“最”新成果的震撼

为你推荐
据《光子能源杂志》最新发表的一项研究称,以色列内盖夫本-古里安大学科学家开发出一种将液晶和纳米多孔微粒相结合的新方法,从而创造出一种能同时控...
01-24
SQL Error: select * from ***_ecms_news2 where id in(,4) limit 2
中新社香港1月21日电 国泰集团21日公布数据显示,2024年,国泰航空及香港快运全年共载客逾2800万人次,同比上升30.7%;国泰货运全年共运载150万吨货物,同比增长11%。据统计,2024年12...
01-22
  新华社拉萨1月21日电(记者蒋梦辰、刘洪明)2024年西藏农村居民人均可支配收入21578元,同比增长8.3%。同时,城乡居民收入差距持续缩小,城乡居民收入倍差由上年的2.60降至2.57。...
01-22
1 月 24 日消息,据“特斯拉”官方新闻稿,特斯拉宣布旗下首批V4超级充电站将于国内落地,相应充电站也将支持第三方汽车充电。▲ 特斯拉 V4 充电桩V4 超级充电桩号称特斯...
01-25
1 月 27 日消息,特斯拉现已公布了旗下Model 3 / Y车型 2025 年 2月购车权益,其中焕新款 Model 3(2025 款)和旧款(2024 款)Model Y 车型可享限时5年0息分期购车方案,而焕新...
01-28
近期上映的电视剧《情薄似秋云,红颜洽春风》自播出以来,迅速赢得了众多观众的喜爱,许多人沉迷于剧情无法自拔。该剧由演员于珂然和江潼主演,每天18:00在山海剧...
02-19
随着电视剧《惊雀》的热播,其剧情介绍也逐渐引起了广大粉丝的关注。该剧播出后,凭借精彩的剧情、精良的制作和精心的演绎,受到了观众的一致好评,并拿下了收视第...
02-21
  近日,中国疾控中心最新数据显示流感病毒阳性率持续上升且以甲流为主。奥司他韦和玛巴洛沙韦...
01-21
  美国宾夕法尼亚大学科学家绘制出了迄今最完整、最详细的肾功能遗传图谱,发现1000多个基因有...
02-14
  大众网记者 张明明 报道  11月11日至14日,由教育部高等教育司指导、中国高等教育学会主办的第四届全国高校教师教学创新大赛产教融合赛道全国赛在重庆邮电大学举行...
01-21
  江苏徐州幼师幼教集团万科城幼儿园以“健康第一”为指导思想,以“趣”运动、“悦”健康为办园理念,不断增强幼儿体质,促进园所发展。  万科城幼儿园优化体育特色活动,增...
01-21
  “年终奖刚发,本来打算去银行网点买定期存款,但利率实在太低。客户经理推荐了一款针对新客户...
01-22
  本报记者 熊悦  金价持续攀高之际,已有商业银行下调黄金账户业务(即“积存金”,以下统称“积...
02-11
双子座的男生聪明、机智,善于交际,对新鲜事物充满好奇。如果你想让他爱上你,就需要用一些...
01-22
水瓶女是一个独立、聪明且有点神秘的星座,她们对感情的态度往往让人捉摸不透。如果你想...
01-22
黑白小格子衬衫怎么搭配?一、黑白小格子衬衫怎么搭配?谢题主邀请:夏季黑白小格子衬衣搭配怎么搭配?盛夏美女们简约搭配,都会显得自然大方,帅气可爱又有魅力风度,牛仔裤头配黑白格...
02-07
揭秘北京T台走秀模特公司:行业内幕与精彩瞬间在灯光璀璨的T台上,模特们用自信的步伐和优雅的姿态为观众呈现了一场场视觉盛宴。作为北京这个时尚与文化交融的大都市,T台走秀模...
02-17
2月13日消息,商务部新闻发言人何咏前今日介绍“2025全国网上年货节”有关情况。2月5日,2025年全国网上年货节圆满收官。据商务大数据对重点电商平台监测,活动期间,全国日均网上...
02-14
2月16日消息,2月以来,淘宝平台上中式香订单量环比增长280%,香薰炉、香插等工具订单量环比大涨480%。从地域来看,广东、江苏、浙江、山东和上海的消费者更爱买中式香。在成交金额...
02-17
今年1、2月分别有春节和情人节两个节日,不少消费者会趁着节日,给亲友、恋人送上精心准备的黄金饰品。周大福、周六福、金大福、金六...
02-07
图源:图虫创意 华为手机再次迎来疯抢。3月5日,华为Mate70 P...
03-05
由爱奇艺出品,新力量文化、新影方舟、老有影视联合出品,新力量文化承制,爱奇艺奇正工作室打造,惠楷栋执导,解嬿嬿编剧,谭卓、高叶、刘奕君领衔主演,林雨申特邀领衔出演,扈耀之、田小...
01-21
预计全年扣非净利润大增1,313.65%–1,981.21%!1月21日晚,沃特股份(002886.SZ)发布2024年业绩预告,预计实现净利润和扣非净利润双双大幅增长。具体看来,公司预计去年归属于上...
01-22
外媒发现北美娱乐软件分级委员会(ESRB)官网出现了《生化危机6》的分级,分级信息为成人级(M),登陆平台为Xbox Series。 《生化危机6》最初于2012年10月发售,登陆了PS...
01-22
2月1日,开发商Tripwire Interactive宣布,恐怖第一人称射击游戏《杀戮空间3》将于 3 月 25 日发售,登陆Steam、Epic、PS5和Xbox Series X|S,游戏预购现已开启,Steam...
02-02
要说今年春节档电影,不得不提的就是《哪吒之魔童闹海》。从大年初一上映以来,这部电影的票房一路高歌猛进。北京时间昨天(6日)中午,该影片以突破57.76亿元的成绩超过了2021年的电...
02-07
2月8日,哈尔滨亚冬会短道速滑混合团体2000米接力决赛,韩国夺得该项目金牌,这也是本届亚冬会的首枚金牌。中国队在比赛中出现失误,排名第四。...
02-08
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮