“换个角度”往往是颠覆性创新的起点

2个月前 来源:科技日报 观看:37

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。Dla即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。Dla即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”Dla即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。Dla即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。Dla即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。Dla即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。Dla即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”Dla即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。Dla即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。Dla即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?Dla即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。Dla即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。Dla即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。Dla即热新闻——关注每天科技社会生活新变化gihot.com

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。Dla即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。Dla即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”Dla即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。Dla即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。Dla即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。Dla即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。Dla即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”Dla即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。Dla即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。Dla即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?Dla即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。Dla即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。Dla即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。Dla即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。Dla即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1532-0.html“换个角度”往往是颠覆性创新的起点

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:新DNA显微镜“从内到外”绘制生命3D图

下一篇:感受生命科学“最”新成果的震撼

为你推荐
  IT之家1月14日消息,据路透社报道,俄罗斯一家地方法院于本周二对Alphabet旗下的谷歌公司处以80...
01-21
美国加州大学旧金山分校团队发现,小鼠体内存在一种分子计时器,在怀孕最初几天就会被激活,并影响小鼠的分娩时间。如果相同的一组分子在人类妊娠中所起...
01-22
    2月3日拍摄的华山群峰(无人机照片)。  春节假期,位于陕西省渭南市的西岳华山迎来游览高...
02-06
  ◎刘侠本报记者滕继濮  2月4日,正值新春假期。四川自贡的夜空,被一盏盏精美绝伦的彩灯点缀...
02-11
  央广网北京1月17日消息(记者门庭婷)1月17日,国家统计局发布2024年全国房地产市场基本情况。 ...
01-21
  一场公交车小型化潮流,正在席卷全国部分城市。  “宝宝巴士”越来越多  2025年初,不少青岛居民发现,新的公交车“缩水”了。  以前那种“巨无霸”的公交车越来越...
01-21
1月16日,位于长江路上的劳斯莱斯南京全新视觉展厅焕新启幕,精心设计的典雅空间与匠心独运的艺术臻品相辅相成,为客户的非凡创想激发灵感。现场还有两款劳斯莱斯Bespoke高级定制...
01-21
2 月 3 日消息,博主@孙少军09 今日发文分享了一张截图,其中提到了吉利银河 L6 EM-i 汽车相关销售信息,重点内容如下:L6 EM-i 已陆续到店,可以按照 8.98 万起的先享提车价...
02-04
  1、《难哄》向朗在剧中没有官配,他是温以凡的发小好友,也是十分优秀又温柔强大的海归精英。  2、小说中向朗没有爱情线,他跟温以凡是纯粹的友情,对温以凡好是出于朋友之...
02-19
《难哄》段嘉许什么时候爱上桑稚的?段嘉许和姜颖的关系是怎样的?一开始,段嘉许因为和桑稚哥哥桑延是朋友,又受桑家照顾,把桑稚当作妹妹看待。桑稚13岁时两人相识...
02-19
  春节后第一个重要节日元宵节到来。除了看花灯、猜灯谜,品尝元宵(汤圆)也是千家万户过节的重要...
02-13
  在探索生命奥秘的领域,干细胞研究取得了令人瞩目的成就。自1932年干细胞相关研究问世以来,历...
02-14
  大众网记者 杨涛报道  11月19日,白俄罗斯共和国职业教育研究院校长戈卢博夫斯基•瓦莱里•尼古拉耶维奇副教授, 国际合作中心主任科列伊妮娜•奥尔加•瓦列耶夫娜一...
01-21
  近日,在第三届全球数字贸易博览会上发布了首批全国农村电商“领跑县”典型案例,曹县是山东省唯一上榜者。文化自信是新时代的突出优势,也是新时代文化的鲜明标识。正是...
01-21
  近年来,中国保险业发展迅速,市场规模已跃居世界第二。互联网保险作为新的产业形态,一直以来受...
01-24
  摘要  【证监会重磅!13处提及期货解读来了】《关于资本市场做好金融“五篇大文章”的实施...
02-08
当双鱼男第一次见到巨蟹女时,他会展现出一系列特定的表现。这些表现可以帮助我们更好地...
01-22
冷战是一种常见的情感处理方式,但对于狮子男他们往往更难以忍受这种冷漠的态度。如果你...
01-22
探索君杰潮流服饰:引领时尚的新风潮当我们提到潮流服饰,许多人都会想起那些充满个性和活力的品牌。而在这个竞争激烈的市场中,君杰潮流服饰无疑在众多品牌中脱颖而出。作为一个...
02-07
校运会帅气穿搭? 帅气穿搭文案?一、校运会帅气穿搭?首先要选择实用性强的,防风、防雨、吸水性的运动服,运动服对于运动员有着非常重要的辅助性作用,能够激发运动员的内在潜能,充分...
02-17
1月24日消息,国联股份冷链多多数字云仓(寮步仓)开仓仪式近日在东莞市寮步镇举办,标志着冷链多多禽蛋产业链仓网布局在华南地区再落一子。涂多多高级副总裁、物流部总监安珅,冷链...
02-07
2月19日消息,陶都国控产业投资(邯郸)集团有限公司(以下简称“陶都国控”)运营总监、销售总监陈亮近日到访国联股份新疆数字经济总部。涂多多副总裁、西北大区总经理李庆代表公司...
02-20
2月23日消息,小马智行近日开通广州自动驾驶示范运营专线,用户可搭乘自动驾驶车,从广州市中心相应地点往返广州白云机场和广州南站。图源: Pony.ai小马智行公众号据了解,小马智行...
02-24
图源:图虫创意 一张刀郎演唱会门票,成为眼下最热门的“尽孝...
03-04
近年来,随着资本市场不断深化,中小基金公司凭借灵活的经营策略和专业的投资管理能力,逐步挺进基金行业发展的前列。  最新披露的基金四季报数据显示,众多中小基金公司的公...
01-23
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
今日(1月31日),真人互动电影《Trilogy of the Moon》Steam页面上线,游戏支持简繁体中文,预计于2025年第一季度发售,感兴趣的玩家可以点击此处进入商店页面。 ...
02-03
今日(2月4日),恐怖片《死神来了6》首曝预告,《死神来了》已推出25周年,聚焦死神对少男少女们下手,上演各种恐怖的死法,前五部于2000年-2011年上映。 宣传片: 本片由...
02-04
极目新闻通讯员 凌丽万“巳”大“集”闹新春,非遗技艺过大年。2月3日,正月初六,又恰逢二十四节气之首“立春”,为庆祝首个“非遗版”春节,弘扬中华优秀传统文化,寄托岁首美好期盼,...
02-04
2月5日傍晚,小米创始人雷军在社交媒体上发文:这是金的。转发的视频里有人介绍,小米SU7 Ultra车标变成了碳纤维+金色,兄弟们这个如何?来源:当事人社交账号今日上午,雷军又连发多条微...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮