“换个角度”往往是颠覆性创新的起点

1年前 来源:科技日报 观看:107

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。ftz即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。ftz即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”ftz即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。ftz即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。ftz即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。ftz即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。ftz即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”ftz即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。ftz即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。ftz即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?ftz即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。ftz即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。ftz即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。ftz即热新闻——关注每天科技社会生活新变化gihot.com

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。ftz即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。ftz即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”ftz即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。ftz即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。ftz即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。ftz即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。ftz即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”ftz即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。ftz即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。ftz即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?ftz即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。ftz即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。ftz即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。ftz即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。ftz即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1532-0.html“换个角度”往往是颠覆性创新的起点

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:新DNA显微镜“从内到外”绘制生命3D图

下一篇:感受生命科学“最”新成果的震撼

为你推荐
据《光子能源杂志》最新发表的一项研究称,以色列内盖夫本-古里安大学科学家开发出一种将液晶和纳米多孔微粒相结合的新方法,从而创造出一种能同时控...
01-24
记者1月23日从三峡集团获悉,我国首艘内河大型清洁能源滚装船——川江清洁能源滚装船项目首艘船舶在湖北省秭归县正式下水。该船总长129.8...
01-24
  时至隆冬,恒力重工产业园建设生产热度和速度不减。各种船舶在码头岸边依次排开,或等待试航,或等待交付...
01-24
  作者:本报记者李晓东《光明日报》(2025年02月16日05版)  乐山甜皮鸭。周艺珣绘  【至味人...
02-18
  春节临近  近日  广东、河南、辽宁的  一些城市已明确  2025年可以  有序、限时或在限定区域  燃放烟花爆竹  01  关于烟花爆竹燃放,多地官宣  东...
01-22
1月17日,为迎接中国农历蛇年的到来,重庆街头的蛇年新春装置亮相,呈现出浓浓年味。图为市民在巨型灯笼打造的新春装置处玩耍。中新社记者 周毅 摄  (新春走基层) 重庆...
01-21
1月19日,由博纳影业打造的军事战争巨制《蛟龙行动》正式开启预售,并将于1月29日大年初一全国上映。同时,电影《蛟龙行动》联名款车型——猛士917蛟龙战甲也将迎来银幕首秀。回...
01-25
1 月 29 日消息,特斯拉公司宣布,其 Cybertruck 车主现在可以在所有 V4 超级充电站享受更快的充电速度。此前,特斯拉于上个月开始逐步推出这一快速充电功能。1 月 28 日...
01-29
  1、《树下有片红房子》陈欢尔和宋丛没有在一起,宋丛暗恋过陈欢尔,但陈欢尔的官配是景栖迟。  2、宋丛是品学兼优的学霸,高中时为陈欢尔补习过功课,是个心思细腻但比较内...
02-18
  1、《难哄》于2025年2月18日中午十二点首播,会员首更三集,19日到21日每天更新两集,22日和23日每天更新一集。  2、官方的追剧日历目前只出到了2月23日,后续更新时间会慢...
02-19
1月22日,国家卫健委、国家中医药局联合发布《流行性感冒诊疗方案(2025年版)》,新增玛巴洛沙韦、法维拉韦两种抗流感病毒药物,并明确不建议联合...
01-23
21世纪经济报道记者武瑛港 北京报道近期血液净化上市公司健帆生物发布业绩预告,2024年营收为25.95亿元~27.87亿元,与2023年的19.22亿元相比...
02-11
  立足于学生生活,创造现实而又有意义的学习情境,突出语文的实用性是当前小学语文教学的一项主...
01-21
  大众网记者 杨涛报道  近日,2024年山东省“技能兴鲁”职业技能大赛暨第五届山东省汽车服务行业职业技能竞赛在青岛港湾职业技术学院成功举行。“技能兴鲁”职业技能...
01-21
  财中社1月20日电国信证券发布农林牧渔行业农产品研究跟踪系列报告。文中指出看好猪价2025年...
01-21
  摘要  【国际金价上演“狂飙”行情!华尔街交易商正“疯抢”黄金现货运往纽约】节后金价迭...
02-07
白羊座男生通常被认为是热情、冲动和直率的代表。他们对待感情非常认真,一旦爱上一个人...
01-22
双子座男生以他们聪明、机智和善变的性格而闻名。他们擅长与人交流,善于言辞和表达自己...
01-22
明星魅力解析:那些令人倾倒的女神们在光影交错的舞台上,女明星们以她们的美丽和才华征服了无数观众。无论是荧幕上的风情万种,还是红毯上的璀璨夺目,明星的魅力总是让人心醉神迷...
02-12
男士衬衫搭配什么颜色的外套好看有图?首先推荐同时容易上身又好打理的单色衬衫一般有,牛津纺衬衫,青年布衬衫和牛仔衬衫。这三种面料够厚实不会软塌塌,单穿外搭都可以。最简单的...
02-17
2月4日消息,春节假期,京东联合联通数智智慧足迹,对全国31个城市的线下商圈客流量及消费数据进行了实时动态统计,反映消费者在春节线上线下各场景中的消费趋势。观察显示,西安、哈...
02-07
2月13日消息,苏宁易购宣布全面启动“6000元以上手机补贴计划”,2月14日至3月16日期间,针对6000元以上机型追加250-1000元补贴,每人限购一台,苏宁易购全国直营店可用。2月14日零点...
02-14
1.饿了么投入超10亿,在沪发布“春生计划”近来的外卖行业,真是热闹非凡。京东来势汹汹,美团稳扎稳打,饿了么当然也没闲着。近日,饿了么在上海发布“春生计划”,宣布将于今年3月至5...
02-26
大清洗来临。1.抖音生服重拳出击,违规商家被处理在抖音,每天都有近200万条探店视频涌向6亿消费者。有人被种草了一碗麻辣烫,有人下单了人生第一次医美,但也有人掉进“9.9元低价...
03-01
近日,AI异构算力软件Infra供应商中科加禾完成数千万元Pre-A1轮融资,由北京市人工智能产业投资基金领投。成立于2023年的中科加禾,聚焦编译技术,为助推...
02-07
国家统计局近日公布的2024年国民经济运行数据显示,2024年全国社会消费品零售总额48.7895万亿元,比上年增长3.5%;全国网上零售额15.5225万亿元,增长7.2%。过去一年,增量政策...
02-09
今日(1月21日),roguelike游戏《Ragnar》Steam页面上线,游戏支持简繁体中文,发售日待定,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 在这款受北欧神话启发...
01-22
《最终幻想7:重生》PC版即将于北京时间1月23日晚上10点解锁,该作PC版媒体评分现已解禁,M站目前共收到29个评论,均分90,其中22个好评、1个中评,6个暂未给出评分。另外...
01-24
问:美国东部时间2月1日,美方宣布对中国输美产品加征10%关税。中方对此有何评论?答:美方以芬太尼问题为由,对中国输美产品加征10%关税,中方对此强烈不满,坚决反对,将采取必要反制措施...
02-02
北京时间2月1日,国际乒联在官网公布了2025澳门单打世界杯的参赛名额选拔办法。48个名额将分别由洲际杯赛和世界排名决定,其中每个大洲的洲际杯赛会产生4个名额(共20个名额),其余2...
02-02
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮