“换个角度”往往是颠覆性创新的起点

10个月前 来源:科技日报 观看:99

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。AN1即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。AN1即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”AN1即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。AN1即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。AN1即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。AN1即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。AN1即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”AN1即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。AN1即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。AN1即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?AN1即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。AN1即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。AN1即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。AN1即热新闻——关注每天科技社会生活新变化gihot.com

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。AN1即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。AN1即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”AN1即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。AN1即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。AN1即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。AN1即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。AN1即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”AN1即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。AN1即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。AN1即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?AN1即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。AN1即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。AN1即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。AN1即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。AN1即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1532-0.html“换个角度”往往是颠覆性创新的起点

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:新DNA显微镜“从内到外”绘制生命3D图

下一篇:感受生命科学“最”新成果的震撼

为你推荐
从空间太阳能发电到破解大脑基因密码,再到由真菌制造的自我修复材料,《欧盟研究与创新》杂志盘点了2025年有望大放异彩的创新技术。这些成果拥有广阔...
01-21
据美国辛辛那提大学官网1月13日报道,该校科学家研制出一种新型空气碳捕获系统,能直接从空气中捕获约420ppm(1ppm为百万分之一)的二氧化碳(CO2)。该系统不...
01-21
  被T台十足宠幸的大廓形配饰近年来越来越多走上街头,成为时髦精的造型日常,尤在简约风愈发流行...
01-27
  农业是国民经济的基础产业。去年,我省农业农村经济运行实现稳中有进、稳中有增的良好态势,第一产业增...
02-11
在过去的一年,很多人都知道“胖东来”。这个原本扎根在河南许昌、新乡的超市,以细致的服务和严格的品控掳获众多好感,由此被誉为零售...
01-21
  作为新春的“氛围担当”之一,年宵花深受人们的喜爱。春节将至,年味渐浓,各地不同品种、五彩斑斓的年宵花已大量上市,满足消费者需求。  在山东济宁兖州区兴隆庄街道一...
01-22
[本站 资讯] 1月10日,我们从比亚迪官方了解到,其针对旗下紧凑型SUV――宋Pro DM-i推出限时优惠活动,仅9.98万元起,以及至高4000元置换补贴、“0首付或0利息或0月供”、原...
01-21
2 月 5 日消息,据央视新闻报道,记者今天从国家电网智慧车联网平台了解到,2025 年春节期间,我国新能源汽车高速公路充电量大幅增长,比去年同期增长近三成。从数据获悉,今年...
02-06
《逃命游戏:无限重启》播出后,许多观众对剧情发展和角色命运产生了浓厚兴趣。该剧由夏婧苒和宋旭主演,于每天上午10点更新,属于复仇题材,在汪汪剧场播出。故事讲...
02-21
电视剧《六姊妹》近期以其深刻的情感表达触动了无数观众的心弦,剧中虽然聚焦于六位女性的命运波折,但不得不提的是,由奚美娟饰演的奶奶何文氏,这一角色虽未拥有全名,却以其坚韧不...
02-23
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家医保局发函回应赴上海调研集采药品质量...
01-21
21世纪经济报道记者 闫硕 北京报道2月11日,广州公共资源交易中心发布了《关于公布各批次集采中选药品合同签订和供应情况的通知》(简称“通...
02-13
编译丨刘玉洁 赵广立 美国密歇根州的贝克学院(Baker College)是一所有百...
01-21
  大众网记者 隋宜笑 报道  12月26日,山东政法学院党委委员、副校长胡晓清,山东政法学院传媒学院党总支书记徐永青,山东政法学院传媒学院副院长常洪卫等一行5人到访山东...
01-21
  原标题:盘点2024持牌消金(一)|行业进入纵深发展:头部“缩表”、腰部“赶超”,不良资产加速“甩卖...
01-22
  原油期货在上周走高后本周维持震荡,从当前市场逻辑来看,分析人士认为,短期原油价格向上驱动不...
01-24
天秤座男生是十分浪漫和迷人的,当他们喜欢上一个人时,会展现出一系列独特的行为和特点。...
01-22
天蝎座男性在工作中往往是强势而有魅力的领导者,他们对待感情也同样充满了热情和决心。...
01-22
给女孩子的饰品店起名:好听又吸引顾客的秘诀在为女孩子的饰品店起名时,我们希望这个名字能够既好听又具有吸引力。一个好的店名不仅能够让顾客一眼记住,还能传达出品牌的气质和...
02-12
lv包包和ysl包包哪个? ysl包包真假鉴定?lv包包和ysl包包哪个?看你买那种了,钱包很一般的两折的大概三千多,大点的自然就会贵很多,平时出门背的包我们国内买的最便宜的是五千多,经典...
02-17
1月24日消息,国联股份冷链多多数字云仓(寮步仓)开仓仪式近日在东莞市寮步镇举办,标志着冷链多多禽蛋产业链仓网布局在华南地区再落一子。涂多多高级副总裁、物流部总监安珅,冷链...
02-07
小米集团市值冲上万亿赛道自蛇年开工以来,小米股价一路飙升,小米集团市值冲上万亿赛道,仅仅上市7年小米就实现了万亿的跨越,作为创始人的雷军也迎来了高光时刻。具体来看,2025年2...
02-09
2月18日消息,据环球旅讯,携程集团近日宣布多名高层调整。截图图源:环球旅讯公众号任命公告具体为,陈刚出任集团首席产品官,将牵头集团AI相关产品的战略制订;谭煜东出任集团首席科...
02-19
3月3日消息,2025年第九届亚洲冬季运动会(以下简称“亚冬会”)近日在冰雪之城哈尔滨落下帷幕。在“亚冬会”举办期间,银联商务全力保障“亚冬会”现场和周边服务的支付便利,同时推...
03-04
2025新年伊始,武汉便迎来了一场星光熠熠的盛大发布仪式。潮宏基一城一非遗的武汉站,携手汉绣非遗传承人王子怡,重构花丝与汉绣新生表达,通过新的博物馆概念空间,展陈出了非遗碰撞...
01-22
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
02-09
前几天,经典科幻作品《攻壳机动队》官方突然发布倒计时,今天谜底揭晓,官方将举行系列全部动画作品展,届时还会包括2026年的全新作品等等,敬请期待后续详细消息。 ...
02-05
《城市:天际线2》中国地区资产包现已免费上线Paradox Mods,官方表示中国资产包的目标是重现这种独特的融合——从四合院的历史韵味到现代高层建筑的宏伟规模。此...
02-11
当地时间2月5日下午,法国国民议会举行极左翼政党“不屈法国”提出的两项针对现任政府的不信任动议投票,两项动议均未获通过。当晚,法国总理贝鲁宣布再次使用宪法相关条款授权,直...
02-06
极目新闻记者 李迎近日,四川“献血大王”杨秀伟因突发脑梗入院治疗。2月6日,杨秀伟的妻子谢素华称,目前丈夫病情平稳但尚未脱离危险期,仍在住院观察阶段。据谢素华介绍,1月30日,她...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮