“换个角度”往往是颠覆性创新的起点

11个月前 来源:科技日报 观看:102

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。1uz即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。1uz即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”1uz即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。1uz即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。1uz即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。1uz即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。1uz即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”1uz即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。1uz即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。1uz即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?1uz即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。1uz即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。1uz即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。1uz即热新闻——关注每天科技社会生活新变化gihot.com

3月29日,2025中关村论坛年会——第十四届吴文俊人工智能科学技术奖颁奖典礼将科技进步奖特等奖授予京东科技信息技术有限公司、中国科学技术大学等共同完成的“多模态交互式数字人关键技术及产业应用”项目。中国工程院院士、清华大学信息学院院长戴琼海在颁奖典礼上评价,获奖团队通过产学研合作推动数字人技术应用,为数字经济的发展树立了标杆。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“能打动评委的,或许不是形容数字人逼真度的一系列量化指标,而是真真切切呈现在他们面前的、让人一时真假难辨的数字人本身。”特等奖团队负责人、京东探索研究院院长何晓冬告诉科技日报记者,特等奖不是每年都有,要在一等奖的基础上再评审,只有得到绝大多数评委的认可才会被授予。1uz即热新闻——关注每天科技社会生活新变化gihot.com

3年前,普通人要拥有一个和自己长得像、说话像的数字人几乎是不可能的,寥寥几位名主持人的数字分身表现也有些僵硬。如今,只需一张照片或很短的视频,人人都能借助京东言犀拥有“以假乱真”的数字分身。1uz即热新闻——关注每天科技社会生活新变化gihot.com

换个角度攀登“珠峰”1uz即热新闻——关注每天科技社会生活新变化gihot.com

在虚拟世界“克隆”一个自己,这曾经被认为是行业的一座“珠峰”。2020年,英伟达创始人黄仁勋带着自己的数字分身召开发布会,不到一分钟的“再现”背后,是几百个摄像头采集数据、最新的显卡处理数据以及各类计算资源的支撑。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“那时不到一分钟的数字分身‘仿真’可能需花费百万美元。”何晓冬解释,为了复刻得像,那时的技术逻辑是构建物理模型,把真实的三维世界的每个表面分割成大量很小的三角形,通过物理模型进行模拟,然后渲染面部表情,这样需要极大量的计算,且难以满足实时输出的要求。1uz即热新闻——关注每天科技社会生活新变化gihot.com

现实世界的逼真再现要处理的数据量太大了,这似乎是一个迈不过去的“大山”。1uz即热新闻——关注每天科技社会生活新变化gihot.com

研究团队没有选择“死磕”,而是逆向思维研究起信息的接收方——视网膜。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“人体的视网膜是二维的,我们之所以能感知这个世界,是因为二维的信息在大脑中重构出了三维。”何晓冬说,与其先复现一个刻板的三维世界,被视网膜“降维”再由大脑重构,不如直接把“降维”后的影像给视网膜。这样既解决了重构的数据量,又没有影响大脑的感知。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“换个角度解决问题”让团队找到了颠覆性创新的“更优解”。团队进一步打磨端到端(无需高颗粒度拆解)的再现技术,提升了二维的精度,做到让大脑“满意”。1uz即热新闻——关注每天科技社会生活新变化gihot.com

在动作的再现上,团队利用“常识”进一步压缩计算量。“过去每个动作都要采集,然后再重现,事实上,人类动作大多是常规的,很少有人像蜘蛛侠一样行动。”何晓冬说,通过预建模将“先验知识”告知给AI,AI在进行动作创造时就会有“依据”,共同的动作有选择,个别的动作再采集,降低了处理量,也让动作更符合常理。1uz即热新闻——关注每天科技社会生活新变化gihot.com

给多模态数据任命“领队”1uz即热新闻——关注每天科技社会生活新变化gihot.com

“我们瞄准的不是做一个‘展示品’,而是要落地直播应用。”何晓冬说,直播要和观众互动几个小时,就要解决人工智能幻觉,声音、手势、表情等协调的问题,而人对人是最敏感的,哪怕眼珠转动与声音、仪态出现一点偏差也会被视为异常。1uz即热新闻——关注每天科技社会生活新变化gihot.com

文生视频大模型Sora的产品是无声的,但想应用于直播就必须配上声音。一旦需要配音,虚拟人的声调、特有口音、是否与动作匹配等细节都可能露馅,这些使得多模态数据的联动成为必须解决的问题。1uz即热新闻——关注每天科技社会生活新变化gihot.com

如何才能让数字人知道说话的时候什么时候该亢奋,什么时候该温柔呢?1uz即热新闻——关注每天科技社会生活新变化gihot.com

“团队经过讨论决定用语音来驱动‘统领’表情、微动作等其他模态的信息。”何晓冬说,通过生成一个基础数字人,用视觉特征对其进行训练,让它学会什么时候该轻声细语、什么时候该声音激昂,声音跟它要播报的文字内容相匹配,然后再驱动多模态的协同配合,最终生成一个合乎常理的形象。1uz即热新闻——关注每天科技社会生活新变化gihot.com

由于需要长时间播报,团队还对人工智能的幻觉问题进行了专门攻关,将人工智能的幻觉率降低到可接受范围内,让它在相当长的时间里保持逼真的拟人度和情绪。1uz即热新闻——关注每天科技社会生活新变化gihot.com

在计算量降低、降本增效的基础上,京东言犀数字人实现了大规模商业化,已经服务9000多户商家、累计创造140亿元的经济价值,未来将在文旅、教育、政务等其他场景落地应用。1uz即热新闻——关注每天科技社会生活新变化gihot.com

“我们还将推出来‘千人千面’的数字人。”何晓冬说,现在大家一场直播中看的内容是一样的,未来每个人根据喜好可以定制不同的数字人服务,在文旅表演等方面都能落地。1uz即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-1532-0.html“换个角度”往往是颠覆性创新的起点

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:新DNA显微镜“从内到外”绘制生命3D图

下一篇:感受生命科学“最”新成果的震撼

为你推荐
  科技日报记者 张佳欣  澳大利亚新南威尔士大学工程师成功演示了一个基于量子力学的“锑猫...
01-21
  年味浓浓,市场红火,步入腊月,春节为开年经济铺就深厚底蕴。蛇年国风台历、蛇年国潮红袜、蛇年...
01-21
  1月22日,腊月二十三,这一天是北方传统的小年,而南方传统的小年则在腊月二十四。小年到,甲辰龙年...
01-23
  中国疾病预防控制中心发布的2025年1月健康风险提示显示,近期需要关注的急性呼吸道传染病还有人偏肺病毒、鼻病毒、腺病毒、肺炎支原体等病原体感染引起的传染病。其中...
01-21
长三角的“千亿县”,又扩容了。 近日,合肥长丰县在作2024年政府工作报告时宣布,长丰晋级安徽省第二个“千亿县”。预计全年GDP增长10...
01-21
1 月 24 日消息,小鹏汽车今日发布《小鹏 MONA 答用户问(第 14 期)》,重点针对哨兵模式相关问题进行了解答。附重点内容如下:哨兵模式在什么情况下会触发?有人碰到车会有报...
01-25
1 月 30 日消息,日本汽车媒体 Mag-X 昨日(1 月 29 日)发布博文,报道称由于 LS 轿车 2024 在日本销量不足 1500 辆,雷克萨斯考虑调整 LS 系列,替代推出三排七座混合动力 SU...
01-31
  1、《难哄》桑延从上高中的时候就开始喜欢温以凡了,两人还约定要考同一所大学。  2、温以凡因为家庭变故以及在大伯家的经历,让她最终更改了志愿,还在高考结束后拒绝了...
02-15
《难哄》穆承允是一个什么角色?在《难哄》中,穆承允是一个男四号的配角。外在形象:长相俊秀,五官偏柔,有点男生女相,但身材高挑且强壮,整体给人一种清隽明朗的感觉...
02-19
  大众网记者 孙海燕 济南报道  2024年9月3日,国家卫健委等14部门联合发布《关于推进健康乡村建设的指导意见》,将健康乡村建设作为落实乡村振兴和健康中国两大国家...
01-21
21世纪经济报道记者 闫硕 北京报道2月11日,广州公共资源交易中心发布了《关于公布各批次集采中选药品合同签订和供应情况的通知》(简称“通...
02-13
  大众网记者 司心鹏 报道  12月24日至12月26日,第三届全国职业技能大赛化学实验室技术赛项山东省选拔赛在山东化工技师学院世界技能大赛化学实验室技术项目中国集训...
01-21
  今天我和华商童学会小记者一行50多人来到了浐灞公安局,亲自了解体验警察叔叔工作的一天。说到这里,我猜大家都想知道公安局里是什么样子,公安局都有什么工作内容、审讯犯...
01-21
  风控踩雷、治理“失序”、业绩承压,每一重危机都似一座大山,如何迎难而上,改善业绩,成为贵阳银...
01-22
  近年来蛋鸡养殖利润丰厚,养殖户积累了充裕的现金流,加上饲料价格走弱,蛋鸡养殖成本下降,现货价...
01-23
双子男是一个善于交际、机智聪明的星座,他们通常能够与人轻松相处并保持积极的态度。然...
01-22
天蝎男是一个神秘而深沉的星座,他们对爱情有着极高的要求和期待。在选择伴侣时,天蝎男会...
01-22
穿貂怎么搭配围巾图片欣赏?一、穿貂怎么搭配围巾图片欣赏?个人觉得貂皮本身就有厚重感,搭配围巾不是很适合,可以搭配轻质的丝巾。搭配如果艳丽一点可以选择正红色;肤色白的话可以...
02-17
小小模特的魅力:少儿泳装T台秀的精彩瞬间当阳光洒下,波光粼粼的泳池边,无疑是一次充满活力的少儿泳装T台走秀的最佳场域。想象一下,小朋友们穿着色彩斑斓的泳装,自信地走上T台,仿...
02-17
2月10日消息,携程商旅获得茶百道颁发的“2024年度优秀供应商”奖项。图源:公众号“携程商旅资讯号”据了解,作为国民级茶饮品牌,茶百道发源于“天府之国”,以“好茶为底,制造新鲜...
02-11
2月12日消息,苏宁易购将联合方太、老板、美的、博西等品牌启动春季厨卫家装节,持续助力以旧换新国补新政策。活动期间,苏宁易购将推出三重补贴至高立减40%,“免费检测、免费安装...
02-13
2月23日消息,美团发文称,为了应对特殊场景的配送需求、减轻骑手配送负荷,2016年起,美团开始探索自动配送服务。截至2024年底,美团无人机已开通53条航线,累计配送订单超45万单;自动...
02-24
2月27日消息,抖音生活服务举办“服务体验与治理开放日”,发布《2024抖音生活服务消费者权益保护年度报告》,公布了过去一年在消费者权益保障与生态治理方面的措施和阶段性成果...
03-01
岁月悠悠,转眼又是一年。回首2024,中国式现代化进程持续推进,高质量发展成为各行各业奋进的目标,时代巨变催促着各行各业加速转型。作为社会“稳定器”和经济“减震器”的保险业...
01-23
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
期待多时的RTX 5090/5080已经正式开卖,而国行对应的则是RTX 5090D。 作为国内特供版,RTX 5090D在硬件上与RTX 5090相似,拥有相同的核心数量和显存配置,甚至PCB设计...
02-03
韩国生活模拟游戏《inZOI》将于3月开放抢先体验版。游戏引入了独特元素,即角色死亡后可以作为幽灵出现,这一设定与《模拟人生4》市民死后世界相似。 近日inZOI...
02-13
距离除夕只剩几天,“回家”成为大街小巷最热门的话题。窗前的红灯笼、热闹的年货市场、街头巷尾的新春歌曲……处处洋溢着喜庆的氛围。“我恭喜你发财,我恭喜你精彩,最好的请过...
02-02
据新加坡《联合早报》网站2月4日报道,台湾女星大S(徐熙媛)春节期间因流感并发肺炎病逝,震惊岛内,台湾多地近日出现抢打疫苗潮。2月3日,《康熙来了》节目组发文称,小S(徐熙娣)证实大S(...
02-06
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮