灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

5个月前 来源:华夏晚报 观看:78

近日,Figure 发布的端到端 VLA 具身大模型  Helix,采用分层架构同时实现高频控制和高泛化能力,引起了业内广泛关注。几乎同期,中国具身智能团队灵初智能发布了基于强化学习的增强版分层架构端到端 VLA  模型 Psi R0.5,这距离灵初智能团队去年底发布的 Psi R0 仅 2 个月Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  本次发布的新模型重大升级,对于复杂场景的泛化性灵巧性CoT长程任务能力上均有显著提升,同时完成泛化抓取训练所需的数据量仅需  Helix 数据量的 0.4%!在全球范围内实现了泛化灵巧操作与训练效率的双重领先。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  此外,灵初智能团队连发四篇高质量论文,将团队在高效实现泛化抓取堆叠场景的物品检索利用外部环境配合抓取VLA  安全对齐方面的最新成果悉数公开,展现了中国团队在具身智能领域的强悍战斗力。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

1.pngXl4即热新闻——关注每天科技社会生活新变化gihot.com

Psi R0.5 路径演进图Xl4即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA仅需两小时灵巧手抓取数据Xl4即热新闻——关注每天科技社会生活新变化gihot.com

轻松实现物品、灯光、场景泛化并实现真正  CoTXl4即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是首个用于灵巧手通用抓取的  VLA(Vision-Language-Action)框架,通过少量的训练,即刻在多变环境下智能涌现灵巧操作能力,能够像人类一样快速、准确地拾取各种物品。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是一个融合视觉,语言和动作的层次化框架:Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  · High-level  Planner:高层规划由预训练的大型视觉语言模型(VLM)实现,可理解多样化指令、自主决定抓取策略Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  · Low-level  Controller:低层扩散策略通过实时视觉反馈闭环掌握目标物体智能涌现出灵巧操作能力Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  整个框架的核心在于将多样化的图像输入数据通过现有的 Foundation Model 转换成 Domain-invariance  的表征,并端到端地训练下层控制模型。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

2.pngXl4即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA 框架图Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  从实验结果看,灵初智能仅使用了约 2 小时的灵巧手抓取数据(2094 条轨迹 × 3.5 秒 / 条 ÷ 60 秒  / 分钟 ÷ 60 分钟 / 小时 ≈ 2 小时),泛化到上千种不同物体,位置,堆叠,灯光,背景下成功抓取,而这个数据量仅仅是 Figure 的  0.4%数据利用效率提高 250 倍Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  同时,DexGraspVLA 相比现有方案还具有几项优势:Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  · 根据语言指令分辨出目标物体,处理堆叠场景下的目标物体的检索并抓取Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  · 抓取速度快(所有视频无加速,同类工作中节拍较快),闭环姿态矫正与重抓取能力(ReGrasp)Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  · 大脑具有 CoT 长程推理能力自主推理抓取顺序并将所有物体依次抓取Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  展现出对光照变化背景干扰和物体姿态的强大鲁棒性和泛化性,让机器人的灵巧抓取达到人类级别。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  基于预训练的大模型:使用自然语言与人类交互,具有高智能的长程推理能力,能够自主理解人类话语并推理任务。因此可以一次设定多个抓取目标,通过 CoT  实现复杂流程下的自动分拣或清理。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  仍然会自动分析当前姿态偏差,通过细微调整腕关节和手部角度重新尝试抓取实现非常鲁棒且高效的抓取能力达到极强的泛化能力Xl4即热新闻——关注每天科技社会生活新变化gihot.com

3.pngXl4即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval DexterityXl4即热新闻——关注每天科技社会生活新变化gihot.com

堆叠场景中的高效物体检索策略Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习底层驱动,简单 reward 涌现复杂动作Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  在大多数实际场景中,物品往往以无规则、堆叠的方式摆放。传统方法要求机器人逐件搬开遮挡物,不仅耗时,还对机器人自身抓取能力提出了很高的要求。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  为了解决这一难题,灵初智能开发了一套基于强化学习的物体检索策略 ——Retrieval  Dexterity,解决了堆叠场景中物体检索识别效率低的问题。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  Retrieval Dexterity  系统中未用真机数据,灵初团队没有采用真机数据进行训练而是直接在仿真环境中通过强化学习进行训练。通过在仿真环境中大规模生成复杂的堆叠场景,训练模型直至涌现出合适的检索操作,随后再将这些操作零样本迁移至现实机器人和复杂环境中。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

4.pngXl4即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval Dexterity 框架图Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  从杂乱堆叠物体中快速取出目标物体Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  在超过 10 种不同形状、大小的生活物品测试中,Retrieval Dexterity  展现出了优秀的性能,不仅能够高效完成训练过的物体的检索任务还能将检索能力泛化到未见过的新物体上Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  效率对比传统方法提升明显Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  与人为设定的动作相比,Retrieval Dexterity 在所有场景中平均减少了 38%  的操作步骤与模拟的 “将所有物体抓起来并放开” 相比,该方法更是平均减少了 90%  的步骤数量。这种效率提升主要得益于多指灵巧手能够直接与遮挡物进行交互,并随时移动它们,而不需要逐个移除。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

5.pngXl4即热新闻——关注每天科技社会生活新变化gihot.com

ExDex:借力外部环境Xl4即热新闻——关注每天科技社会生活新变化gihot.com

抓取 “不可能” 物体Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  外部灵巧性解决物品超过机器人末端执行器的最大开度问题Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  当物体的底面尺寸超过机器人末端执行器的最大开度时,传统方法往往无法直接对物体进行抓取,这种情况在商场等商业场景尤为常见。为了解决这一难题,灵初智能推出了  ExDex—— 一种基于外部灵巧性(extrinsic dexterity)抓取的创新解决方案Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  ExDex 能够利用环境特征进行非夹持式操作,凭借多指灵巧手的灵活性和操作能力,实现更丰富的环境交互。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习带来超越人类遥操作水平的灵巧操作Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  通过强化学习,ExDex  涌现出自主制定策略的能力,借助周围环境抓取那些无法直接抓取的物体。例如,机器人可以将物体先推到桌面边缘或墙体边缘,再利用这些环境特征完成抓取任务。这种操作通过传统的遥操作方式几乎无法实现,充分体现了强化学习的强大优势。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  在对数十种不同家居物品的大量实验中,ExDex  验证了其优越的性能和对新物体的泛化能力并成功将仿真训练的策略无缝迁移到真实机器人中,实现了从仿真到现实的高效过渡。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA:人机安全交互的 “守护神”Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  当下,具身智能机器人频繁出圈,从春晚跳舞的 Unitree  人形机器人,到波兰街头遛机器狗的新奇场景,让人看到人机交互的无限可能,但安全问题也不容忽视。视觉 - 语言 -  行动模型(VLAs)在革新机器人技术时,也藏着安全隐患。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

6.pngXl4即热新闻——关注每天科技社会生活新变化gihot.com

 左图呈现了传统 VLA 模型在抓取任务中的三种典型不安全行为:1)对无关物体的严重损坏,2)目标识别错误导致危险物体的误用,以及  3)执行指令时与危险物体发生交互。右图通过导航路径示例,进一步展示了传统 VLA 在导航过程中的三种不安全行为Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  本周,北京大学 PAIR - Lab 团队携手灵初智能重磅推出了具身安全模型  SafeVLA,通过安全对齐,让机器人在复杂场景安全高效执行任务,在对抗干扰场景中鲁棒性极高Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  SafeVLA 把 “以人为本” 刻进  DNA,不像传统机器人只盯着任务完成它把人类安全放在首位。技术上,引入约束马尔可夫决策过程(CMDP)范式,把现实安全约束融入仿真环境大规模采样。SafeVLA  在安全性和任务执行方面均取得突破性进展分别提升 83.58% 和  3.85%充分证明了其在平衡安全与效率方面的卓越能力Xl4即热新闻——关注每天科技社会生活新变化gihot.com

11.gifXl4即热新闻——关注每天科技社会生活新变化gihot.com

传统 VLA 模型完成任务过程中的高危行为Xl4即热新闻——关注每天科技社会生活新变化gihot.com

  团队开发全新仿真环境 Safety -  CHORES集成安全约束功能支持用户自定义规则代码还完全开源直接给全球研究者和开发者送福利。而且,SafeVLA  在 12 个分布外(OOD)实验里,面对光照、材质变化和复杂环境扰动,始终稳定发挥,实力碾压其他模型。Xl4即热新闻——关注每天科技社会生活新变化gihot.com

22.gifXl4即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA 在正常测试集和 OOD 测试集上的比较,其在 OOD 环境下依然保持良好安全性和表现Xl4即热新闻——关注每天科技社会生活新变化gihot.com


Xl4即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-14-7388-0.html灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:企业智能化升级关键:DeepSeek大模型技术与应用论坛来了!

下一篇:赛力斯申请注册问界智享商标

为你推荐
如今各种新时代类型诈骗层出不穷,日前BBC分享了一则经典诈骗案例,提醒广大民众注意,而且不仅仅是英国,估计全世界都已经被波及了。 ·据悉,一位70岁老太太去医院,...
02-04
随着Blackwell架构、RTX 50系列显卡的推出,NVIDIA发布了一系列新技术,比如说RTX神经渲染纹理压缩(NTC),现在终于第一次看到了关于它的测试,可以节省多达96%的显存...
02-12
“海上神器展锋芒,油气开发创辉煌”。今天说的神器就是中国制造的亚洲首艘圆筒型浮式生产储卸油装置(FPSO)——“海葵一号”。《渔舟唱晚》在民族音乐里可谓是鼎鼎有名。音乐一...
02-03
来自2025年综合运输春运工作专班数据显示,2025年2月4日(春运第22日,农历正月初七),全社会跨区域人员流动量预计34611万人次。其中,铁路客运量1690万人次,公路人员流动量32556万人次...
02-04
1月15日,记者从中国科学院大连化学物理研究所获悉,该所动力电池与系统研究中心主任陈忠伟团队与双登集团近日对外联合发布了最新一代智能电池管理系...
01-21
“五、四、三、二、一,亮灯!”随着现场倒计时结束,流光溢彩的秦淮花灯在南京秦淮河畔渐次点亮,百余架无人机吊着孔明灯同时升空,向着秦淮河上空飞去。这...
01-23
  春节前夕,热闹的气息扑面而来。  葫芦岛市绥中县袁家屯村的蔬菜大棚里,村民袁殿学一早就摘下一筐筐...
01-23
图为在中欧班列(沈阳)集结中心,电梯零部件、汽车等货物正在装车。记者 杨靖岫 摄  2月8日,记者从沈阳海关...
02-09
  春节临近,随着打工人年终奖的陆续到账,一场年味儿十足的年终奖“理财档”也迅速拉开序幕。近日,记者走访发现,各大银行瞄准市民年终奖投资需求,纷纷推出新春专属理财新品,...
01-22
  史上最快!春节档爆了,这部电影强势领跑   中国基金报记者 安曼  顶级IP“神仙打架”,2025年春节档时间未到,但是票房已经爆了!  据灯塔专业版显示,2025年春节档今日开启...
01-21
春运大幕已经拉开,一汽-大众敏锐发现不少客户仍有买不到票,回家难的需求,暖心发起公益回家之旅活动,号召全国经销商,为大家筹备安心“顺风车”,致力于让每一位归心似箭的人,都能无...
01-27
1 月 27 日消息,据《读卖新闻》今日报道,日本经济产业省计划从今年 4 月起提高对电动汽车等环保车辆购车者的补贴。对采用了低碳钢材(绿色钢铁)作为车身的车型,补贴金额...
01-28
《难哄》穆承允是一个什么角色?在《难哄》中,穆承允是一个男四号的配角。外在形象:长相俊秀,五官偏柔,有点男生女相,但身材高挑且强壮,整体给人一种清隽明朗的感觉...
02-19
《余烬之上》廖知白是凶手吗?廖知白最后结局是什么?在《余烬之上》中,廖知白不能被简单认定为凶手。从主观动机与行为目的看:廖知白经历家庭惨变后,一心追求真相...
02-21
1月22日,国家卫健委、国家中医药局联合发布《流行性感冒诊疗方案(2025年版)》,新增玛巴洛沙韦、法维拉韦两种抗流感病毒药物,并明确不建议联合...
01-23
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局药审中心回应个别品种数据重复,系...
01-27
  大众网记者 司心鹏 通讯员 薛现伟 康宁 报道  12月8日,山东省职业院校技能大赛(高职组)“应用软件系统开发”赛项在山东工业职业学院举行,全省共57个参赛队,经过紧张角...
01-21
作者:张宝歌(宁波大学教师教育学院院长、东海研究院教授)近年来,学生评教制度已逐步成为各高校提升课堂教学...
01-22
  本报记者 刘琪  1月24日,国家金融监督管理总局(以下简称“国家金融监管总局”)发布消息,为进...
01-28
  摘要  【“双焦”重挫,向下空间有多大?】前期利多预期兑现后,交易逻辑再次回归基本面,预计短...
02-06
水瓶座男生以其独特的思维方式和开放的个性而闻名。他们喜欢追求自由和创新,对于传统观...
01-22
天蝎座男生是十二星座中最神秘、深沉的一种类型,他们对感情非常认真,一旦喜欢上一个人,会...
01-22
橙色裙子怎么搭配图片欣赏?一、橙色裙子怎么搭配图片欣赏?浅橙色与白色搭配  浅橙色是橙色中加入了较多的白色,给人一种甜腻腻的感觉。与白色搭配,清新亮丽,美丽脱俗。更有阳光...
02-12
揭开女明星内务:这背后的秘密与挑战当我们谈论女明星时,通常脑海中浮现的是华丽的红毯、璀璨的灯光,以及她们令人艳羡的生活。但在这些光鲜外表之下,她们的内务生活又是怎样的呢...
02-12
1月27日消息,云汉芯城凭借卓越的线上分销能力和创新的数字化服务,获得WAGO万可颁发的“2024最佳线上分销渠道奖”。图源:云汉芯城公众号据介绍,WAGO万可于1951年成立于德国,是一...
02-07
2月14日消息,哈萨克斯坦Dong Neng公司董事长贾小亮日前到访国联股份新疆数字经济总部,涂多多高级副总裁、跨境产发部总经理邵春生代表公司热情接待来访人员,双方基于前期交流,签...
02-15
2月11日消息,“市象”公众号发文称,美团内部正在进行一场AI“大跃进”。有美团内部员工透露,今年年初定的大OP(目标计划)就是四个All in,分别是海外市场、下沉市场、无人机、AI。...
02-13
在当今数字化时代,直播行业蓬勃发展,直播带货已成为一种重要的营销方式。然而,在这看似繁华的背后,却隐藏着诸多问题。部分主播为了追...
03-09
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
2024年12月31日,陕西兴燃科技有限公司(简称“兴燃科技”)完成近亿元战略融资,本次融资由陕西盈峰势乘绿色能源产业投资基金领投,西安天泓高端装备基金...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮