灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

11个月前 来源:华夏晚报 观看:130

近日,Figure 发布的端到端 VLA 具身大模型  Helix,采用分层架构同时实现高频控制和高泛化能力,引起了业内广泛关注。几乎同期,中国具身智能团队灵初智能发布了基于强化学习的增强版分层架构端到端 VLA  模型 Psi R0.5,这距离灵初智能团队去年底发布的 Psi R0 仅 2 个月Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  本次发布的新模型重大升级,对于复杂场景的泛化性灵巧性CoT长程任务能力上均有显著提升,同时完成泛化抓取训练所需的数据量仅需  Helix 数据量的 0.4%!在全球范围内实现了泛化灵巧操作与训练效率的双重领先。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  此外,灵初智能团队连发四篇高质量论文,将团队在高效实现泛化抓取堆叠场景的物品检索利用外部环境配合抓取VLA  安全对齐方面的最新成果悉数公开,展现了中国团队在具身智能领域的强悍战斗力。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

1.pngJcf即热新闻——关注每天科技社会生活新变化gihot.com

Psi R0.5 路径演进图Jcf即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA仅需两小时灵巧手抓取数据Jcf即热新闻——关注每天科技社会生活新变化gihot.com

轻松实现物品、灯光、场景泛化并实现真正  CoTJcf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是首个用于灵巧手通用抓取的  VLA(Vision-Language-Action)框架,通过少量的训练,即刻在多变环境下智能涌现灵巧操作能力,能够像人类一样快速、准确地拾取各种物品。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是一个融合视觉,语言和动作的层次化框架:Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  · High-level  Planner:高层规划由预训练的大型视觉语言模型(VLM)实现,可理解多样化指令、自主决定抓取策略Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  · Low-level  Controller:低层扩散策略通过实时视觉反馈闭环掌握目标物体智能涌现出灵巧操作能力Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  整个框架的核心在于将多样化的图像输入数据通过现有的 Foundation Model 转换成 Domain-invariance  的表征,并端到端地训练下层控制模型。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

2.pngJcf即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA 框架图Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  从实验结果看,灵初智能仅使用了约 2 小时的灵巧手抓取数据(2094 条轨迹 × 3.5 秒 / 条 ÷ 60 秒  / 分钟 ÷ 60 分钟 / 小时 ≈ 2 小时),泛化到上千种不同物体,位置,堆叠,灯光,背景下成功抓取,而这个数据量仅仅是 Figure 的  0.4%数据利用效率提高 250 倍Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  同时,DexGraspVLA 相比现有方案还具有几项优势:Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  · 根据语言指令分辨出目标物体,处理堆叠场景下的目标物体的检索并抓取Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  · 抓取速度快(所有视频无加速,同类工作中节拍较快),闭环姿态矫正与重抓取能力(ReGrasp)Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  · 大脑具有 CoT 长程推理能力自主推理抓取顺序并将所有物体依次抓取Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  展现出对光照变化背景干扰和物体姿态的强大鲁棒性和泛化性,让机器人的灵巧抓取达到人类级别。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  基于预训练的大模型:使用自然语言与人类交互,具有高智能的长程推理能力,能够自主理解人类话语并推理任务。因此可以一次设定多个抓取目标,通过 CoT  实现复杂流程下的自动分拣或清理。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  仍然会自动分析当前姿态偏差,通过细微调整腕关节和手部角度重新尝试抓取实现非常鲁棒且高效的抓取能力达到极强的泛化能力Jcf即热新闻——关注每天科技社会生活新变化gihot.com

3.pngJcf即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval DexterityJcf即热新闻——关注每天科技社会生活新变化gihot.com

堆叠场景中的高效物体检索策略Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习底层驱动,简单 reward 涌现复杂动作Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  在大多数实际场景中,物品往往以无规则、堆叠的方式摆放。传统方法要求机器人逐件搬开遮挡物,不仅耗时,还对机器人自身抓取能力提出了很高的要求。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  为了解决这一难题,灵初智能开发了一套基于强化学习的物体检索策略 ——Retrieval  Dexterity,解决了堆叠场景中物体检索识别效率低的问题。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  Retrieval Dexterity  系统中未用真机数据,灵初团队没有采用真机数据进行训练而是直接在仿真环境中通过强化学习进行训练。通过在仿真环境中大规模生成复杂的堆叠场景,训练模型直至涌现出合适的检索操作,随后再将这些操作零样本迁移至现实机器人和复杂环境中。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

4.pngJcf即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval Dexterity 框架图Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  从杂乱堆叠物体中快速取出目标物体Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  在超过 10 种不同形状、大小的生活物品测试中,Retrieval Dexterity  展现出了优秀的性能,不仅能够高效完成训练过的物体的检索任务还能将检索能力泛化到未见过的新物体上Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  效率对比传统方法提升明显Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  与人为设定的动作相比,Retrieval Dexterity 在所有场景中平均减少了 38%  的操作步骤与模拟的 “将所有物体抓起来并放开” 相比,该方法更是平均减少了 90%  的步骤数量。这种效率提升主要得益于多指灵巧手能够直接与遮挡物进行交互,并随时移动它们,而不需要逐个移除。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

5.pngJcf即热新闻——关注每天科技社会生活新变化gihot.com

ExDex:借力外部环境Jcf即热新闻——关注每天科技社会生活新变化gihot.com

抓取 “不可能” 物体Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  外部灵巧性解决物品超过机器人末端执行器的最大开度问题Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  当物体的底面尺寸超过机器人末端执行器的最大开度时,传统方法往往无法直接对物体进行抓取,这种情况在商场等商业场景尤为常见。为了解决这一难题,灵初智能推出了  ExDex—— 一种基于外部灵巧性(extrinsic dexterity)抓取的创新解决方案Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  ExDex 能够利用环境特征进行非夹持式操作,凭借多指灵巧手的灵活性和操作能力,实现更丰富的环境交互。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习带来超越人类遥操作水平的灵巧操作Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  通过强化学习,ExDex  涌现出自主制定策略的能力,借助周围环境抓取那些无法直接抓取的物体。例如,机器人可以将物体先推到桌面边缘或墙体边缘,再利用这些环境特征完成抓取任务。这种操作通过传统的遥操作方式几乎无法实现,充分体现了强化学习的强大优势。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  在对数十种不同家居物品的大量实验中,ExDex  验证了其优越的性能和对新物体的泛化能力并成功将仿真训练的策略无缝迁移到真实机器人中,实现了从仿真到现实的高效过渡。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA:人机安全交互的 “守护神”Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  当下,具身智能机器人频繁出圈,从春晚跳舞的 Unitree  人形机器人,到波兰街头遛机器狗的新奇场景,让人看到人机交互的无限可能,但安全问题也不容忽视。视觉 - 语言 -  行动模型(VLAs)在革新机器人技术时,也藏着安全隐患。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

6.pngJcf即热新闻——关注每天科技社会生活新变化gihot.com

 左图呈现了传统 VLA 模型在抓取任务中的三种典型不安全行为:1)对无关物体的严重损坏,2)目标识别错误导致危险物体的误用,以及  3)执行指令时与危险物体发生交互。右图通过导航路径示例,进一步展示了传统 VLA 在导航过程中的三种不安全行为Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  本周,北京大学 PAIR - Lab 团队携手灵初智能重磅推出了具身安全模型  SafeVLA,通过安全对齐,让机器人在复杂场景安全高效执行任务,在对抗干扰场景中鲁棒性极高Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  SafeVLA 把 “以人为本” 刻进  DNA,不像传统机器人只盯着任务完成它把人类安全放在首位。技术上,引入约束马尔可夫决策过程(CMDP)范式,把现实安全约束融入仿真环境大规模采样。SafeVLA  在安全性和任务执行方面均取得突破性进展分别提升 83.58% 和  3.85%充分证明了其在平衡安全与效率方面的卓越能力Jcf即热新闻——关注每天科技社会生活新变化gihot.com

11.gifJcf即热新闻——关注每天科技社会生活新变化gihot.com

传统 VLA 模型完成任务过程中的高危行为Jcf即热新闻——关注每天科技社会生活新变化gihot.com

  团队开发全新仿真环境 Safety -  CHORES集成安全约束功能支持用户自定义规则代码还完全开源直接给全球研究者和开发者送福利。而且,SafeVLA  在 12 个分布外(OOD)实验里,面对光照、材质变化和复杂环境扰动,始终稳定发挥,实力碾压其他模型。Jcf即热新闻——关注每天科技社会生活新变化gihot.com

22.gifJcf即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA 在正常测试集和 OOD 测试集上的比较,其在 OOD 环境下依然保持良好安全性和表现Jcf即热新闻——关注每天科技社会生活新变化gihot.com


Jcf即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-14-7388-0.html灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:企业智能化升级关键:DeepSeek大模型技术与应用论坛来了!

下一篇:赛力斯申请注册问界智享商标

为你推荐
在最新一期的 PC Gamer 杂志中,《艾尔登法环:黑夜君临》总监石崎淳也接受了采访,并再次重申新作的肉鸽玩法是为了浓缩游戏的体验,并明确表示这不是为了“跟风”。 ...
02-04
《逃离塔科夫》开发商 Battlestate Gaems 近日在社交媒体上确认,团队正在开发游戏的 DLSS 4 支持。 开发商写道:“我们正关注社区对DLSS 4 日益增长的兴趣。我...
02-13
极目新闻记者 詹钘通讯员 潘庆芳 周皓2月4日,极目新闻记者从湖北省春运办了解到,春运前20天,该省全社会跨区域人员流动量累计3.07亿人次,占比达到全国的十六分之一。春运以来,省...
02-04
近期,国家安全机关第一时间侦破一起重要涉密人员主动投靠境外间谍情报机关的重大间谍案件,及时制止卖密行为,有力维护了国家安全。潜滋暗长生邪念韩某某,案发前在某重要涉密单位...
02-07
“三国是一个好IP。”在当下中国的游戏市场上,以《西游记》《三国演义》等四大名著为内容IP而衍生开发的游戏,仍然在头部产品中占据...
01-21
近日,两家独角兽的朋友圈“论战”在近期引起了多方关注。争议缘起于一张影石创始人怒喷友商的截图。在微信朋友圈界面中,显示为“刘...
01-21
  今天(1月24日)至27日,今年首场寒潮天气过程继续影响我国,中东部大部地区将陆续出现雨雪天气,西北...
01-24
  中央气象台2月16日18时继续发布大风蓝色预警:  预计,2月16日20时至17日20时,内蒙古中东部、辽宁、吉...
02-17
  自提外带、年夜饭礼盒成新宠,小型套餐受青睐——  蛇年年夜饭有哪些新风向?  春节临近,多地年夜饭市场“热气腾腾”,各具特色的年夜饭套餐陆续推出。某线上平台数据...
01-21
  中新经纬1月17日电 (魏薇)“到2025年,百货行业将更加注重数字化、智能化和绿色可持续发展。物流和供应链将继续整合,智能技术在商业运营中的应用也将扩大。” 近日,希腊华...
01-21
1 月 22 日消息,小米汽车今日宣布,SU7 智能双表盘小年彩蛋表情现已上线,用户可以通过喊“小爱同学放烟花”,让相应表盘放烟花。据悉,相关智能双表盘固件需要在 1.0.2-004...
01-23
2 月 4 日消息,从小米汽车获悉,2 月 5 日起,小米 SU7 Ultra 将在全国 42 城 112 店正式开放静态品鉴。全新专属产品专家“Ultra Master”将与用户联系,安排、服务品鉴。...
02-04
最近播出的电视剧《夫人为何如此无情》受到了很多人的喜爱,热度持续上升。这部剧不仅因为其扣人心弦的情节吸引观众,还因其丰富的剧情讨论点成为了大众关注的...
02-20
最近热播的《怎敌她千娇百媚》受到许多观众的喜爱,大家不仅追剧上瘾,还对剧情和人物充满好奇。第15集的分集剧情介绍成为热议话题。陆昀与常宜王相约衡阳王至...
02-22
21世纪经济报道记者 唐唯珂 广州报道“一到冬天就食欲大增,公司年会将近,想到要穿晚礼服就头大……现在打完一周之后,体重从76.6公斤掉到了74...
01-29
21世纪经济报道记者林昀肖 北京报道 近日,全国中成药联合采购办公室发布第三批全国中成药采购联盟集中采购中选结果。此次中成药集采由湖...
02-13
  大众网记者 司心鹏 报道  在12月13日至16日举办的第十七届山东省职业院校技能大赛(高职组)体育活动设计与实施赛项中,菏泽医学专科学校公共教学部体育教研室指导的参...
01-21
  作者:骆郁廷(湖北省中国特色社会主义理论体系研究中心研究员,武汉大学思想政治教育研究院院长)  习近...
01-22
  摘要  【证监会重磅!13处提及期货解读来了】《关于资本市场做好金融“五篇大文章”的实施...
02-08
  本报记者 冷翠华  见习记者 杨笑寒   截至2月13日,已有135家险企(不含再保险公司)披露了20...
02-14
金牛座的男生通常被认为是稳重、务实和可靠的代表。他们在感情中也是如此,对于选择伴侣...
01-22
每个人都有自己的审美观和喜好,摩羯男也不例外。他们对女生的打扮有着独特的偏好,下面就...
01-22
SQL Error: select * from ***_ecms_news10 where id in(270,) limit 2
2月14日消息,苏宁易购与美的召开2025年度战略合作会议,加力投入以旧换新。锚定年度200亿战略目标,双方将深化联合创新、服务体验、终端运营等方面合作,上新超70款新品。抢滩春季...
02-15
2月16日消息,苏宁易购零售云携手海尔,于2月13日-14日期间,在济南、福州、成都三地举办“穿越云海,共赢未来”春季冰洗旺销启动会。在以旧换新国补的带动下,双方将通过丰富产品布...
02-17
2025年家电购新补贴延续,对于家电消费市场而言可谓喜闻乐见。一方面,消费者能够用更优惠的价格添置高品质的新家电;另一方面,厂商能够...
02-07
史玉东有两重身份,他是全国人大代表,也是蒙牛集团全球研发创新中心研发总监。 来自乳业研发一线的身份,让他对行业有更深刻的了解。...
03-05
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮