灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

7个月前 来源:华夏晚报 观看:99

近日,Figure 发布的端到端 VLA 具身大模型  Helix,采用分层架构同时实现高频控制和高泛化能力,引起了业内广泛关注。几乎同期,中国具身智能团队灵初智能发布了基于强化学习的增强版分层架构端到端 VLA  模型 Psi R0.5,这距离灵初智能团队去年底发布的 Psi R0 仅 2 个月DKg即热新闻——关注每天科技社会生活新变化gihot.com

  本次发布的新模型重大升级,对于复杂场景的泛化性灵巧性CoT长程任务能力上均有显著提升,同时完成泛化抓取训练所需的数据量仅需  Helix 数据量的 0.4%!在全球范围内实现了泛化灵巧操作与训练效率的双重领先。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  此外,灵初智能团队连发四篇高质量论文,将团队在高效实现泛化抓取堆叠场景的物品检索利用外部环境配合抓取VLA  安全对齐方面的最新成果悉数公开,展现了中国团队在具身智能领域的强悍战斗力。DKg即热新闻——关注每天科技社会生活新变化gihot.com

1.pngDKg即热新闻——关注每天科技社会生活新变化gihot.com

Psi R0.5 路径演进图DKg即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA仅需两小时灵巧手抓取数据DKg即热新闻——关注每天科技社会生活新变化gihot.com

轻松实现物品、灯光、场景泛化并实现真正  CoTDKg即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是首个用于灵巧手通用抓取的  VLA(Vision-Language-Action)框架,通过少量的训练,即刻在多变环境下智能涌现灵巧操作能力,能够像人类一样快速、准确地拾取各种物品。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是一个融合视觉,语言和动作的层次化框架:DKg即热新闻——关注每天科技社会生活新变化gihot.com

  · High-level  Planner:高层规划由预训练的大型视觉语言模型(VLM)实现,可理解多样化指令、自主决定抓取策略DKg即热新闻——关注每天科技社会生活新变化gihot.com

  · Low-level  Controller:低层扩散策略通过实时视觉反馈闭环掌握目标物体智能涌现出灵巧操作能力DKg即热新闻——关注每天科技社会生活新变化gihot.com

  整个框架的核心在于将多样化的图像输入数据通过现有的 Foundation Model 转换成 Domain-invariance  的表征,并端到端地训练下层控制模型。DKg即热新闻——关注每天科技社会生活新变化gihot.com

2.pngDKg即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA 框架图DKg即热新闻——关注每天科技社会生活新变化gihot.com

  从实验结果看,灵初智能仅使用了约 2 小时的灵巧手抓取数据(2094 条轨迹 × 3.5 秒 / 条 ÷ 60 秒  / 分钟 ÷ 60 分钟 / 小时 ≈ 2 小时),泛化到上千种不同物体,位置,堆叠,灯光,背景下成功抓取,而这个数据量仅仅是 Figure 的  0.4%数据利用效率提高 250 倍DKg即热新闻——关注每天科技社会生活新变化gihot.com

  同时,DexGraspVLA 相比现有方案还具有几项优势:DKg即热新闻——关注每天科技社会生活新变化gihot.com

  · 根据语言指令分辨出目标物体,处理堆叠场景下的目标物体的检索并抓取DKg即热新闻——关注每天科技社会生活新变化gihot.com

  · 抓取速度快(所有视频无加速,同类工作中节拍较快),闭环姿态矫正与重抓取能力(ReGrasp)DKg即热新闻——关注每天科技社会生活新变化gihot.com

  · 大脑具有 CoT 长程推理能力自主推理抓取顺序并将所有物体依次抓取DKg即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  展现出对光照变化背景干扰和物体姿态的强大鲁棒性和泛化性,让机器人的灵巧抓取达到人类级别。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  基于预训练的大模型:使用自然语言与人类交互,具有高智能的长程推理能力,能够自主理解人类话语并推理任务。因此可以一次设定多个抓取目标,通过 CoT  实现复杂流程下的自动分拣或清理。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  仍然会自动分析当前姿态偏差,通过细微调整腕关节和手部角度重新尝试抓取实现非常鲁棒且高效的抓取能力达到极强的泛化能力DKg即热新闻——关注每天科技社会生活新变化gihot.com

3.pngDKg即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval DexterityDKg即热新闻——关注每天科技社会生活新变化gihot.com

堆叠场景中的高效物体检索策略DKg即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习底层驱动,简单 reward 涌现复杂动作DKg即热新闻——关注每天科技社会生活新变化gihot.com

  在大多数实际场景中,物品往往以无规则、堆叠的方式摆放。传统方法要求机器人逐件搬开遮挡物,不仅耗时,还对机器人自身抓取能力提出了很高的要求。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  为了解决这一难题,灵初智能开发了一套基于强化学习的物体检索策略 ——Retrieval  Dexterity,解决了堆叠场景中物体检索识别效率低的问题。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  Retrieval Dexterity  系统中未用真机数据,灵初团队没有采用真机数据进行训练而是直接在仿真环境中通过强化学习进行训练。通过在仿真环境中大规模生成复杂的堆叠场景,训练模型直至涌现出合适的检索操作,随后再将这些操作零样本迁移至现实机器人和复杂环境中。DKg即热新闻——关注每天科技社会生活新变化gihot.com

4.pngDKg即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval Dexterity 框架图DKg即热新闻——关注每天科技社会生活新变化gihot.com

  从杂乱堆叠物体中快速取出目标物体DKg即热新闻——关注每天科技社会生活新变化gihot.com

  在超过 10 种不同形状、大小的生活物品测试中,Retrieval Dexterity  展现出了优秀的性能,不仅能够高效完成训练过的物体的检索任务还能将检索能力泛化到未见过的新物体上DKg即热新闻——关注每天科技社会生活新变化gihot.com

  效率对比传统方法提升明显DKg即热新闻——关注每天科技社会生活新变化gihot.com

  与人为设定的动作相比,Retrieval Dexterity 在所有场景中平均减少了 38%  的操作步骤与模拟的 “将所有物体抓起来并放开” 相比,该方法更是平均减少了 90%  的步骤数量。这种效率提升主要得益于多指灵巧手能够直接与遮挡物进行交互,并随时移动它们,而不需要逐个移除。DKg即热新闻——关注每天科技社会生活新变化gihot.com

5.pngDKg即热新闻——关注每天科技社会生活新变化gihot.com

ExDex:借力外部环境DKg即热新闻——关注每天科技社会生活新变化gihot.com

抓取 “不可能” 物体DKg即热新闻——关注每天科技社会生活新变化gihot.com

  外部灵巧性解决物品超过机器人末端执行器的最大开度问题DKg即热新闻——关注每天科技社会生活新变化gihot.com

  当物体的底面尺寸超过机器人末端执行器的最大开度时,传统方法往往无法直接对物体进行抓取,这种情况在商场等商业场景尤为常见。为了解决这一难题,灵初智能推出了  ExDex—— 一种基于外部灵巧性(extrinsic dexterity)抓取的创新解决方案DKg即热新闻——关注每天科技社会生活新变化gihot.com

  ExDex 能够利用环境特征进行非夹持式操作,凭借多指灵巧手的灵活性和操作能力,实现更丰富的环境交互。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习带来超越人类遥操作水平的灵巧操作DKg即热新闻——关注每天科技社会生活新变化gihot.com

  通过强化学习,ExDex  涌现出自主制定策略的能力,借助周围环境抓取那些无法直接抓取的物体。例如,机器人可以将物体先推到桌面边缘或墙体边缘,再利用这些环境特征完成抓取任务。这种操作通过传统的遥操作方式几乎无法实现,充分体现了强化学习的强大优势。DKg即热新闻——关注每天科技社会生活新变化gihot.com

  在对数十种不同家居物品的大量实验中,ExDex  验证了其优越的性能和对新物体的泛化能力并成功将仿真训练的策略无缝迁移到真实机器人中,实现了从仿真到现实的高效过渡。DKg即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA:人机安全交互的 “守护神”DKg即热新闻——关注每天科技社会生活新变化gihot.com

  当下,具身智能机器人频繁出圈,从春晚跳舞的 Unitree  人形机器人,到波兰街头遛机器狗的新奇场景,让人看到人机交互的无限可能,但安全问题也不容忽视。视觉 - 语言 -  行动模型(VLAs)在革新机器人技术时,也藏着安全隐患。DKg即热新闻——关注每天科技社会生活新变化gihot.com

6.pngDKg即热新闻——关注每天科技社会生活新变化gihot.com

 左图呈现了传统 VLA 模型在抓取任务中的三种典型不安全行为:1)对无关物体的严重损坏,2)目标识别错误导致危险物体的误用,以及  3)执行指令时与危险物体发生交互。右图通过导航路径示例,进一步展示了传统 VLA 在导航过程中的三种不安全行为DKg即热新闻——关注每天科技社会生活新变化gihot.com

  本周,北京大学 PAIR - Lab 团队携手灵初智能重磅推出了具身安全模型  SafeVLA,通过安全对齐,让机器人在复杂场景安全高效执行任务,在对抗干扰场景中鲁棒性极高DKg即热新闻——关注每天科技社会生活新变化gihot.com

  SafeVLA 把 “以人为本” 刻进  DNA,不像传统机器人只盯着任务完成它把人类安全放在首位。技术上,引入约束马尔可夫决策过程(CMDP)范式,把现实安全约束融入仿真环境大规模采样。SafeVLA  在安全性和任务执行方面均取得突破性进展分别提升 83.58% 和  3.85%充分证明了其在平衡安全与效率方面的卓越能力DKg即热新闻——关注每天科技社会生活新变化gihot.com

11.gifDKg即热新闻——关注每天科技社会生活新变化gihot.com

传统 VLA 模型完成任务过程中的高危行为DKg即热新闻——关注每天科技社会生活新变化gihot.com

  团队开发全新仿真环境 Safety -  CHORES集成安全约束功能支持用户自定义规则代码还完全开源直接给全球研究者和开发者送福利。而且,SafeVLA  在 12 个分布外(OOD)实验里,面对光照、材质变化和复杂环境扰动,始终稳定发挥,实力碾压其他模型。DKg即热新闻——关注每天科技社会生活新变化gihot.com

22.gifDKg即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA 在正常测试集和 OOD 测试集上的比较,其在 OOD 环境下依然保持良好安全性和表现DKg即热新闻——关注每天科技社会生活新变化gihot.com


DKg即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-14-7388-0.html灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:企业智能化升级关键:DeepSeek大模型技术与应用论坛来了!

下一篇:赛力斯申请注册问界智享商标

为你推荐
近日《和平精英》官方公布了全新系列角色“赛博古神”,1月28日正式上线。官方还发布了角色预告和皮肤展示图,一起来欣赏下吧! 角色预告: 官方介绍称,浩瀚的历史长...
01-29
今日(2月11日),类银河战士恶魔城游戏《Haydee 3》Steam页面开放,2025年3月1日发售,暂不支持中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《Haydee II...
02-11
过去一年,鹊桥二号绕月搭桥,助力嫦娥六号实现了人类首次月球背面采样返回。随着嫦娥六号任务的圆满完成,嫦娥七号任务也已经被提上日程。按照计划,我国将在2026年发射嫦娥七号月...
02-03
极目新闻记者 谢茂 邓波2月8日,四川宜宾市筠连县沐爱镇金坪村发生山体滑坡,导致10户民房、1户生产用房被掩埋,目前有1人遇难,28人失联。一方有难,八方支援。受灾区域周边村镇的热...
02-09
记者1月18日从中国铁建股份有限公司了解到,由中铁十七局承建的雄商高铁全线控制性工程建设取得新进展,雄商高铁阳谷特大桥跨三干渠连续梁顺利合龙。...
01-21
1月10日,《2024中国大学、央企、城市海外网络传播力建设系列报告》发布会在北京师范大学举办。记者在会上了解到,2024年,我国部分中央企业通过将大语...
01-24
  2月4日,春节假期即将落下帷幕。在线旅游平台飞猪发布的《2025年春节假期出游快报》显示,“追着非遗过...
02-05
  中国自然资源部北海区海洋预报台6日发布的监测数据显示,受近期中国东北地区大风和降温影响,未来3天,预...
02-07
  开年以来,多地将稳楼市作为重要工作。  1月14日,郑州市房协发出倡议书,倡议全市房企在“春节...
01-21
新华社北京1月21日电(记者张辛欣、张晓洁)工业和信息化部副部长张云明在21日国新办举行的“中国经济高质量发展成效”系列新闻发布会上表示,我国已有570多家工业企业入围全球研...
01-22
1 月 24 日消息,特斯拉今日开启焕新 Model Y 直播首秀,实车正式亮相,此次主要展示的车色为冰河蓝。外观方面,焕新 Model Y 借鉴了赛博越野旅行车、赛博无人电动车中的设...
01-24
2 月 2 日消息,比亚迪今日公布 1 月销售新车300538 辆,乘用车销售 296446 辆同比增长 47.5%。随后博主 @小迪快报 带来了具体销量明细。汇总各车型销量信息如下:王朝网...
02-03
  1、《掌心》礼宗旭是坏人,他是十恶不赦的大反派,表面上是大善人,私下里做尽龌龊勾当。  2、礼宗旭因童年目睹母亲被家暴的阴影,而养成了扭曲的心理,被他凌虐荼毒的无辜少...
02-15
在娱乐圈这个星光灿烂的舞台上,何炅以其非凡的主持能力和温文尔雅的形象,赢得了广泛的认可与尊敬。更令人钦佩的是,他展现出的自律精神和健康的身体状态,成为了公众关注的焦点。...
02-22
  近期,呼吸道传染病进入高发季。中国疾控中心传染病预防控制所所长阚飙表示,目前到医院就诊的、症状类似流感的患者中,流感病毒、鼻病毒、人偏肺病毒和肺炎支原体等病...
01-21
21世纪经济报道记者季媛媛 上海报道 继2023年出现上市以来首次亏损,科创板首家CRO(医药合同研发服务)企业美迪西(688202.SH)2024年的业绩继续...
01-22
人民网北京12月3日电 (记者李昉)近日,教育部办公厅印发通知,2025年继续实施退役大学生士兵专项硕士研究生招...
01-21
中新网上海1月22日电(记者陈静)记者22日获悉,在中医“瘀血理论”指导下,结...
01-23
  1月21日上午10点,贵州亨特房地产开发有限公司(简称“亨特地产”)持有的贵州花溪农村商业银行股...
01-23
  2025年开年,保险资金等中长期资金入市迎来了更为广阔的政策空间。1月22日,中央金融办、中国证...
02-14
双鱼座的男生通常是非常敏感和浪漫的,他们对待自己喜欢的人也有着独特的方式。当双鱼男...
01-22
水瓶座男生通常被认为是理性、独立和冷静的人。他们不容易表达自己的情感,因此要判断一...
01-22
穿越时尚潮流前线:2023年必备服饰推荐当我们谈到时尚潮流,总会感叹于其迅猛变化和多元风格。从熙熙攘攘的时装周到各大品牌的发布秀,时尚似乎从未停止过它的步伐。但如何在瞬息...
02-12
瘦小的男人适合穿什么品牌?一、瘦小的男人适合穿什么品牌?没有特定的品牌适合瘦小的男人,关键是要选择适合自己身材和风格的衣服。因为每个人的身材和个性都不同,选择品牌只是其...
02-17
2月7日消息,百胜中国披露2024年第四季度及全年财务业绩。2024年第四季度,百胜中国总收入同比增长4%至26亿美元;经营利润同比增长36%至1.51亿美元;经营利润率为5.8%,同比增长140个...
02-07
2月4日消息,淘宝天猫面向服饰商家发布新品利好政策。在新春开工之际,为了更好地帮助商家搭上“春季上新”的东风,淘宝商家后台将上线“新品超级橱窗”板块,并于2月5日开放报名入...
02-07
图源:哈尔滨冰雪大世界公众号 开园近两个月,2月17日,哈尔滨...
02-18
2月27日消息,第二十六届哈尔滨冰雪大世界正式闭园,宣告本期冰雪季结束,途牛《2024-2025国内冰雪旅游消费盘点》数据显示,2024年12月以来,冰雪旅游市场人气与热度不断攀升,并呈现出...
03-01
2024年末,一位科技创业者火了。作者 | 王思琪来源 | 投资家(ID:touzijias)2024年末,一位科技创业者火了。2025年初,这位创业者再度爆火。近日,中国科技行业因一位85后年轻人现身《...
01-24
在全球经贸环境遭遇寒流,多国贸易活动陷入低迷之际,中国外贸犹如一艘巨轮,破浪前行,展现出非凡的韧性和增长潜力。作为世界第二大经济体,中国外贸不仅是国内经济增长的重要支柱,更...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮