灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

1年前 来源:华夏晚报 观看:133

近日,Figure 发布的端到端 VLA 具身大模型  Helix,采用分层架构同时实现高频控制和高泛化能力,引起了业内广泛关注。几乎同期,中国具身智能团队灵初智能发布了基于强化学习的增强版分层架构端到端 VLA  模型 Psi R0.5,这距离灵初智能团队去年底发布的 Psi R0 仅 2 个月c9q即热新闻——关注每天科技社会生活新变化gihot.com

  本次发布的新模型重大升级,对于复杂场景的泛化性灵巧性CoT长程任务能力上均有显著提升,同时完成泛化抓取训练所需的数据量仅需  Helix 数据量的 0.4%!在全球范围内实现了泛化灵巧操作与训练效率的双重领先。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  此外,灵初智能团队连发四篇高质量论文,将团队在高效实现泛化抓取堆叠场景的物品检索利用外部环境配合抓取VLA  安全对齐方面的最新成果悉数公开,展现了中国团队在具身智能领域的强悍战斗力。c9q即热新闻——关注每天科技社会生活新变化gihot.com

1.pngc9q即热新闻——关注每天科技社会生活新变化gihot.com

Psi R0.5 路径演进图c9q即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA仅需两小时灵巧手抓取数据c9q即热新闻——关注每天科技社会生活新变化gihot.com

轻松实现物品、灯光、场景泛化并实现真正  CoTc9q即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是首个用于灵巧手通用抓取的  VLA(Vision-Language-Action)框架,通过少量的训练,即刻在多变环境下智能涌现灵巧操作能力,能够像人类一样快速、准确地拾取各种物品。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是一个融合视觉,语言和动作的层次化框架:c9q即热新闻——关注每天科技社会生活新变化gihot.com

  · High-level  Planner:高层规划由预训练的大型视觉语言模型(VLM)实现,可理解多样化指令、自主决定抓取策略c9q即热新闻——关注每天科技社会生活新变化gihot.com

  · Low-level  Controller:低层扩散策略通过实时视觉反馈闭环掌握目标物体智能涌现出灵巧操作能力c9q即热新闻——关注每天科技社会生活新变化gihot.com

  整个框架的核心在于将多样化的图像输入数据通过现有的 Foundation Model 转换成 Domain-invariance  的表征,并端到端地训练下层控制模型。c9q即热新闻——关注每天科技社会生活新变化gihot.com

2.pngc9q即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA 框架图c9q即热新闻——关注每天科技社会生活新变化gihot.com

  从实验结果看,灵初智能仅使用了约 2 小时的灵巧手抓取数据(2094 条轨迹 × 3.5 秒 / 条 ÷ 60 秒  / 分钟 ÷ 60 分钟 / 小时 ≈ 2 小时),泛化到上千种不同物体,位置,堆叠,灯光,背景下成功抓取,而这个数据量仅仅是 Figure 的  0.4%数据利用效率提高 250 倍c9q即热新闻——关注每天科技社会生活新变化gihot.com

  同时,DexGraspVLA 相比现有方案还具有几项优势:c9q即热新闻——关注每天科技社会生活新变化gihot.com

  · 根据语言指令分辨出目标物体,处理堆叠场景下的目标物体的检索并抓取c9q即热新闻——关注每天科技社会生活新变化gihot.com

  · 抓取速度快(所有视频无加速,同类工作中节拍较快),闭环姿态矫正与重抓取能力(ReGrasp)c9q即热新闻——关注每天科技社会生活新变化gihot.com

  · 大脑具有 CoT 长程推理能力自主推理抓取顺序并将所有物体依次抓取c9q即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  展现出对光照变化背景干扰和物体姿态的强大鲁棒性和泛化性,让机器人的灵巧抓取达到人类级别。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  基于预训练的大模型:使用自然语言与人类交互,具有高智能的长程推理能力,能够自主理解人类话语并推理任务。因此可以一次设定多个抓取目标,通过 CoT  实现复杂流程下的自动分拣或清理。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  仍然会自动分析当前姿态偏差,通过细微调整腕关节和手部角度重新尝试抓取实现非常鲁棒且高效的抓取能力达到极强的泛化能力c9q即热新闻——关注每天科技社会生活新变化gihot.com

3.pngc9q即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval Dexterityc9q即热新闻——关注每天科技社会生活新变化gihot.com

堆叠场景中的高效物体检索策略c9q即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习底层驱动,简单 reward 涌现复杂动作c9q即热新闻——关注每天科技社会生活新变化gihot.com

  在大多数实际场景中,物品往往以无规则、堆叠的方式摆放。传统方法要求机器人逐件搬开遮挡物,不仅耗时,还对机器人自身抓取能力提出了很高的要求。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  为了解决这一难题,灵初智能开发了一套基于强化学习的物体检索策略 ——Retrieval  Dexterity,解决了堆叠场景中物体检索识别效率低的问题。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  Retrieval Dexterity  系统中未用真机数据,灵初团队没有采用真机数据进行训练而是直接在仿真环境中通过强化学习进行训练。通过在仿真环境中大规模生成复杂的堆叠场景,训练模型直至涌现出合适的检索操作,随后再将这些操作零样本迁移至现实机器人和复杂环境中。c9q即热新闻——关注每天科技社会生活新变化gihot.com

4.pngc9q即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval Dexterity 框架图c9q即热新闻——关注每天科技社会生活新变化gihot.com

  从杂乱堆叠物体中快速取出目标物体c9q即热新闻——关注每天科技社会生活新变化gihot.com

  在超过 10 种不同形状、大小的生活物品测试中,Retrieval Dexterity  展现出了优秀的性能,不仅能够高效完成训练过的物体的检索任务还能将检索能力泛化到未见过的新物体上c9q即热新闻——关注每天科技社会生活新变化gihot.com

  效率对比传统方法提升明显c9q即热新闻——关注每天科技社会生活新变化gihot.com

  与人为设定的动作相比,Retrieval Dexterity 在所有场景中平均减少了 38%  的操作步骤与模拟的 “将所有物体抓起来并放开” 相比,该方法更是平均减少了 90%  的步骤数量。这种效率提升主要得益于多指灵巧手能够直接与遮挡物进行交互,并随时移动它们,而不需要逐个移除。c9q即热新闻——关注每天科技社会生活新变化gihot.com

5.pngc9q即热新闻——关注每天科技社会生活新变化gihot.com

ExDex:借力外部环境c9q即热新闻——关注每天科技社会生活新变化gihot.com

抓取 “不可能” 物体c9q即热新闻——关注每天科技社会生活新变化gihot.com

  外部灵巧性解决物品超过机器人末端执行器的最大开度问题c9q即热新闻——关注每天科技社会生活新变化gihot.com

  当物体的底面尺寸超过机器人末端执行器的最大开度时,传统方法往往无法直接对物体进行抓取,这种情况在商场等商业场景尤为常见。为了解决这一难题,灵初智能推出了  ExDex—— 一种基于外部灵巧性(extrinsic dexterity)抓取的创新解决方案c9q即热新闻——关注每天科技社会生活新变化gihot.com

  ExDex 能够利用环境特征进行非夹持式操作,凭借多指灵巧手的灵活性和操作能力,实现更丰富的环境交互。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习带来超越人类遥操作水平的灵巧操作c9q即热新闻——关注每天科技社会生活新变化gihot.com

  通过强化学习,ExDex  涌现出自主制定策略的能力,借助周围环境抓取那些无法直接抓取的物体。例如,机器人可以将物体先推到桌面边缘或墙体边缘,再利用这些环境特征完成抓取任务。这种操作通过传统的遥操作方式几乎无法实现,充分体现了强化学习的强大优势。c9q即热新闻——关注每天科技社会生活新变化gihot.com

  在对数十种不同家居物品的大量实验中,ExDex  验证了其优越的性能和对新物体的泛化能力并成功将仿真训练的策略无缝迁移到真实机器人中,实现了从仿真到现实的高效过渡。c9q即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA:人机安全交互的 “守护神”c9q即热新闻——关注每天科技社会生活新变化gihot.com

  当下,具身智能机器人频繁出圈,从春晚跳舞的 Unitree  人形机器人,到波兰街头遛机器狗的新奇场景,让人看到人机交互的无限可能,但安全问题也不容忽视。视觉 - 语言 -  行动模型(VLAs)在革新机器人技术时,也藏着安全隐患。c9q即热新闻——关注每天科技社会生活新变化gihot.com

6.pngc9q即热新闻——关注每天科技社会生活新变化gihot.com

 左图呈现了传统 VLA 模型在抓取任务中的三种典型不安全行为:1)对无关物体的严重损坏,2)目标识别错误导致危险物体的误用,以及  3)执行指令时与危险物体发生交互。右图通过导航路径示例,进一步展示了传统 VLA 在导航过程中的三种不安全行为c9q即热新闻——关注每天科技社会生活新变化gihot.com

  本周,北京大学 PAIR - Lab 团队携手灵初智能重磅推出了具身安全模型  SafeVLA,通过安全对齐,让机器人在复杂场景安全高效执行任务,在对抗干扰场景中鲁棒性极高c9q即热新闻——关注每天科技社会生活新变化gihot.com

  SafeVLA 把 “以人为本” 刻进  DNA,不像传统机器人只盯着任务完成它把人类安全放在首位。技术上,引入约束马尔可夫决策过程(CMDP)范式,把现实安全约束融入仿真环境大规模采样。SafeVLA  在安全性和任务执行方面均取得突破性进展分别提升 83.58% 和  3.85%充分证明了其在平衡安全与效率方面的卓越能力c9q即热新闻——关注每天科技社会生活新变化gihot.com

11.gifc9q即热新闻——关注每天科技社会生活新变化gihot.com

传统 VLA 模型完成任务过程中的高危行为c9q即热新闻——关注每天科技社会生活新变化gihot.com

  团队开发全新仿真环境 Safety -  CHORES集成安全约束功能支持用户自定义规则代码还完全开源直接给全球研究者和开发者送福利。而且,SafeVLA  在 12 个分布外(OOD)实验里,面对光照、材质变化和复杂环境扰动,始终稳定发挥,实力碾压其他模型。c9q即热新闻——关注每天科技社会生活新变化gihot.com

22.gifc9q即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA 在正常测试集和 OOD 测试集上的比较,其在 OOD 环境下依然保持良好安全性和表现c9q即热新闻——关注每天科技社会生活新变化gihot.com


c9q即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-14-7388-0.html灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:企业智能化升级关键:DeepSeek大模型技术与应用论坛来了!

下一篇:赛力斯申请注册问界智享商标

为你推荐
《黑神话:悟空》大获成功后,亢金龙、紫蛛儿、小狐狸萍萍等角色也深受玩家喜爱。近日小狐狸萍萍女演员钱思怡在网上分享视频,展示了她泡澡的视频,一起来看看吧! 视频...
01-31
在2024年1月,育碧推出了《波斯王子:失落的王冠》,尽管游戏广受好评,但育碧以销量不佳为由将其开发团队解散,开发人员则被分配到了育碧的其他项目中。而最近,通过一名...
02-02
极目新闻记者 肖名远2月3日(正月初六),贵州省清镇市,余华英拐卖案受害者王能能终于回到老家与亲人们团聚,全村放鞭炮迎接。这一天,王能能的母亲张荣仙等待了30年,但对她来说,这次团...
02-04
今年以来,黄金价格持续呈现上涨趋势。最近几天,国际金价屡创新高,金饰品的价格也随之上涨。现在黄金市场的整体情况怎么样?记者第一时间来到黄金市场进行探访。在全国最大的黄金...
02-08
昆虫即使在弱光条件下也能表现出极其优秀的敏捷性和反应能力。秘密在于它们的复眼能以惊人的速度和灵敏度检测运动。韩国科学技术院研究人员模仿这...
01-21
1月19日,应用于沙戈荒地区的超大功率等级风电机组——“凌风号”在吉林中车松原基地成功下线,这是国内首个成功下线的12兆瓦级陆上风电机...
01-21
  今年计划换新车的辽宁消费者迎来利好。2月13日晚,辽宁省商务厅发布通知,明确了今年辽宁落实国家汽车...
02-14
  新华社济南2月12日电(记者丛佳鑫)农历正月十四太阳落山后,山东省烟台市黄渤海新区古现街道的渔...
02-14
  每单上涨一两元 年货寄递与保障并行  记者 何倩  春节临近,年货寄递热度不减。1月19日,北京商报记者走访多家快递企业了解到,受电商促销影响,部分网点年货快递量同比增...
01-21
  多家A股家居企业发布业绩预告:受市场竞争、计提损失等影响,2024年净利润同比下滑  2024年,家居消费市场景气度下滑,各大家居企业均称销售承压,作为行业龙头的欧派家居(SH60...
01-21
1 月 23 日消息,阿维塔 06 的实车图在网上曝光,这款定位中型车的新车预计将在今年第二季度正式上市。从曝光的照片来看,阿维塔 06 提供了多种大胆的配色方案,包括紫色、...
01-24
2 月 5 日消息,今日丰田汽车公司宣布了一系列重大举措,一方面,丰田与上海市政府达成合作意向,将在上海金山区独资设立雷克萨斯纯电动汽车及电池的研发和生产公司;另一方...
02-05
  1、《难哄》何炅客串的是温以凡和桑延高中时的老师,何炅在剧中戴着眼镜出现,可谓是本色出演。  2、何炅客串的老师在预告中就出现过了,开学第一天,他还把温以凡认成了桑...
02-17
《漫城》近期正在热播,播出后反响不错,网上热度持续上升,各大论坛上网友们热烈讨论。观众们最关心的话题之一是林小妙最后和谁在一起了。在繁华的小城市里,有一...
02-20
21世纪经济报道记者季媛媛 上海报道 2025年刚开始,诺华制药就完成了大笔收购案。2月11日,诺华宣布了对Anthos Therapeutics的收购计划。据...
02-12
21世纪经济报道记者 闫硕 北京报道HPV是一种易感染人体表皮和黏膜鳞状上皮的病毒,已被发现有两百多种型别,根据致癌性的不同分为高危型别和...
02-18
  大众网记者 隋宜笑 报道  为培养适应新时代需求的全媒体新闻人才搭建更为广阔、坚实的平台,进一步深化校企合作,12 月 17 日,山东传媒职业学院新闻传播系于产教中心报...
01-21
辽宁大学依托部校共建新闻学院优势办高水平的新闻与传播学院,以习近平文化思想为指引,深入学习贯彻习近平...
01-21
  本报记者 冷翠华  近年来,在重疾险新单保费增长乏力的情况下,人身险行业正在努力探寻“第二...
02-06
  摘要  【国际金价续创新高黄金板块业绩集体向好】近期,投资者的避险情绪升温,贵金属价格持...
02-06
天秤座的男生注重外貌和气质,他们喜欢温柔、优雅、有内涵的女人。下面就让我们来看看天...
01-22
射手座的男生通常被认为是自由奔放、热情洋溢的人,他们喜欢追求刺激和冒险,对于感情也是...
01-22
个子瘦小男生穿搭裤子推荐?一、个子瘦小男生穿搭裤子推荐?身高低的男生可以选择以下类型的裤子,可以让身材看起来更加高挑:1. 窄脚休闲裤:这种裤子腰部设计更高,拉长腿部线条,同时...
02-12
如何在T台上定制完美造型:男女模特走秀秘笈作为一名爱好时尚的我,在T台走秀这种既华丽又充满挑战的场合中,造型的重要性不容忽视。无论是男女模特,如何在短时间内制定出令人惊艳...
02-12
2月5日消息,盒马发布《2025盒区房春节消费报告》(以下简称“报告”)。《报告》显示,盒马年菜销售同比增长了42%,下单购买年菜的18-35岁的年轻消费者占比达56%,不同于老一辈,这届年...
02-07
1.阿里缓过来了开年两个月,阿里巴巴就展现出强劲的“复兴”势头,成为市场瞩目的焦点。近期,随着马云频繁亮相,公众对阿里的关注度显著提升。同时,阿里在AI领域的表现也备受瞩目。...
02-22
2月4日消息,飞猪发布《2025年春节假期出游快报》,报告显示,在“请2休11”“请4休13”等带动下,这个春节假期大家玩得更久、更远,消费也更多。春节假期国内游人均消费同比去年提升...
02-07
2月13日消息,据Tech星球消息,饿了么将推出一项名为“筷马送水”的服务,用于桶装水、包装饮用水的配送,可能还会以加盟的方式邀请本地水站入驻,享受饿了么平台的流量扶持。该服务...
02-14
自去年底开始,黄金多头优势逐渐退却,国际现货黄金价格经历几次大跌后一度跌下2700关口,多空进入漫长的震荡周期,多头始终无法找到再度冲高的时机。  北京时间1月21日,国际现货...
01-24
近日,圣泰能科顺利完成1.5亿元人民币B轮融资。本次融资由江苏省投资、中信建投资本领投,由江西省金投集团、江西金控投资管理中心、毅达资本、通瀛...
02-07
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮