灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

9个月前 来源:华夏晚报 观看:110

近日,Figure 发布的端到端 VLA 具身大模型  Helix,采用分层架构同时实现高频控制和高泛化能力,引起了业内广泛关注。几乎同期,中国具身智能团队灵初智能发布了基于强化学习的增强版分层架构端到端 VLA  模型 Psi R0.5,这距离灵初智能团队去年底发布的 Psi R0 仅 2 个月J4j即热新闻——关注每天科技社会生活新变化gihot.com

  本次发布的新模型重大升级,对于复杂场景的泛化性灵巧性CoT长程任务能力上均有显著提升,同时完成泛化抓取训练所需的数据量仅需  Helix 数据量的 0.4%!在全球范围内实现了泛化灵巧操作与训练效率的双重领先。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  此外,灵初智能团队连发四篇高质量论文,将团队在高效实现泛化抓取堆叠场景的物品检索利用外部环境配合抓取VLA  安全对齐方面的最新成果悉数公开,展现了中国团队在具身智能领域的强悍战斗力。J4j即热新闻——关注每天科技社会生活新变化gihot.com

1.pngJ4j即热新闻——关注每天科技社会生活新变化gihot.com

Psi R0.5 路径演进图J4j即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA仅需两小时灵巧手抓取数据J4j即热新闻——关注每天科技社会生活新变化gihot.com

轻松实现物品、灯光、场景泛化并实现真正  CoTJ4j即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是首个用于灵巧手通用抓取的  VLA(Vision-Language-Action)框架,通过少量的训练,即刻在多变环境下智能涌现灵巧操作能力,能够像人类一样快速、准确地拾取各种物品。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是一个融合视觉,语言和动作的层次化框架:J4j即热新闻——关注每天科技社会生活新变化gihot.com

  · High-level  Planner:高层规划由预训练的大型视觉语言模型(VLM)实现,可理解多样化指令、自主决定抓取策略J4j即热新闻——关注每天科技社会生活新变化gihot.com

  · Low-level  Controller:低层扩散策略通过实时视觉反馈闭环掌握目标物体智能涌现出灵巧操作能力J4j即热新闻——关注每天科技社会生活新变化gihot.com

  整个框架的核心在于将多样化的图像输入数据通过现有的 Foundation Model 转换成 Domain-invariance  的表征,并端到端地训练下层控制模型。J4j即热新闻——关注每天科技社会生活新变化gihot.com

2.pngJ4j即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA 框架图J4j即热新闻——关注每天科技社会生活新变化gihot.com

  从实验结果看,灵初智能仅使用了约 2 小时的灵巧手抓取数据(2094 条轨迹 × 3.5 秒 / 条 ÷ 60 秒  / 分钟 ÷ 60 分钟 / 小时 ≈ 2 小时),泛化到上千种不同物体,位置,堆叠,灯光,背景下成功抓取,而这个数据量仅仅是 Figure 的  0.4%数据利用效率提高 250 倍J4j即热新闻——关注每天科技社会生活新变化gihot.com

  同时,DexGraspVLA 相比现有方案还具有几项优势:J4j即热新闻——关注每天科技社会生活新变化gihot.com

  · 根据语言指令分辨出目标物体,处理堆叠场景下的目标物体的检索并抓取J4j即热新闻——关注每天科技社会生活新变化gihot.com

  · 抓取速度快(所有视频无加速,同类工作中节拍较快),闭环姿态矫正与重抓取能力(ReGrasp)J4j即热新闻——关注每天科技社会生活新变化gihot.com

  · 大脑具有 CoT 长程推理能力自主推理抓取顺序并将所有物体依次抓取J4j即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  展现出对光照变化背景干扰和物体姿态的强大鲁棒性和泛化性,让机器人的灵巧抓取达到人类级别。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  基于预训练的大模型:使用自然语言与人类交互,具有高智能的长程推理能力,能够自主理解人类话语并推理任务。因此可以一次设定多个抓取目标,通过 CoT  实现复杂流程下的自动分拣或清理。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  仍然会自动分析当前姿态偏差,通过细微调整腕关节和手部角度重新尝试抓取实现非常鲁棒且高效的抓取能力达到极强的泛化能力J4j即热新闻——关注每天科技社会生活新变化gihot.com

3.pngJ4j即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval DexterityJ4j即热新闻——关注每天科技社会生活新变化gihot.com

堆叠场景中的高效物体检索策略J4j即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习底层驱动,简单 reward 涌现复杂动作J4j即热新闻——关注每天科技社会生活新变化gihot.com

  在大多数实际场景中,物品往往以无规则、堆叠的方式摆放。传统方法要求机器人逐件搬开遮挡物,不仅耗时,还对机器人自身抓取能力提出了很高的要求。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  为了解决这一难题,灵初智能开发了一套基于强化学习的物体检索策略 ——Retrieval  Dexterity,解决了堆叠场景中物体检索识别效率低的问题。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  Retrieval Dexterity  系统中未用真机数据,灵初团队没有采用真机数据进行训练而是直接在仿真环境中通过强化学习进行训练。通过在仿真环境中大规模生成复杂的堆叠场景,训练模型直至涌现出合适的检索操作,随后再将这些操作零样本迁移至现实机器人和复杂环境中。J4j即热新闻——关注每天科技社会生活新变化gihot.com

4.pngJ4j即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval Dexterity 框架图J4j即热新闻——关注每天科技社会生活新变化gihot.com

  从杂乱堆叠物体中快速取出目标物体J4j即热新闻——关注每天科技社会生活新变化gihot.com

  在超过 10 种不同形状、大小的生活物品测试中,Retrieval Dexterity  展现出了优秀的性能,不仅能够高效完成训练过的物体的检索任务还能将检索能力泛化到未见过的新物体上J4j即热新闻——关注每天科技社会生活新变化gihot.com

  效率对比传统方法提升明显J4j即热新闻——关注每天科技社会生活新变化gihot.com

  与人为设定的动作相比,Retrieval Dexterity 在所有场景中平均减少了 38%  的操作步骤与模拟的 “将所有物体抓起来并放开” 相比,该方法更是平均减少了 90%  的步骤数量。这种效率提升主要得益于多指灵巧手能够直接与遮挡物进行交互,并随时移动它们,而不需要逐个移除。J4j即热新闻——关注每天科技社会生活新变化gihot.com

5.pngJ4j即热新闻——关注每天科技社会生活新变化gihot.com

ExDex:借力外部环境J4j即热新闻——关注每天科技社会生活新变化gihot.com

抓取 “不可能” 物体J4j即热新闻——关注每天科技社会生活新变化gihot.com

  外部灵巧性解决物品超过机器人末端执行器的最大开度问题J4j即热新闻——关注每天科技社会生活新变化gihot.com

  当物体的底面尺寸超过机器人末端执行器的最大开度时,传统方法往往无法直接对物体进行抓取,这种情况在商场等商业场景尤为常见。为了解决这一难题,灵初智能推出了  ExDex—— 一种基于外部灵巧性(extrinsic dexterity)抓取的创新解决方案J4j即热新闻——关注每天科技社会生活新变化gihot.com

  ExDex 能够利用环境特征进行非夹持式操作,凭借多指灵巧手的灵活性和操作能力,实现更丰富的环境交互。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习带来超越人类遥操作水平的灵巧操作J4j即热新闻——关注每天科技社会生活新变化gihot.com

  通过强化学习,ExDex  涌现出自主制定策略的能力,借助周围环境抓取那些无法直接抓取的物体。例如,机器人可以将物体先推到桌面边缘或墙体边缘,再利用这些环境特征完成抓取任务。这种操作通过传统的遥操作方式几乎无法实现,充分体现了强化学习的强大优势。J4j即热新闻——关注每天科技社会生活新变化gihot.com

  在对数十种不同家居物品的大量实验中,ExDex  验证了其优越的性能和对新物体的泛化能力并成功将仿真训练的策略无缝迁移到真实机器人中,实现了从仿真到现实的高效过渡。J4j即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA:人机安全交互的 “守护神”J4j即热新闻——关注每天科技社会生活新变化gihot.com

  当下,具身智能机器人频繁出圈,从春晚跳舞的 Unitree  人形机器人,到波兰街头遛机器狗的新奇场景,让人看到人机交互的无限可能,但安全问题也不容忽视。视觉 - 语言 -  行动模型(VLAs)在革新机器人技术时,也藏着安全隐患。J4j即热新闻——关注每天科技社会生活新变化gihot.com

6.pngJ4j即热新闻——关注每天科技社会生活新变化gihot.com

 左图呈现了传统 VLA 模型在抓取任务中的三种典型不安全行为:1)对无关物体的严重损坏,2)目标识别错误导致危险物体的误用,以及  3)执行指令时与危险物体发生交互。右图通过导航路径示例,进一步展示了传统 VLA 在导航过程中的三种不安全行为J4j即热新闻——关注每天科技社会生活新变化gihot.com

  本周,北京大学 PAIR - Lab 团队携手灵初智能重磅推出了具身安全模型  SafeVLA,通过安全对齐,让机器人在复杂场景安全高效执行任务,在对抗干扰场景中鲁棒性极高J4j即热新闻——关注每天科技社会生活新变化gihot.com

  SafeVLA 把 “以人为本” 刻进  DNA,不像传统机器人只盯着任务完成它把人类安全放在首位。技术上,引入约束马尔可夫决策过程(CMDP)范式,把现实安全约束融入仿真环境大规模采样。SafeVLA  在安全性和任务执行方面均取得突破性进展分别提升 83.58% 和  3.85%充分证明了其在平衡安全与效率方面的卓越能力J4j即热新闻——关注每天科技社会生活新变化gihot.com

11.gifJ4j即热新闻——关注每天科技社会生活新变化gihot.com

传统 VLA 模型完成任务过程中的高危行为J4j即热新闻——关注每天科技社会生活新变化gihot.com

  团队开发全新仿真环境 Safety -  CHORES集成安全约束功能支持用户自定义规则代码还完全开源直接给全球研究者和开发者送福利。而且,SafeVLA  在 12 个分布外(OOD)实验里,面对光照、材质变化和复杂环境扰动,始终稳定发挥,实力碾压其他模型。J4j即热新闻——关注每天科技社会生活新变化gihot.com

22.gifJ4j即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA 在正常测试集和 OOD 测试集上的比较,其在 OOD 环境下依然保持良好安全性和表现J4j即热新闻——关注每天科技社会生活新变化gihot.com


J4j即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-14-7388-0.html灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:企业智能化升级关键:DeepSeek大模型技术与应用论坛来了!

下一篇:赛力斯申请注册问界智享商标

为你推荐
在今早的Xbox开发者直面会上,Xbox在直播过程中发布了《忍者龙剑传2》的发售宣传片,但网友发现直播的Xbox版预告遭到了和谐,本该露出性感女性的画面被无故掐掉,而PS...
01-27
环球影业刚刚发布了《侏罗纪世界:重生》首支预告片,传奇动作巨星斯嘉丽·约翰逊领衔主演、突破性实力演员乔纳森·贝利与两届奥斯卡得主马赫沙拉·阿里倾情加盟,...
02-06
记者今天从国家邮政局了解到,今年春节假期,全国邮政快递行业业务量保持良好增长态势,揽收和投递快递包裹超19亿件。国家邮政局数据显示,1月28日至2月4日,全国揽收和投递快递包裹1...
02-05
2月9日,哈尔滨亚冬会速度滑冰男子5000米决赛,中国队包揽金银铜牌。吴宇夺得金牌,刘瀚彬获得银牌,哈那哈提·木哈买提获得铜牌。...
02-09
近日,完美世界(002624.SZ)发布2024年度业绩预告。预告显示,完美世界去年全年预计实现营业收入55亿元至56亿元,预计归母净利润为亏损11...
01-21
据物理学家组织网14日报道,美国国家航空航天局(NASA)和意大利航天局携手研制的月球GNSS(全球导航卫星系统)接收器实验(LuGRE)有效载荷即将发射升空。LuGRE...
01-21
好消息!辽宁省手机、平板、智能手表(手环)购新补贴实施细则来啦每人每类可补贴1件每件最高补贴不超过500元...
01-21
  自26日开始,辽宁省大部分地区普降大雪到暴雪。受此次降雪影响,27日到29日,全省大部地区将降温8至12摄...
01-28
近年来,短小精悍、剧情跌宕的短剧,发展成网络影视的一种新业态,短剧出海也成为我国文化产业的一个新风向。截至2024年8月,头部海外短剧App的地区数据中,美国的收入达1.51亿美元(约...
01-22
  现代快报讯(实习生 唐子文 记者 季雨)日前,现代快报报道了“7个1”手机号60万元起拍一事,引发网友关注。1月21日,该手机号正式开拍,在经过3个小时的竞拍后,终因无人出价导致...
01-22
  21世纪经济报道特约记者钱伯彦法兰克福报道  不出意料,奔驰的2024年并不好过。  1月10日...
01-21
1 月 26 日消息,GM Authority 披露了雪佛兰将在海外市场推出的全新车型“Spark”的实车图。该车定位小型电动跨界车,名为 Spark EUV,实质上是国内宝骏悦也 Plus 的海外...
01-27
《香草的每天》近期正在热播,播出后反响良好,网上热度持续上升,在各大论坛上也引发了热烈讨论。观众们尤其关注第19集的剧情。在这一集中,作为点心教室最后的学...
02-20
近期,电视剧《难哄》在各大短视频平台爆火,剧中角色桑稚的首次登场引起了广泛关注。她在第1集跨年夜短暂出现,给观众留下了深刻印象。当时,她正在经历高三阶段,...
02-22
关于实施2025年卫生健康系统为民服务实事项目的通知国卫办函〔2025〕25号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、中医药局、...
02-14
21世纪经济报道记者朱艺艺 李佳英 闫硕 杭州、广州、北京报道“天津老百姓大药房可以订购华为WATCH D2,2988元,医保账号走个人账户”“上海...
02-14
沈阳农业大学认真学习贯彻习近平总书记关于教育的重要论述、给全国涉农高校的书记校长和专家代表重要回...
01-21
2025年辽宁省普通高等学校招生艺术类专业省统考考生须知  1.凡报考美术与设计类、书法类、音乐类、舞...
01-22
  摘要  【纯碱:仍面临供需过剩格局】2024年,纯碱随着大投产逐步兑现,叠加光伏和浮法玻璃进入...
01-24
  中国经济网北京2月6日讯 国家金融监督管理总局网站近日发布的国家金融监督管理总局重庆监管...
02-07
在爱情的世界里,有时候我们会遇到一些花心的男人。其中,双子座的男生就以善变、多情而著...
01-22
在星座中,有一个特别能够理解和欣赏射手男性格的星座女子。她们与射手男之间有着特殊的...
01-22
休闲男装搭配? 男装休闲搭配?休闲男装搭配?01.条纹衬衫+牛仔裤这一身穿搭单品款式上组合看起来不仅休闲感满满,而且还透露出非常清爽的感觉,经典怀旧的牛仔休闲裤,跟上衣浅粉条纹...
02-07
魅力绽放:模特T台走秀背后的故事在时尚界,有一种声音永远不会被忽视,那就是模特T台走秀。这个将创意与自信结合的空间,不仅展示着设计师的想象力,还体现着模特们的努力与魅力。走...
02-12
张一鸣:“做不好的就别做了,要做就必须做到非常好。”1.抖音电商跃居行业第三2024年,电商市场步入存量时代,竞争愈发白热化。那么,经过一整年的激烈厮杀,电商平台们的表现如何呢?据...
02-18
2月17日消息,猪八戒网旗下江西八戒创新资源近日收到了“高新技术企业”证书纸质件,标志着该公司再次获批高新技术企业。图源:猪八戒网头条公众号江西八戒创新资源是猪八戒网企...
02-18
ZARA、H&M一度引领国内时尚风潮,被誉为“白领衣柜的时尚宠儿”,但如今光环不再。国内本土服装品牌的崛起,让ZARA、H&M等国际快时尚品...
02-18
3月1日消息,在北京大学国家发展研究院【承泽论坛】第32期,智联招聘集团总裁张月佳指出,在数字技术的加持下,更多职场人有机会成为“超级个体”,而HR是寻找与培养超级个体的关键。...
03-01
【近日】— 在全球体育与数字娱乐加速融合的时代,亚洲领先的数字娱乐平台九游娱乐与德甲传统劲旅云达不莱梅足球俱乐部正式宣布达成战略合作协议。此次合作标志着双方在体育...
01-21
近日,华力创科学宣布完成数千万元A+轮融资,本轮融资由金属3D打印领域头部上市公司铂力特独家投资。据披露,本轮融资所募集的资金将专注于深挖高性能光学多模态感知技术,结合金属...
01-24
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮