灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

10个月前 来源:华夏晚报 观看:120

近日,Figure 发布的端到端 VLA 具身大模型  Helix,采用分层架构同时实现高频控制和高泛化能力,引起了业内广泛关注。几乎同期,中国具身智能团队灵初智能发布了基于强化学习的增强版分层架构端到端 VLA  模型 Psi R0.5,这距离灵初智能团队去年底发布的 Psi R0 仅 2 个月HWf即热新闻——关注每天科技社会生活新变化gihot.com

  本次发布的新模型重大升级,对于复杂场景的泛化性灵巧性CoT长程任务能力上均有显著提升,同时完成泛化抓取训练所需的数据量仅需  Helix 数据量的 0.4%!在全球范围内实现了泛化灵巧操作与训练效率的双重领先。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  此外,灵初智能团队连发四篇高质量论文,将团队在高效实现泛化抓取堆叠场景的物品检索利用外部环境配合抓取VLA  安全对齐方面的最新成果悉数公开,展现了中国团队在具身智能领域的强悍战斗力。HWf即热新闻——关注每天科技社会生活新变化gihot.com

1.pngHWf即热新闻——关注每天科技社会生活新变化gihot.com

Psi R0.5 路径演进图HWf即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA仅需两小时灵巧手抓取数据HWf即热新闻——关注每天科技社会生活新变化gihot.com

轻松实现物品、灯光、场景泛化并实现真正  CoTHWf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是首个用于灵巧手通用抓取的  VLA(Vision-Language-Action)框架,通过少量的训练,即刻在多变环境下智能涌现灵巧操作能力,能够像人类一样快速、准确地拾取各种物品。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA 是一个融合视觉,语言和动作的层次化框架:HWf即热新闻——关注每天科技社会生活新变化gihot.com

  · High-level  Planner:高层规划由预训练的大型视觉语言模型(VLM)实现,可理解多样化指令、自主决定抓取策略HWf即热新闻——关注每天科技社会生活新变化gihot.com

  · Low-level  Controller:低层扩散策略通过实时视觉反馈闭环掌握目标物体智能涌现出灵巧操作能力HWf即热新闻——关注每天科技社会生活新变化gihot.com

  整个框架的核心在于将多样化的图像输入数据通过现有的 Foundation Model 转换成 Domain-invariance  的表征,并端到端地训练下层控制模型。HWf即热新闻——关注每天科技社会生活新变化gihot.com

2.pngHWf即热新闻——关注每天科技社会生活新变化gihot.com

DexGraspVLA 框架图HWf即热新闻——关注每天科技社会生活新变化gihot.com

  从实验结果看,灵初智能仅使用了约 2 小时的灵巧手抓取数据(2094 条轨迹 × 3.5 秒 / 条 ÷ 60 秒  / 分钟 ÷ 60 分钟 / 小时 ≈ 2 小时),泛化到上千种不同物体,位置,堆叠,灯光,背景下成功抓取,而这个数据量仅仅是 Figure 的  0.4%数据利用效率提高 250 倍HWf即热新闻——关注每天科技社会生活新变化gihot.com

  同时,DexGraspVLA 相比现有方案还具有几项优势:HWf即热新闻——关注每天科技社会生活新变化gihot.com

  · 根据语言指令分辨出目标物体,处理堆叠场景下的目标物体的检索并抓取HWf即热新闻——关注每天科技社会生活新变化gihot.com

  · 抓取速度快(所有视频无加速,同类工作中节拍较快),闭环姿态矫正与重抓取能力(ReGrasp)HWf即热新闻——关注每天科技社会生活新变化gihot.com

  · 大脑具有 CoT 长程推理能力自主推理抓取顺序并将所有物体依次抓取HWf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  展现出对光照变化背景干扰和物体姿态的强大鲁棒性和泛化性,让机器人的灵巧抓取达到人类级别。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  基于预训练的大模型:使用自然语言与人类交互,具有高智能的长程推理能力,能够自主理解人类话语并推理任务。因此可以一次设定多个抓取目标,通过 CoT  实现复杂流程下的自动分拣或清理。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  DexGraspVLA  仍然会自动分析当前姿态偏差,通过细微调整腕关节和手部角度重新尝试抓取实现非常鲁棒且高效的抓取能力达到极强的泛化能力HWf即热新闻——关注每天科技社会生活新变化gihot.com

3.pngHWf即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval DexterityHWf即热新闻——关注每天科技社会生活新变化gihot.com

堆叠场景中的高效物体检索策略HWf即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习底层驱动,简单 reward 涌现复杂动作HWf即热新闻——关注每天科技社会生活新变化gihot.com

  在大多数实际场景中,物品往往以无规则、堆叠的方式摆放。传统方法要求机器人逐件搬开遮挡物,不仅耗时,还对机器人自身抓取能力提出了很高的要求。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  为了解决这一难题,灵初智能开发了一套基于强化学习的物体检索策略 ——Retrieval  Dexterity,解决了堆叠场景中物体检索识别效率低的问题。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  Retrieval Dexterity  系统中未用真机数据,灵初团队没有采用真机数据进行训练而是直接在仿真环境中通过强化学习进行训练。通过在仿真环境中大规模生成复杂的堆叠场景,训练模型直至涌现出合适的检索操作,随后再将这些操作零样本迁移至现实机器人和复杂环境中。HWf即热新闻——关注每天科技社会生活新变化gihot.com

4.pngHWf即热新闻——关注每天科技社会生活新变化gihot.com

Retrieval Dexterity 框架图HWf即热新闻——关注每天科技社会生活新变化gihot.com

  从杂乱堆叠物体中快速取出目标物体HWf即热新闻——关注每天科技社会生活新变化gihot.com

  在超过 10 种不同形状、大小的生活物品测试中,Retrieval Dexterity  展现出了优秀的性能,不仅能够高效完成训练过的物体的检索任务还能将检索能力泛化到未见过的新物体上HWf即热新闻——关注每天科技社会生活新变化gihot.com

  效率对比传统方法提升明显HWf即热新闻——关注每天科技社会生活新变化gihot.com

  与人为设定的动作相比,Retrieval Dexterity 在所有场景中平均减少了 38%  的操作步骤与模拟的 “将所有物体抓起来并放开” 相比,该方法更是平均减少了 90%  的步骤数量。这种效率提升主要得益于多指灵巧手能够直接与遮挡物进行交互,并随时移动它们,而不需要逐个移除。HWf即热新闻——关注每天科技社会生活新变化gihot.com

5.pngHWf即热新闻——关注每天科技社会生活新变化gihot.com

ExDex:借力外部环境HWf即热新闻——关注每天科技社会生活新变化gihot.com

抓取 “不可能” 物体HWf即热新闻——关注每天科技社会生活新变化gihot.com

  外部灵巧性解决物品超过机器人末端执行器的最大开度问题HWf即热新闻——关注每天科技社会生活新变化gihot.com

  当物体的底面尺寸超过机器人末端执行器的最大开度时,传统方法往往无法直接对物体进行抓取,这种情况在商场等商业场景尤为常见。为了解决这一难题,灵初智能推出了  ExDex—— 一种基于外部灵巧性(extrinsic dexterity)抓取的创新解决方案HWf即热新闻——关注每天科技社会生活新变化gihot.com

  ExDex 能够利用环境特征进行非夹持式操作,凭借多指灵巧手的灵活性和操作能力,实现更丰富的环境交互。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  强化学习带来超越人类遥操作水平的灵巧操作HWf即热新闻——关注每天科技社会生活新变化gihot.com

  通过强化学习,ExDex  涌现出自主制定策略的能力,借助周围环境抓取那些无法直接抓取的物体。例如,机器人可以将物体先推到桌面边缘或墙体边缘,再利用这些环境特征完成抓取任务。这种操作通过传统的遥操作方式几乎无法实现,充分体现了强化学习的强大优势。HWf即热新闻——关注每天科技社会生活新变化gihot.com

  在对数十种不同家居物品的大量实验中,ExDex  验证了其优越的性能和对新物体的泛化能力并成功将仿真训练的策略无缝迁移到真实机器人中,实现了从仿真到现实的高效过渡。HWf即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA:人机安全交互的 “守护神”HWf即热新闻——关注每天科技社会生活新变化gihot.com

  当下,具身智能机器人频繁出圈,从春晚跳舞的 Unitree  人形机器人,到波兰街头遛机器狗的新奇场景,让人看到人机交互的无限可能,但安全问题也不容忽视。视觉 - 语言 -  行动模型(VLAs)在革新机器人技术时,也藏着安全隐患。HWf即热新闻——关注每天科技社会生活新变化gihot.com

6.pngHWf即热新闻——关注每天科技社会生活新变化gihot.com

 左图呈现了传统 VLA 模型在抓取任务中的三种典型不安全行为:1)对无关物体的严重损坏,2)目标识别错误导致危险物体的误用,以及  3)执行指令时与危险物体发生交互。右图通过导航路径示例,进一步展示了传统 VLA 在导航过程中的三种不安全行为HWf即热新闻——关注每天科技社会生活新变化gihot.com

  本周,北京大学 PAIR - Lab 团队携手灵初智能重磅推出了具身安全模型  SafeVLA,通过安全对齐,让机器人在复杂场景安全高效执行任务,在对抗干扰场景中鲁棒性极高HWf即热新闻——关注每天科技社会生活新变化gihot.com

  SafeVLA 把 “以人为本” 刻进  DNA,不像传统机器人只盯着任务完成它把人类安全放在首位。技术上,引入约束马尔可夫决策过程(CMDP)范式,把现实安全约束融入仿真环境大规模采样。SafeVLA  在安全性和任务执行方面均取得突破性进展分别提升 83.58% 和  3.85%充分证明了其在平衡安全与效率方面的卓越能力HWf即热新闻——关注每天科技社会生活新变化gihot.com

11.gifHWf即热新闻——关注每天科技社会生活新变化gihot.com

传统 VLA 模型完成任务过程中的高危行为HWf即热新闻——关注每天科技社会生活新变化gihot.com

  团队开发全新仿真环境 Safety -  CHORES集成安全约束功能支持用户自定义规则代码还完全开源直接给全球研究者和开发者送福利。而且,SafeVLA  在 12 个分布外(OOD)实验里,面对光照、材质变化和复杂环境扰动,始终稳定发挥,实力碾压其他模型。HWf即热新闻——关注每天科技社会生活新变化gihot.com

22.gifHWf即热新闻——关注每天科技社会生活新变化gihot.com

SafeVLA 在正常测试集和 OOD 测试集上的比较,其在 OOD 环境下依然保持良好安全性和表现HWf即热新闻——关注每天科技社会生活新变化gihot.com


HWf即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-14-7388-0.html灵初智能发布端到端VLA模型PsiR0.5,仅需两小时数据实现物品、场景全面泛化

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:企业智能化升级关键:DeepSeek大模型技术与应用论坛来了!

下一篇:赛力斯申请注册问界智享商标

为你推荐
今日(2月14日),开放世界游戏《无限暖暖》Steam页面上线,发售日待定,游戏支持简繁体中文,感兴趣的玩家可以点击此处进入商店页面。 游戏介绍: 《无限暖暖》是由叠纸...
02-15
育碧发布了截至2024 年 12 月 31 日的九个月财务报告,这家法国开发商和发行商重点介绍了即将推出的《刺客信条》游戏以及正在进行的成本削减计划,该计划已经导致...
02-15
2月5日傍晚,小米创始人雷军在社交媒体上发文:这是金的。转发的视频里有人介绍,小米SU7 Ultra车标变成了碳纤维+金色,兄弟们这个如何?来源:当事人社交账号今日上午,雷军又连发多条微...
02-06
春节档电影《哪吒之魔童闹海》(以下称《哪吒2》)将在当地时间2月12日起于北美地区开启特别制式点映,2月14日正式上映。目前预售场次火爆,上座率达90%以上,多个热门场次均已售罄,一...
02-10
1月17日,国家统计局发布2024年中国经济年报:初步核算,2024年国内生产总值比上年增长5.0%;全国城镇调查失业率平均值为5.1%,比上年下降0.1个百分点;居民人...
01-21
英国曼彻斯特大学和法国斯特拉斯堡大学组成研究团队共同创造了一种新的人工微型电机。它的设计灵感来源于人体内的蛋白质,通过模仿“驱动生命”的自...
01-24
    2月3日拍摄的华山群峰(无人机照片)。  春节假期,位于陕西省渭南市的西岳华山迎来游览高...
02-06
    春节期间,记者走访市场发现,在黄金热卖的同时,2025版熊猫金币也“萌”出圈,以“颜值+保值”...
02-18
  每单上涨一两元 年货寄递与保障并行  记者 何倩  春节临近,年货寄递热度不减。1月19日,北京商报记者走访多家快递企业了解到,受电商促销影响,部分网点年货快递量同比增...
01-21
  中新经纬1月17日电 国务院国资委企业改革局局长林庆苗表示,将继续开展新公司组建、加大力度推进战略性重组。  17日,国新办举行“中国经济高质量发展成效”系列新闻发布...
01-21
到底要不要贴车衣?刚刚入手新车的朋友常常发出这一疑问。作为保护车漆的第一道防线,车衣,正被越来越多的年轻车主钟情,他们该省省、该花花,买完新车、就贴车衣,用以保护爱车的车漆...
01-21
1 月 26 日消息,宝马首席开发官 Frank Webber 近日在接受 Motor Authority 采访时表示,iDrive X 的屏幕已经足够大,没有必要继续增大。“如果车内有太大的屏幕,会让你与...
01-27
随着电视剧的热播,“难哄温以凡在大伯家遭遇了什么”引起了广大粉丝的关注。该剧凭借精彩的剧情、精良的制作和精湛的演技,一经播出便受到观众的一致好评,并拿...
02-20
《余烬之上》男主是谁啊?余烬之上背后的boss是谁?‌《余烬之上》的男主角是王子奇和孙阳。‌王子奇饰演的廖思远是一个天才破案少年,因童年创伤患上“解离性人...
02-21
这里是《21健讯Daily》,欢迎与21世纪经济报道新健康团队共同关注医药健康行业最新事件!政策动向国家药监局药审中心回应个别品种数据重复,系...
01-27
21世纪经济报道记者李佳英 广州报道春节期间,中国台湾知名艺人徐熙媛(大S)不幸离世,享年48岁。根据世界卫生组织(WHO)的数据,在全球范围内,流感每...
02-04
暑假是每一个孩子向往的假期,但也是很多家长头痛的假期。孩子每天看,好多暑期社会实践活动、公益活动,到底要怎么去完成?当你还在发愁的时候,童学会小记者们已经跟着我们的...
01-21
2025年辽宁省普通高等学校艺术类专业招生简章  一、艺术类考生高考报名  艺术类考生高考报名工作按...
01-21
  在我国人口老龄化加速的大背景下,养老金融成为社会关注的焦点。中共中央、国务院近日出台的...
01-21
  1月17日,中国人民银行北京市分行发布行政处罚信息,北京农村商业银行股份有限公司因提供虚假的...
01-22
摩羯座的男性通常被认为是稳重、踏实、有责任感的代表。他们注重事业和目标,对自己和周...
01-22
水瓶座男生以其独特的个性和思维方式而闻名。他们聪明、创新、理性,善于思考和分析问题...
01-22
lv包包排行榜? LV包包质量?lv包包排行榜?1、Keepall:Keepall无疑是lv最经典的包包之一,1930年推出的Keepall包袋是第一个适用于短途旅行的软式行李袋,不仅简便易携带,更是首次开启...
02-12
邹开云:打破常规的模特之路,反串时尚引发关注在时尚界,常常会出现一些颠覆传统的现象,今天你是否听说过邹开云?他是一位反串模特,以非凡的才华和独特的风格走入了大众视野。通过反...
02-17
与其被动防守,不如主动出击。近年来,随着各行业竞争日趋白热化,内卷现象不断加剧。面对生存压力,互联网巨头们在巩固核心业务的同时,愈发迫切地需要拓展多元化布局。这一战略转...
02-18
阿里巴巴港股成交额突破440亿港元,创历史天量,盘中股价涨超15%。消息面上,阿里巴巴昨日发布2025财年第三财季业绩公告。财报显示,阿里巴巴第三财季收入2801.54亿元,同比增长8%;经...
02-22
消费降级席卷全球。奢侈品行业巨头开云集团最新发布的数据显示,去年第四季度销售额按可比口径下降12%,为43.9亿欧元。2024年经常性...
02-12
2月24日消息,Airbnb爱彼迎中国最新发布2025年春季出境游趋势报告,清明小长假作为春季出游的首个高峰节点,出境游热度较去年同期接近翻倍,日本、泰国、韩国、美国、新西兰、法国...
02-25
近日,流程工业一体化方案解决商广东智子智能技术有限公司(以下称“智子智能”)完成近亿元融资,由达晨财智领投,苏创投·国发创投跟投。据了解,本轮融资...
02-07
2025年,电影《哪吒2》爆火,一个河南85后成了最大赢家。作者 | 老高来源 | 投资家(ID:touzijias)2025年,电影《哪吒2》爆火,一个河南85后成了最大赢家。近日,“全球领先的潮流文化娱...
02-09
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮