科教学术

自动化学院(人工智能学院)李连鹏团队在《自动化学报》发文:基于PIRL的空间机械臂仿生智能抓取方法

近日,我校自动化学院(人工智能学院)李连鹏副教授团队联合北京控制工程研究所、空间智能控制技术全国重点实验室,紧扣《国家空间科学中长期发展规划(2024—2050年)》与航天强国、深空探测重大战略需求,在空间机械臂仿生智能抓取方向取得突破性研究成果。相关论文以 “基于PIRL的空间机械臂仿生智能抓取方法” 为题,在线发表于控制领域权威中文期刊《自动化学报》,李连鹏副教授为第一作者。论文链接https://aas.net.cn/cn/article/doi/10.16383/j.aas.c250686

空间机械臂在微重力环境执行漂浮目标自主抓取任务时,长期面临样本获取困难、泛化能力弱、动态扰动适应性差等关键技术瓶颈,传统控制方法难以满足在轨高精度、高鲁棒性作业需求。针对这一难题,团队创新提出渐进式模仿强化学习方法(PIRL),构建了一套完整的空间机械臂仿生智能抓取技术体系。

图1 PIRL方法图

研究中,团队构建real-to-sim 虚实映射理论框架,实现人手姿态到灵巧手 20 关节动作的精准实时映射与专家数据高效获取;提出基于SE (3) 齐次变换的相对位姿建模与接近—抓 —后抓取移动仿生序贯轨迹解耦方法,从单次演示生成全域覆盖样本,从理论上解决空间任务样本稀缺难题;策略学习采用3 层 MLP 网络结合行为克隆完成仿生模仿初始化,再嵌入 Genesis 高保真仿真环境,以改进PPO‑GS 算法实施在线微调,通过叠加式动作空间与分阶段混合奖励机制,实现专家先验与环境探索的协同优化。

图2 灵巧手映射实验

实验结果表明,在目标随机位姿扰动下,该方法抓取成功率达89.5%,较传统模仿学习提升 14.5%,策略鲁棒性与环境适应能力显著增强,可满足空间机械臂实时控制与稳定作业需求,为微重力环境下空间机械臂漂浮目标自主抓取提供了新型解决方案。

图3 空间站在轨作业模型

图4 仿生序贯轨迹解耦与样本生成

该研究得到国家自然科学基金、北京市自然科学基金、空间智能控制技术全国重点实验室基金等项目资助。研究成果为空间机械臂自主抓取任务提供了全新技术思路与可行方案,可为空间智能操控、机器人自主作业等相关领域的理论研究与工程应用提供重要参考。团队搭建的仿真平台、算法框架与实验系统,可为本科生、研究生提供工程化科研训练条件,助力培养兼具理论创新与工程实现能力的复合型人才。

未来,团队将继续围绕空间智能操作核心技术开展攻关,进一步拓展多目标通用抓取策略,力争在视觉位姿估计、物理实验验证等方向取得新进展,服务国家深空探测与航天强国建设。(供稿/图片:自动化学院 编辑/审核:郭辉)

《自动化学报》期刊简介:

《自动化学报》由中国自动化学会、中国科学院自动化研究所共同主办,1963 年创刊,是我国自动化领域极具权威性的高级学术期刊,被 EI、中文核心、中国科技核心、Scopus、英国科学文摘等国内外重要数据库收录,入选中国科技期刊卓越行动计划、中国科协T1级高质量科技期刊,在控制科学与工程领域具有广泛学术影响力与行业权威地位。

单周单篇点击量排名

新闻网各单位用稿量排行榜
(2023年9月)