每天一分钟,带你读遍机器人顶级会议文章

标题:Learning to Sequence Multiple Tasks with Competing Constraints

作者:Anqing Duan, Raffaello Camoriano, Diego Ferigo, Yanlong Huang, Daniele Calandriello, Lorenzo Rosasco, and Daniele Pucci

来源:2019 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)

编译:林只只

审核:黄思宇,孙钦

这是泡泡一分钟推送的第 518 篇文章,和欢迎个人转发朋友圈;其他机构或自媒体如需转载,后台留言申请授权

摘要

模仿学习提供了一个通用框架,在该框架中,机器人可以从人类老师的演示中有效地学习新的运动技能。虽然已取得许多不错的成果,但其中大多数只专注于单运动,而没有考虑多任务排序的问题。可以想象,对不同的单元的任务进行排序可以进一步增强机器人的能力,并避免重复演示。在本文中,我们针对多任务排序问题,将重点放在处理竞争约束(competing constraints)上,该约束是基于笛卡尔和关节轨迹的并行约束产生的。具体来说,我们从信息理论的角度探索机器人的零空间,以便在连续任务之间进行过渡时保持模仿保真度。通过在iCub人形机器人上进行的模拟和真实实验验证了该方法的有效性。

图1 提出的多任务排序方法的说明。首先,演示了几个任务的笛卡尔轨迹和关节轨迹,随后将其用于基于GMR的检索概率轨迹。之后,根据激活函数π,将笛卡尔轨迹与高斯积融合在一起,并使用GMM对关节轨迹进行建模。最后,通过优化机器人零空间参数Θ处理竞争约束。

图2 GMM对已展示的用于拾取和放置任务(上行)和清洁任务(下行)的笛卡尔轨迹进行建模。灰色轨迹表示多次试验,红色椭圆表示GMM中的高斯分量

图3演示拾取和放置任务的关节轨迹的GMM建模(肩的翻滚角和偏航角,以及手肘),下一行为清洁任务的。灰色轨迹代表多次试验,红色椭圆代表GMM中的高斯分量。

图4 截图:顶部行为拾取和放置任务,底部行为清洁任务。

图5 笛卡尔轨迹排序(顶部行)及其相应的激活函数(底部行)。蓝色轨迹代表拾取和放置任务,红色轨迹代表清洗任务,绿色轨迹代表排序结果。

图6 具有最佳零空间参数(OPT)和逆运动学(IK)的关节轨迹比较。还包括两个任务的关节轨迹以供参考。

图7 学习最佳零空间参数,基于KL散度的损失的误差线曲线。竖线表示标准偏差

图8 对两个任务进行排序的结果截图。基于最佳零空间参数的关节轨迹(底部行)的结果比起基于逆运动学的方法(顶部行)表现得更加自然。

Abstract

Imitation learning offers a general framework where robots can efficiently acquire novel motor skills from demonstrations of a human teacher. While many promising achievements have been shown, the majority of them are only focused on single-stroke movements, without taking into account the problem of multi-tasks sequencing. Conceivably, sequencing different atomic tasks can further augment the robot’s capabilities as well as avoid repetitive demonstrations. In this paper, we propose to address the issue of multi-tasks sequencing with emphasis on handling the so-called competing constraints, which emerge due to the existence of the concurrent constraints from Cartesian and joint trajectories. Specifically, we explore the null space of the robot from an information theoretic perspective in order to maintain imitation fidelity during transition between consecutive tasks. The effectiveness of the proposed method is validated through simulated and real experiments on the iCub humanoid robot.

相关文章