首页> 中文学位 >机械臂运动的示教学习方法与应用研究
【6h】

机械臂运动的示教学习方法与应用研究

代理获取

目录

声明

致谢

摘要

图目录

表目录

1.1 背景和意义

1.2 研究现状

1.2.1 数据获取

1.2.2 动作策略学习

1.2.3 动作回报学习

1.2.4 外力估计

1.3 本文研究内容和主要贡献

1.4 本文组织结构

2.1 引言

2.2 示教动作的人机对应

2.2.1 仿射空间与仿射变换

2.2.2 基于仿射变换的人机动作对应

2.3 动作建模及泛化

2.3.1 基于高斯混合模型的动作建模方法

2.3.2 结合高斯混合模型和动态运动单元的动作生成方法

2.4 关节运动轨迹生成

2.4.1 基于序列二次规划的关节运动轨迹生成

2.4.2 初值选择

2.5 实验结果

2.5.1 数据采集

2.5.2 人机动作对应结果

2.5.3 仿人动作的建模和泛化结果

2.5.4 关节轨迹生成算法的效果

2.6 本章小结

3.1 引言

3.2 动作分段与回报学习

3.2.1 问题描述

3.2.2 基于滑动窗口轨迹的逆强化学习算法

3.2.3 基于动态规划的分段点搜索优化算法

3.3 动作生成

3.3.1 目标泛函的构建

3.3.2 目标泛函的优化

3.4 实验结果

3.4.1 仿真操作任务

3.4.2 水杯搬运任务

3.5 本章小结

第4章 基于扰动卡尔曼滤波器的未知外力估计与碰撞响应

4.1 引言

4.2 系统框架

4.3 半参数逆动力学模型辨识方法

4.3.1 刚体动力学模型辨识

4.3.2 基于多层感知机的模型误差补偿

4.4 扰动卡尔曼滤波器

4.4.1 过程模型和观测模型

4.4.2 扰动卡尔曼滤波算法

4.5 保证安全的碰撞检测和响应策略

4.5.1 碰撞检测

4.5.2 安全响应

4.6 实验结果

4.6.1 逆动力学模型建模结果

4.6.2 外力估计结果

4.6.3 碰撞检测和安全响应结果

4.7 本章小结

5.1 总结

5.2 展望

参考文献

作者简历

攻读博士学位期间的主要研究成果

展开▼

摘要

运动规划是机器人系统的核心关键技术之一。现阶段的机器人运动规划所包含的专业知识对普通用户设置较高门槛,极大地限制了机器人的大规模推广。示教学习方法提供了一种简单直观的机器人运动规划方法,能够大大降低机器人的学习使用成本。但示教学习方法在机器人系统上的部署应用需要解决多方面的问题,包括动作学习过程中人机对应、动作表示与建模、泛化动作生成等问题以及动作执行过程中未知外力影响下的运动控制等问题。在这一背景下,本文围绕机器人的运动规划与控制任务,首先针对示教学习中人机对应、动作表示与建模、动作泛化等多方面的问题做出相应分析,提出动作策略学习和动作回报学习的框架和具体方法,然后面对未知外力给动作执行带来的影响,深入研究了外力估计这一问题,在动力学建模、观测器与控制器设计等方面提出一套完整的解决方案。
  本文研究成果主要包括:
  (1)提出了一套面向仿人型机械臂系统的动作策略学习方法。首先为解决人机间结构和运动能力差异带来的示教数据对应问题,提出改进的仿射变换方法,能够保证手臂末端和肘部的位置跟踪精度且保持人体动作数据的仿射不变性。完成人机对应后,提出同时学习末端和肘部运动轨迹的概率建模方法,能够保证动作的仿人性并建模多组示教数据的不确定性。为快速生成适应新环境的运动轨迹,提出结合动态运动单元和所学习的概率模型来分别生成末端和肘部轨迹的方法。为了让机械臂同时跟踪新生成的末端和肘部轨迹,提出基于序列二次规划的关节轨迹生成方法,并提出基于弗雷歇距离的关节角选择算法来初始化关节轨迹生成方法。所提出方法在仿人型机械臂的乒乓球挥拍动作学习的任务中进行了验证。实验结果表明所提出方法能够保证人机对应和学习泛化所得到的动作的仿人性,生成关节轨迹的成功率高、优化时间短。
  (2)提出了一种多阶段动作回报学习方法。针对示教数据的分阶段局部最优特性,即示教轨迹的不同阶段对应不同回报函数,提出同步轨迹分段与回报学习方法。该方法首先使用基于采样的逆强化学习算法提取加窗轨迹段特征,通过比较相邻窗口轨迹段的特征得到初始分段点,然后基于动态规划方法在初始分段点的邻域搜索最优分段点,最后使用基于采样的逆强化学习算法得到各子阶段的回报函数。该方法的优点是不对回报函数的个数和类型做出限制,并且所得到的回报函数适用于机械臂动作规划这一具有高维连续状态空间的任务。为生成新运动轨迹,提出基于泛函优化的轨迹生成方法。该方法结合学习到的子阶段回报函数及其他约束项如避障、到点约束来生成总的轨迹回报泛函,并采用泛函梯度方法生成新轨迹。所提出方法在仿真环境中的零件操作实验和真实环境中的水杯搬运实验中进行了验证。实验结果表明所提出同步轨迹分段与回报学习方法对于示教数据分段结果更加准确,所学到的各子阶段回报函数能够准确表示相应阶段的运动性质,并且动作生成方法得到的轨迹能够适应新的任务场景并符合各子阶段的运动性质。
  (3)提出了结合半参数模型和扰动卡尔曼滤波器的未知外力估计方法。该方法分为建模和观测器设计两个主要步骤。在建模步骤,提出半参数逆动力学建模方法。该方法先训练参数化的刚体动力学模型,然后加入非参数化的多层感知机神经网络模型来补偿参数化模型的建模误差。得到的半参数逆动力学模型兼具物理意义明确与建模误差小的优点。在观测器设计步骤,提出一种名为扰动卡尔曼滤波器的观测器设计方法。扰动卡尔曼滤波器的过程模型方程同时考虑了机械臂逆动力学模型和外力矩动力学模型,并被重构为线性时不变系统,无需计算系统雅克比矩阵。为了提高作业执行安全性,提出基于扰动卡尔曼滤波器的机械臂碰撞检测和安全响应的控制方法。所提出建模、估计和控制方法通过仿真和实物实验进行了验证。实验结果表明所提出方法能够提高机械臂逆动力学建模精度,提高外力估计结果的准确性和鲁棒性,并有效检测碰撞的发生并做出安全响应。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号