详情

李雅普诺夫神经网络约束下的安全强化学习

申报人:刘哲 申报日期:2023-10-09

基本情况

第二十八期“上海交通大学大学生创新实践计划”
李雅普诺夫神经网络约束下的安全强化学习
创新训练项目
工学
自动化类
创新类
电子信息与电气工程学院
刘哲
指导教师
登录状态下查看
指导教师承担国家自然科学基金优青(海外)和国家自然科学基金青年基金,同时主持多项无人驾驶和多机器人相关的企业项目,课题经费来源包括国防单位、华为、海螺科技、中科微至等。指导教师入选国家级海外高层次人才和上海市高层次人才。

指导教师为本申报项目提供实验室软硬件资源支持,提供学生指导本科生科研;提供实验室自主研发的科研设备使用;且实验室在该领域有充分的前期研究基础,为本项目的顺利完成打下坚实基础。

强化学习是一种极具潜力的机器学习方法,其引导智能体以一种接近人类思维的方式,从探索与试错中逐步习得任务策略。近年来,随着强化学习技术开始被应用于四轮车、机械臂、无人机等机器人平台的控制,为了确保机器人在现实环境中的训练可行性,并更好地引导策略生成,如何保障强化学习过程的安全性是一个重要的问题。在本项目中,拟利用神经网络的强大表达能力,生成网络形式表达的李雅普诺夫函数,并利用其将智能体动作限制在特定的集合之内,保障系统的安全性。此外,研究如何降低该方法的时空复杂度,从而提高其对高维复杂机器人系统的适用性。

选题成员

0

指导教师

序号 教师姓名 电子邮箱 所属学院
1 刘哲 登录状态下查看 电子信息与电气工程学院 第一指导教师

选题附件

结束