0


模仿学习和有意义的预测:概率和非概率方法

Imitation Learning and Purposeful Prediction: Probabilistic and Non-probabilistic Methods
课程网址: http://videolectures.net/nipsworkshops09_bagnell_ilpppnm/  
主讲教师: Drew Bagnell
开课单位: 卡内基梅隆大学
开课时间: 2010-01-19
课程语种: 英语
中文简介:
编程机器人的行为仍然是一个具有挑战性的任务。虽然它往往是简单的抽象定义甚至显示所需的行为,设计一个控制器,具有相同的行为是困难的,费时和昂贵的,最终的。机器学习范式提供的承诺,使“开发高性能的机器人系统的编程示范”。不幸的是,许多“行为克隆”的方法,利用监督学习的经典工具(如决策树,神经网络,支持向量机)不适合现代机器人系统的需要。经典统计和监督的机器学习存在于真空之中:预测由这些算法被明确认为不会影响它们在其中运作的世界。在实践中,机器人系统往往是建立在先进的规划算法,有效的原因到遥远的未来;因此,在有监督的学习方法往往会导致近视和质量机器人性能较差,忽略这些规划算法代替。在规划算法已在许多现实世界的应用范围从腿的运动到室外非结构化导航的成功,这样的算法依赖于完全指定的成本函数映射的传感器读数和环境模型来量化的成本。这样的成本函数通常是手工设计和编程。最近,我们已经开发了一套技术,学习这些功能从人的示范。这些算法采用逆最优控制(IOC)找到其中一个成本函数法的计划行为模拟专家的论证。我将讨论这些方法,概率,否则,模仿学习。我会集中在因果关系的最大熵,推广了经典的最大熵原理,广泛应用于许多领域包括物理,统计,计算机视觉,对决策和控制问题。这使得Maxent推广应用于新的包括逆最优控制和活性预测类问题。该方法进一步阐明概率推理和最优控制之间的亲密关系。我会在活动预测的司机和行人以及模仿机器人的运动和崎岖的地形导航学习思考的案例研究。这些案例研究突出的算法在实际的设置,采用先进的规划者和有效率的要求和不完善的专家论证约束应用的关键挑战。
课程简介: 编程机器人的行为仍然是一个具有挑战性的任务。虽然它往往是简单的抽象定义甚至显示所需的行为,设计一个控制器,具有相同的行为是困难的,费时和昂贵的,最终的。机器学习范式提供的承诺,使“开发高性能的机器人系统的编程示范”。不幸的是,许多“行为克隆”的方法,利用监督学习的经典工具(如决策树,神经网络,支持向量机)不适合现代机器人系统的需要。经典统计和监督的机器学习存在于真空之中:预测由这些算法被明确认为不会影响它们在其中运作的世界。在实践中,机器人系统往往是建立在先进的规划算法,有效的原因到遥远的未来;因此,在有监督的学习方法往往会导致近视和质量机器人性能较差,忽略这些规划算法代替。在规划算法已在许多现实世界的应用范围从腿的运动到室外非结构化导航的成功,这样的算法依赖于完全指定的成本函数映射的传感器读数和环境模型来量化的成本。这样的成本函数通常是手工设计和编程。最近,我们已经开发了一套技术,学习这些功能从人的示范。这些算法采用逆最优控制(IOC)找到其中一个成本函数法的计划行为模拟专家的论证。我将讨论这些方法,概率,否则,模仿学习。我会集中在因果关系的最大熵,推广了经典的最大熵原理,广泛应用于许多领域包括物理,统计,计算机视觉,对决策和控制问题。这使得Maxent推广应用于新的包括逆最优控制和活性预测类问题。该方法进一步阐明概率推理和最优控制之间的亲密关系。我会在活动预测的司机和行人以及模仿机器人的运动和崎岖的地形导航学习思考的案例研究。这些案例研究突出的算法在实际的设置,采用先进的规划者和有效率的要求和不完善的专家论证约束应用的关键挑战。
关 键 词: 编程机器人; 控制器; 传感器
课程来源: 视频讲座网
最后编审: 2020-06-01:吴雨秋(课程编辑志愿者)
阅读次数: 53