0


机器人的学习能力

Machine Learning for Robotics
课程网址: http://videolectures.net/ecmlpkdd2012_abbeel_learning_robotics/  
主讲教师: Pieter Abbeel
开课单位: 加州大学伯克利分校
开课时间: 2012-10-29
课程语种: 英语
中文简介:
机器人在自主模式下的能力通常远远低于远程操作模式。少数例外情况往往源于特定机器人及其操作环境的专家工程的漫长日子(更常见的是数周甚至数年)。目前的控制方法非常缓慢且耗费人力。我相信机器学习的进步有可能彻底改变机器人技术。在本次演讲中,我将介绍我们开发的针对机器人技术的新机器学习技术。我将深入描述“学徒学习”,这是一种基于学习专家人类演示集合控制的高性能机器人控制的新方法。我们在学徒学习方面的初步工作使迄今为止最先进机器人在自主模式下的能力通常远不如在远程操作模式下。少数例外情况往往源于对特定机器人及其操作环境进行长时间(更常见的是几周,甚至几年)的专业工程设计。目前的控制方法是相当缓慢和劳动密集型。我相信机器学习的进步有可能彻底改变机器人技术。在这次演讲中,我将介绍我们为机器人量身定制的新机器学习技术。我将深入描述“学徒学习”,这是一种高性能机器人控制的新方法,基于从专家演示的集成中学习控制。我们最初的学徒学习工作已经使最先进的直升机特技,包括演习,如混沌,井字-tocs,和自动旋转降落,只有特殊的人类飞行员才能飞行。我们最近在学徒学习方面的工作是为学习执行具有挑战性的机器人操作任务提供动力,比如打结。我还将简要地强调机器人技术发展的另外三个机器学习:逆强化学习及其在四足动物运动中的应用,增强学习中的安全探索,使机器人能够自主学习,以及应用于机器人洗衣的感知学习。的直升机特技飞行,包括混乱,抽动和自动旋转着陆等机动,只有特殊的人类飞行员才能飞行。我们最近在学徒学习方面的工作是提供学习的动力,以执行具有挑战性的机器人操作任务,例如打结。我还将简要介绍机器人技术发展的另外三个机器学习:逆向强化学习及其在四足动作中的应用,强化学习中的安全探索,使机器人能够自己学习,以及应用于机器人洗衣的学习感知。
课程简介: Robots are typically far less capable in autonomous mode than in tele-operated mode. The few exceptions tend to stem from long days (and more often weeks, or even years) of expert engineering for a specific robot and its operating environment. Current control methodology is quite slow and labor intensive. I believe advances in machine learning have the potential to revolutionize robotics. In this talk, I will present new machine learning techniques we have developed that are tailored to robotics. I will describe in depth “Apprenticeship learning,” a new approach to high-performance robot control based on learning for control from ensembles of expert human demonstrations. Our initial work in apprenticeship learning has enabled the most advanced helicopter aerobatics to-date, including maneuvers such as chaos, tic-tocs, and auto-rotation landings which only exceptional expert human pilots can fly. Our most recent work in apprenticeship learning is providing traction on learning to perform challenging robotic manipulation tasks, such as knot-tying. I will also briefly highlight three other machine learning for robotics developments: Inverse reinforcement learning and its application to quadruped locomotion, Safe exploration in reinforcement learning which enables robots to learn on their own, and Learning for perception with application to robotic laundry.
关 键 词: 机器人; 人工智能; 学习能力; 机器人模拟器; 学习行为策略
课程来源: 视频讲座网公开课
最后编审: 2019-05-26:cwx
阅读次数: 119