从示例轨迹发现选项Discovering Options from Example Trajectories |
|
课程网址: | http://videolectures.net/icml09_zang_dofe/ |
主讲教师: | Peng Zang |
开课单位: | 佐治亚理工学院 |
开课时间: | 2009-08-26 |
课程语种: | 英语 |
中文简介: | 我们提出了一种新的自动问题分解技术,以解决强化学习中可扩展性的问题。我们的技术利用一组接近最优的轨迹来发现{\ it选项}并将它们整合到学习过程中,大大减少了解决潜在问题所需的时间。我们在两个不同的领域进行了一系列实验,结果表明我们的方法可以在基线上提供高达30倍的加速。 |
课程简介: | We present a novel technique for automated problem decomposition to address the problem of scalability in Reinforcement Learning. Our technique makes use of a set of near-optimal trajectories to discover {\it options} and incorporates them into the learning process, dramatically reducing the time it takes to solve the underlying problem. We run a series of experiments in two different domains and show that our method offers up to 30 fold speedup over the baseline. |
关 键 词: | 自动问题分解; 可扩展性; 潜在问题 |
课程来源: | 视频讲座网 |
最后编审: | 2019-04-24:cwx |
阅读次数: | 33 |