0


从示例轨迹发现选项

Discovering Options from Example Trajectories
课程网址: http://videolectures.net/icml09_zang_dofe/  
主讲教师: Peng Zang
开课单位: 佐治亚理工学院
开课时间: 2009-08-26
课程语种: 英语
中文简介:
我们提出了一种新的自动问题分解技术,以解决强化学习中可扩展性的问题。我们的技术利用一组接近最优的轨迹来发现{\ it选项}并将它们整合到学习过程中,大大减少了解决潜在问题所需的时间。我们在两个不同的领域进行了一系列实验,结果表明我们的方法可以在基线上提供高达30倍的加速。
课程简介: We present a novel technique for automated problem decomposition to address the problem of scalability in Reinforcement Learning. Our technique makes use of a set of near-optimal trajectories to discover {\it options} and incorporates them into the learning process, dramatically reducing the time it takes to solve the underlying problem. We run a series of experiments in two different domains and show that our method offers up to 30 fold speedup over the baseline.
关 键 词: 自动问题分解; 可扩展性; 潜在问题
课程来源: 视频讲座网
最后编审: 2019-04-24:cwx
阅读次数: 28