2.997 大规模系统中的决策问题2.997 Decision Making in Large Scale Systems |
|
课程网址: | http://ocw.mit.edu/courses/mechanical-engineering/2-997-decision-... |
主讲教师: | Daniela Pucci De Farias |
开课单位: | 麻省理工学院 |
开课时间: | 信息不详。欢迎您在右侧留言补充。 |
课程语种: | 英语 |
中文简介: | 本课程介绍大规模动态规划的理论与应用。主题包括马尔可夫决策过程、动态规划算法、基于仿真的算法、值函数近似的理论和算法,以及策略搜索方法。本课程检视游戏与应用在动态资源分配、财务与排队网路等领域。 |
课程简介: | This course is an introduction to the theory and application of large-scale dynamic programming. Topics include Markov decision processes, dynamic programming algorithms, simulation-based algorithms, theory and algorithms for value function approximation, and policy search methods. The course examines games and applications in areas such as dynamic resource allocation, finance and queueing networks. |
关 键 词: | 算法; 马尔可夫决策过程; 动态规划; 随机模型; 策略迭代; 强化学习; 价值函数逼近; 线性规划; 策略搜索; 策略梯度; 参与者 |
课程来源: | 麻省理工学院公开课 |
最后编审: | 2018-07-18:cmh |
阅读次数: | 116 |