讲座18:国家行为模型Lecture 18 - State-action Rewards |
|
课程网址: | http://videolectures.net/stanfordcs229f08_ng_lec18/ |
主讲教师: | Andrew Ng |
开课单位: | 斯坦福大学 |
开课时间: | 2009-05-18 |
课程语种: | 英语 |
中文简介: | 状态作用奖励、有限视界MDP、动力学系统概念、动力学模型示例、线性二次调节(LQR)、非线性模型线性化、计算奖励、Riccati方程 |
课程简介: | State-action Rewards, Finite Horizon MDPs, The Concept of Dynamical Systems, Examples of Dynamical Models, Linear Quadratic Regulation (LQR), Linearizing a Non-Linear Model, Computing Rewards, Riccati Equation |
关 键 词: | 国家行为奖励; 动态模型; 线性化 |
课程来源: | 视频讲座网 |
最后编审: | 2020-06-11:zyk |
阅读次数: | 62 |