A-A+
新书交流《用于反馈控制的强化学习与近似动态规划》
按照Lendaris对控制工程和科学发展阶段的划分[1]:第一阶段为反馈机制的引入;第二阶段的特点是通过微分方程对动态系统进行分析,Fourier和Laplace变换,状态空间法、随机方法、Hilbert空间等数学工具奠定了控制系统分析的理论基础,在此基础上发展起了经典控制、现代控制。最优控制、随机控制和鲁棒控制等理论和方法。第三阶段的特点是可在线选择控制器,如自适应控制和学习控制,通过状态观测和性能评价在一个特定的控制器集合内在线选择控制器,却仍不具备经验策略的记忆能力。Lendaris认为第四阶段的控制系统应该是具有经验记忆能力的,能够利用以往的经验更为有效、高效地实施控制。
此书的作者(包括各章节作者)都是控制界的世界顶级专家。
Reinforcement Learning and Approximate Dynamic Programming for Feedback Controlhttp://www.wiley.com/WileyCDA/WileyTitle/productCd-111810420X.html ISBN: 978-1-1181-0420-0
Hardcover
648 pages
December 2012, Wiley-IEEE Press
|
分析的很透彻,很欣赏你的看法,学习了。