A-A+

新书交流《用于反馈控制的强化学习与近似动态规划》

2013年01月31日 Resource 评论 1 条 阅读 37,653 次

按照Lendaris对控制工程和科学发展阶段的划分[1]:第一阶段为反馈机制的引入;第二阶段的特点是通过微分方程对动态系统进行分析,Fourier和Laplace变换,状态空间法、随机方法、Hilbert空间等数学工具奠定了控制系统分析的理论基础,在此基础上发展起了经典控制、现代控制。最优控制、随机控制和鲁棒控制等理论和方法。第三阶段的特点是可在线选择控制器,如自适应控制和学习控制,通过状态观测和性能评价在一个特定的控制器集合内在线选择控制器,却仍不具备经验策略的记忆能力。Lendaris认为第四阶段的控制系统应该是具有经验记忆能力的,能够利用以往的经验更为有效、高效地实施控制。

 

此书的作者(包括各章节作者)都是控制界的世界顶级专家。

其中刘德荣教授已经通过千人计划回国工作。
http://www.tnnls.org/book.html
 
 
 

Reinforcement Learning and Approximate Dynamic Programming for Feedback Control

http://www.wiley.com/WileyCDA/WileyTitle/productCd-111810420X.html

ISBN: 978-1-1181-0420-0
Hardcover
648 pages
December 2012, Wiley-IEEE Press

1 条留言  访客:1 条  博主:0 条

  1. 列车时刻表及票价查询

    分析的很透彻,很欣赏你的看法,学习了。

给我留言

Copyright © ExBot易科机器人实验室 保留所有权利.   Theme   Robin modified by poyoten

用户登录

分享到: