MARC状态:审校 文献类型:中文图书 浏览次数:11
- 题名/责任者:
- 智能控制与强化学习先进值迭代评判设计:先进值迭代评判设计/王鼎 ... [等] 著
- 出版发行项:
- 北京:人民邮电出版社,2024
- ISBN及定价:
- 978-7-115-63395-8/CNY139.80
- 载体形态项:
- 236页:图;23cm
- 并列正题名:
- Intelligent control and reinforcement learning:advanced value iteration critic design
- 其它题名:
- 先进值迭代评判设计
- 个人责任者:
- 王鼎 著
- 个人责任者:
- 赵明明 著
- 个人责任者:
- 哈明鸣 著
- 个人责任者:
- 任进 著
- 学科主题:
- 智能控制
- 学科主题:
- 机器学习
- 中图法分类号:
- TP273
- 中图法分类号:
- TP181
- 题名责任附注:
- 题名页题其余责任者: 赵明明, 哈明鸣, 任进
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP273/173 | 2252218 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 |
显示全部馆藏信息