机读格式显示(MARC)
- 000 01758nam0 2200337 450
- 010 __ |a 978-7-115-63395-8 |d CNY139.80
- 100 __ |a 20240330d2024 em y0chiy50 ea
- 200 1_ |a 智能控制与强化学习先进值迭代评判设计 |A zhi neng kong zhi yu qiang hua xue xi xian jin zhi die dai ping pan she ji |e 先进值迭代评判设计 |d = Intelligent control and reinforcement learning |e advanced value iteration critic design |f 王鼎 ... [等] 著 |z eng
- 210 __ |a 北京 |c 人民邮电出版社 |d 2024
- 215 __ |a 236页 |c 图 |d 23cm
- 304 __ |a 题名页题其余责任者: 赵明明, 哈明鸣, 任进
- 330 __ |a 本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。
- 510 1_ |a Intelligent control and reinforcement learning |e advanced value iteration critic design |z eng
- 517 1_ |a 先进值迭代评判设计 |A xian jin zhi die dai ping pan she ji
- 606 0_ |a 智能控制 |A zhi neng kong zhi
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _0 |a 王鼎 |A wang ding |4 著
- 701 _0 |a 赵明明 |A zhao ming ming |4 著
- 701 _0 |a 哈明鸣 |A ha ming ming |4 著
- 701 _0 |a 任进 |A ren jin |4 著
- 801 _0 |a CN |b WFKJXY |c 20240715
- 905 __ |a WFKJXY |d TP273/173