机读格式显示(MARC)

000 01758nam0 2200337 450

001 0000698849

005 20240926143400.0

010 __ |a 978-7-115-63395-8 |d CNY139.80

100 __ |a 20240330d2024 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a a 000yy

106 __ |a r

200 1_ |a 智能控制与强化学习先进值迭代评判设计 |A zhi neng kong zhi yu qiang hua xue xi xian jin zhi die dai ping pan she ji |e 先进值迭代评判设计 |d = Intelligent control and reinforcement learning |e advanced value iteration critic design |f 王鼎 ... [等] 著 |z eng

210 __ |a 北京 |c 人民邮电出版社 |d 2024

215 __ |a 236页 |c 图 |d 23cm

304 __ |a 题名页题其余责任者: 赵明明, 哈明鸣, 任进

320 __ |a 有书目

330 __ |a 本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题, 以实现稳定学习、演化学习和快速学习为目标, 建立一套先进的值迭代评判学习控制理论与设计方法。首先, 对先进值迭代框架下迭代策略的稳定性进行全面深入的分析, 建立一系列适用于不同场景的稳定性判据, 从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次, 基于迭代历史信息, 提出一种新颖的收敛速度可调节的值迭代算法, 有助于加快学习速度、减少计算代价, 更高效地获得非线性系统的最优控制律。结合人工智能技术, 对无模型值迭代评判学习控制的发展前景也进行了讨论。

510 1_ |a Intelligent control and reinforcement learning |e advanced value iteration critic design |z eng

517 1_ |a 先进值迭代评判设计 |A xian jin zhi die dai ping pan she ji

606 0_ |a 智能控制 |A zhi neng kong zhi

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP273 |v 5

690 __ |a TP181 |v 5

701 _0 |a 王鼎 |A wang ding |4 著

701 _0 |a 赵明明 |A zhao ming ming |4 著

701 _0 |a 哈明鸣 |A ha ming ming |4 著

701 _0 |a 任进 |A ren jin |4 著

801 _0 |a CN |b WFKJXY |c 20240715

905 __ |a WFKJXY |d TP273/173