机读格式显示(MARC)

000 01621nam0 2200289 450

001 0000854172

005 20250815135414.0

010 __ |a 978-7-122-47575-6 |d CNY109.00

092 __ |a CN |b 人天1188-3335

100 __ |a 20250814d2025 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a a 000yy

106 __ |a r

200 1_ |a 深度强化学习算法原理与实战 |A shen du qiang hua xue xi suan fa yuan li yu shi zhan |d = DRL deep reinforcement learning |e 基于MATLAB |f 郑一编著 |z eng

210 __ |a 北京 |c 化学工业出版社 |d 2025.09

215 __ |a 339页 |c 图 |d 26cm

320 __ |a 有书目 (第335-336页)

330 __ |a 本书在详细阐述强化学习基础概念与基本理论的基础上, 循序渐进地介绍了深度强化学习各常用算法的基本思想、算法原理、算法实现、基于实例的算法演示与分析等内容。书中具体介绍了Q-learning算法求解最优路径问题, SARSA算法求解最优安全路径问题, 策略迭代算法求解两地租车最优调度问题, 价值迭代算法求解最优路径问题, DQN算法求解平衡系统的最优控制问题, PG算法求解双积分系统的最优控制问题, AC类算法求解股票交易的最优推荐策略, SAC算法控制机器人手臂执行控球平衡任务, PPO算法求解飞行器平稳着陆最优控制问题, DDPG算法求解四足机器人行走控制策略问题, TD3算法求解PID控制器参数整定问题, 多智能体强化学习的基本概念与基本方法, MAPPO算法求解多智能体协作运送物体问题, IPPO算法与MAPPO算法求解协作竞争探索区域问题, MADDPG与DDPG算法求解车辆路径跟踪控制问题。

510 1_ |a DRL deep reinforcement learning |z eng

606 0_ |a 机器学习 |A ji qi xue xi |x 算法

690 __ |a TP181 |v 5

701 _0 |a 郑一 |A zheng yi |4 编著

801 _0 |a CN |b 人天书店 |c 20250814

902 __ |a Rt1172-2570

962 __ |a 92597684 |x 70063408a634af6811bfd057ab8bbe

997 __ |a 可供