机读格式显示(MARC)
- 000 01621nam0 2200289 450
- 010 __ |a 978-7-122-47575-6 |d CNY109.00
- 092 __ |a CN |b 人天1188-3335
- 100 __ |a 20250814d2025 em y0chiy50 ea
- 200 1_ |a 深度强化学习算法原理与实战 |A shen du qiang hua xue xi suan fa yuan li yu shi zhan |d = DRL deep reinforcement learning |e 基于MATLAB |f 郑一编著 |z eng
- 210 __ |a 北京 |c 化学工业出版社 |d 2025.09
- 215 __ |a 339页 |c 图 |d 26cm
- 320 __ |a 有书目 (第335-336页)
- 330 __ |a 本书在详细阐述强化学习基础概念与基本理论的基础上, 循序渐进地介绍了深度强化学习各常用算法的基本思想、算法原理、算法实现、基于实例的算法演示与分析等内容。书中具体介绍了Q-learning算法求解最优路径问题, SARSA算法求解最优安全路径问题, 策略迭代算法求解两地租车最优调度问题, 价值迭代算法求解最优路径问题, DQN算法求解平衡系统的最优控制问题, PG算法求解双积分系统的最优控制问题, AC类算法求解股票交易的最优推荐策略, SAC算法控制机器人手臂执行控球平衡任务, PPO算法求解飞行器平稳着陆最优控制问题, DDPG算法求解四足机器人行走控制策略问题, TD3算法求解PID控制器参数整定问题, 多智能体强化学习的基本概念与基本方法, MAPPO算法求解多智能体协作运送物体问题, IPPO算法与MAPPO算法求解协作竞争探索区域问题, MADDPG与DDPG算法求解车辆路径跟踪控制问题。
- 510 1_ |a DRL deep reinforcement learning |z eng
- 606 0_ |a 机器学习 |A ji qi xue xi |x 算法
- 701 _0 |a 郑一 |A zheng yi |4 编著
- 801 _0 |a CN |b 人天书店 |c 20250814
- 962 __ |a 92597684 |x 70063408a634af6811bfd057ab8bbe