机读格式显示(MARC)
- 010 __ |a 9787302685913 |d CNY99.00
- 100 __ |a 20250909d2025 ekmy0chiy50 ea
- 200 0_ |a 强化学习基础、原理与应用 |f 张百珂编著
- 210 __ |c 清华大学出版社 |d 2025.5 |a 北京
- 330 __ |a 本书共分为17章, 主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、Q-learning与贝尔曼方程、时序差分学习和SARSA算法、DQN算法、DDQN算法、竞争DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战: Predator-Prey游戏及自动驾驶系统。
- 333 __ |a 本书适用于已经了解Python语言基础语法的读者, 想进一步学习强化学习、机器学习、深度学习及相关技术的读者, 还可作为大专院校相关专业的师生用书和培训机构的教材使用
- 606 0_ |a 面向对象语言 |x 程序设计 |x 程序设计