机读格式显示(MARC)

000 00873nam 2200157 450

001 0000842398

010 __ |a 9787302685913 |d CNY99.00

100 __ |a 20250909d2025 ekmy0chiy50 ea

101 0_ |a chi

200 0_ |a 强化学习基础、原理与应用 |f 张百珂编著

210 __ |c 清华大学出版社 |d 2025.5 |a 北京

215 __ |a 394页 |d 26cm

330 __ |a 本书共分为17章, 主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、Q-learning与贝尔曼方程、时序差分学习和SARSA算法、DQN算法、DDQN算法、竞争DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战: Predator-Prey游戏及自动驾驶系统。

333 __ |a 本书适用于已经了解Python语言基础语法的读者, 想进一步学习强化学习、机器学习、深度学习及相关技术的读者, 还可作为大专院校相关专业的师生用书和培训机构的教材使用

606 0_ |a 面向对象语言 |x 程序设计 |x 程序设计

690 __ |a TP312.8PY