机读格式显示(MARC)
- 000 01343nam0 2200277 450
- 010 __ |a 978-7-5198-7037-9 |d CNY88.00
- 100 __ |a 20230227d2023 em y0chiy50 ea
- 200 1_ |a 基于Python的强化学习 |A ji yu python de qiang hua xue xi |f (美) 安德里亚·隆萨著 |d = Reinforcement learning algorithms with python |f Andrea Lonza |g 刘继红, 王瑞文译 |z eng
- 210 __ |a 北京 |c 中国电力出版社 |d 2023
- 215 __ |a 265页 |c 图 |d 24cm
- 330 __ |a 本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。
- 500 10 |a Reinforcement learning algorithms with python |A Reinforcement Learning Algorithms With Python |m chi
- 606 0_ |a 程序语言 |A Cheng Xu Yu Yan |x 程序设计
- 701 _1 |a 隆萨 |A long sa |g (Lonza, Andrea) |4 著
- 702 _0 |a 刘继红 |A liu ji hong |4 译
- 702 _0 |a 王瑞文 |A wang rui wen |4 译
- 801 _0 |a CN |b 人天书店 |c 20230227
- 905 __ |a WFKJXY |d TP312/808