机读格式显示(MARC)

000 01343nam0 2200277 450

001 0000654365

005 20230902185700.0

010 __ |a 978-7-5198-7037-9 |d CNY88.00

100 __ |a 20230227d2023 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a a z 000yy

106 __ |a r

200 1_ |a 基于Python的强化学习 |A ji yu python de qiang hua xue xi |f (美) 安德里亚·隆萨著 |d = Reinforcement learning algorithms with python |f Andrea Lonza |g 刘继红, 王瑞文译 |z eng

210 __ |a 北京 |c 中国电力出版社 |d 2023

215 __ |a 265页 |c 图 |d 24cm

330 __ |a 本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。

500 10 |a Reinforcement learning algorithms with python |A Reinforcement Learning Algorithms With Python |m chi

606 0_ |a 程序语言 |A Cheng Xu Yu Yan |x 程序设计

690 __ |a TP312 |v 5

701 _1 |a 隆萨 |A long sa |g (Lonza, Andrea) |4 著

702 _0 |a 刘继红 |A liu ji hong |4 译

702 _0 |a 王瑞文 |A wang rui wen |4 译

801 _0 |a CN |b 人天书店 |c 20230227

905 __ |a WFKJXY |d TP312/808

920 __ |a 4370400 |z 1