机读格式显示(MARC)

000 01848nam0 2200337 450

001 0000699343

005 20240816170900.0

010 __ |a 978-7-5198-6961-8 |d CNY128.00

100 __ |a 20230406d2023 em y0chiy50 ea

101 1_ |a chi |c eng

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a 强化学习 |A qiang hua xue xi |f (英) 菲尔·温德尔著 |g 邹伟, 康俊鹏, 王伟译

210 __ |a 北京 |c 中国电力出版社 |d 2023

215 __ |a xx, 427页 |c 图 |d 24cm

305 __ |a 据原书第2版译出

306 __ |a 英文原版由O'Reilly Media, Inc.出版2021 简体中文版由中国电力出版社出版2023 英文原版的翻译得到O'Reilly Media, Inc.的授权

312 __ |a 封面题英文题名：Reinforcement learning

314 __ |a 菲尔·温德尔，是一名多学科交叉的软件工程师、作家和科技顾问，同时也是温德研究所的CE0。该研究所主要提供云计算科学咨询，主营业务是帮助初创公司和大型企业改进数据流程、平台以及产品。

320 __ |a 有书目

330 __ |a 本书涵盖了从基本的构建模块到最先进的实践。通过本书，你将探索强化学习的当前状态、关注工业应用、学习大量算法，本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书，书中包含很多数学知识，并期望读者是熟悉机器学习的。学习强化学习是什么，以及算法如何解决具体问题。掌握强化学习的基础知识，包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案，如元学习、分层学习、多智能体、模仿学习等。了解最前沿的深度强化学习算法，包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。

500 10 |a Reinforcement learning |A Reinforcement Learning |m Chinese

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP181 |v 5

701 _1 |a 温德尔 |A wen de er |g (Winder, Rhil) |4 著

702 _0 |a 邹伟 |A zou wei |4 译

702 _0 |a 康俊鹏 |A kang juan peng |4 译

702 _0 |a 王伟 |A wang wei |4 译

801 _0 |a CN |b WFKJXY |c 20240816

905 __ |a WFKJXY |d TP181/405