MARC状态:审校 文献类型:中文图书 浏览次数:8
- 题名/责任者:
- 强化学习/(英) 菲尔·温德尔著 邹伟, 康俊鹏, 王伟译
- 出版发行项:
- 北京:中国电力出版社,2023
- ISBN及定价:
- 978-7-5198-6961-8/CNY128.00
- 载体形态项:
- xx, 427页:图;24cm
- 统一题名:
- Reinforcement learning
- 个人责任者:
- 温德尔 (Winder, Rhil) 著
- 个人次要责任者:
- 邹伟 译
- 个人次要责任者:
- 康俊鹏 译
- 个人次要责任者:
- 王伟 译
- 学科主题:
- 机器学习
- 中图法分类号:
- TP181
- 版本附注:
- 据原书第2版译出
- 出版发行附注:
- 英文原版由O'Reilly Media, Inc.出版2021 简体中文版由中国电力出版社出版2023 英文原版的翻译得到O'Reilly Media, Inc.的授权
- 相关题名附注:
- 封面题英文题名:Reinforcement learning
- 责任者附注:
- 菲尔·温德尔,是一名多学科交叉的软件工程师、作家和科技顾问,同时也是温德研究所的CE0。该研究所主要提供云计算科学咨询,主营业务是帮助初创公司和大型企业改进数据流程、平台以及产品。
- 书目附注:
- 有书目
- 提要文摘附注:
- 本书涵盖了从基本的构建模块到最先进的实践。通过本书,你将探索强化学习的当前状态、关注工业应用、学习大量算法,本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书,书中包含很多数学知识,并期望读者是熟悉机器学习的。学习强化学习是什么,以及算法如何解决具体问题。掌握强化学习的基础知识,包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案,如元学习、分层学习、多智能体、模仿学习等。了解最前沿的深度强化学习算法,包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。
全部MARC细节信息>>
索书号 | 条码号 | 年卷期 | 馆藏地 | 书刊状态 | 还书位置 |
TP181/405 | 2247728 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 | |
TP181/405 | 2247729 | 自然科学书库-四楼西北 | 可借 | 自然科学书库-四楼西北 |
显示全部馆藏信息