机读格式显示(MARC)
- 000 01884nam0 2200289 450
- 010 __ |a 978-7-302-65979-2 |d CNY79.80
- 100 __ |a 20240820d2024 em y0chiy50 ea
- 200 1_ |a 深度强化学习 |A shen du qiang hua xue xi |f (荷) 阿斯克·普拉特著 |g 殷海英译
- 210 __ |a 北京 |c 清华大学出版社 |d 2024
- 215 __ |a 254页 |c 图 |d 24cm
- 314 __ |a 阿斯克·普拉特 (Aske Plaat), 是荷兰莱顿大学的数据科学教授, 兼任莱顿高级计算机科学研究所 (LIACS) 主任。Aske是莱顿数据科学中心 (LCDS) 的联合创始人, 发起了跨学科研究项目“社会、人工智能与生命科学”(SAILS)。Aske的研究领域包括强化学习、可扩展的组合推理算法、游戏和自学习系统。
- 330 __ |a 近年来, 深度强化学习成为关注的热点。在自动驾驶、棋牌游戏、分子重排和机器人等领域, 计算机程序能够通过强化学习, 理解以前被视为超级困难的问题, 取得了令人瞩目的成果。在围棋比赛中, AlphaGo接连战胜樊麾、李世石和柯洁等人类冠军。深度强化学习从生物学和心理学领域的研究中受到启发。生物学激发了人工神经网络和深度学习的出现, 而心理学研究人和动物如何学习, 如何通过正负刺激来强化目标行为。了解了强化学习如何指导机器人行走时, 我们不禁联想到儿童如何在玩中学习。动物行为和大脑结构可作为新的科学和工程蓝图。计算机似乎真正具备了人类的某些行为特征, 深度强化学习技术成为实现AI梦想的核心。教育界也十分重视深度强化学习的研究进展。许多大学开设了深度强化学习课程。本书怡到好处地介绍了深度强化学习领域的技术细节。本书讲解全面, 涵盖深度Q-learning的基本算法, 乃至多智能体强化学习和元学习等高级主题。
- 500 10 |a Deep reinforcement learning |A Deep Reinforcement Learning |m Chinese
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _1 |a 普拉特 |A pu la te |g (Plaat, Aske) |4 著
- 702 _0 |a 殷海英 |A yin hai ying |4 译
- 801 _0 |a CN |b WFKJXY |c 20250620
- 905 __ |a WFKJXY |d TP181/479