机读格式显示(MARC)
- 000 01541nam0 2200325 450
- 010 __ |a 978-7-302-68567-8 |d CNY108.00
- 092 __ |a CN |b 人天1171-2504
- 100 __ |a 20250506d2025 em y0chiy50 ea
- 200 1_ |a 强化学习的数学原理 |A qiang hua xue xi de shu xue yuan li |f 赵世钰著
- 210 __ |a 北京 |c 清华大学出版社 |d 2025.04
- 215 __ |a XX, 271页 |c 图 |d 26cm
- 314 __ |a 赵世钰, 西湖大学人工智能系特聘研究员, 智能无人系统实验室负责人, 国家海外高层次人才引进计划青年项目获得者 ; 本硕毕业于北京航空航天大学, 博士毕业于新加坡国立大学, 曾任英国谢菲尔德大学自动控制与系统工程系Lecturer ; 致力于研发有趣、有用、有挑战性的下一代机器人系统, 重点关注多机器人系统中的控制、决策与感知等问题。
- 320 __ |a 有书目 (第265-271页)
- 330 __ |a 本书将从强化学习最基本的概念开始介绍, 将介绍基础的分析工具包括贝尔曼公式和贝尔曼最优公式, 之后会推广到基于模型的和无模型的强化学习算法, 最后会推广到基于函数逼近的强化学习方法。本书强调从数学的角度接引入概念、分析问题、分析算法。并不强调算法的编程实现, 因为目前已经有很多这方面的书籍, 本书将不再重复造轮子。
- 510 1_ |a Mathematical foundations of reinforcement learning |z eng
- 606 0_ |a 机器学习 |A ji qi xue xi
- 701 _0 |a 赵世钰 |A zhao shi yu |4 著
- 801 _0 |a CN |b 人天书店 |c 20250506
- 962 __ |a 92587693 |x 11b472d64414c78856d93634fc60d6