机读格式显示(MARC)

000 01541nam0 2200325 450

001 0000856539

005 20250506161850.0

010 __ |a 978-7-302-68567-8 |d CNY108.00

092 __ |a CN |b 人天1171-2504

100 __ |a 20250506d2025 em y0chiy50 ea

101 0_ |a chi

102 __ |a CN |b 110000

105 __ |a a a 000yy

106 __ |a r

200 1_ |a 强化学习的数学原理 |A qiang hua xue xi de shu xue yuan li |f 赵世钰著

210 __ |a 北京 |c 清华大学出版社 |d 2025.04

215 __ |a XX, 271页 |c 图 |d 26cm

312 __ |a 英文题名取自封面

314 __ |a 赵世钰, 西湖大学人工智能系特聘研究员, 智能无人系统实验室负责人, 国家海外高层次人才引进计划青年项目获得者 ; 本硕毕业于北京航空航天大学, 博士毕业于新加坡国立大学, 曾任英国谢菲尔德大学自动控制与系统工程系Lecturer ; 致力于研发有趣、有用、有挑战性的下一代机器人系统, 重点关注多机器人系统中的控制、决策与感知等问题。

320 __ |a 有书目 (第265-271页)

330 __ |a 本书将从强化学习最基本的概念开始介绍, 将介绍基础的分析工具包括贝尔曼公式和贝尔曼最优公式, 之后会推广到基于模型的和无模型的强化学习算法, 最后会推广到基于函数逼近的强化学习方法。本书强调从数学的角度接引入概念、分析问题、分析算法。并不强调算法的编程实现, 因为目前已经有很多这方面的书籍, 本书将不再重复造轮子。

510 1_ |a Mathematical foundations of reinforcement learning |z eng

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP181 |v 5

701 _0 |a 赵世钰 |A zhao shi yu |4 著

801 _0 |a CN |b 人天书店 |c 20250506

901 __ |a 清华大学出版社

902 __ |a Rt1170-1674

962 __ |a 92587693 |x 11b472d64414c78856d93634fc60d6

997 __ |a 可供