机读格式显示(MARC)

000 01971nam 2200373 450

001 0000760925

005 20250611082200.0

010 __ |a 978-7-115-64917-1 |d CNY109.80

100 __ |a 20240823d2024 em y0chiy50 ea

101 1_ |a chi |c jpn

102 __ |a CN |b 110000

105 __ |a ak a 000yy

106 __ |a r

200 1_ |a 深度学习入门 |A shen du xue xi ru men |h 4 |i 强化学习 |f (日) 斋藤康毅著 |g 郑明智译

210 __ |a 北京 |c 人民邮电出版社 |d 2024

215 __ |a 313页 |c 彩图 |d 21cm

225 2_ |a 图灵程序设计丛书 |A tu ling cheng xu she ji cong shu

300 __ |a 图灵教育

306 __ |a 日文原版由O'Reilly Japan, Inc.出版日本原版的翻译得到Koki Saitoh的授权

312 __ |a 书名原文取自版权页

314 __ |a 斋藤康毅(1984-)，东京工业大学毕业，并完成东京大学研究生院课程。现从事计算机视觉与机器学习相关的研究和开发工作。

314 __ |a 郑明智，智慧医疗工程师。主要研究方向为医疗与前沿ICT技术的结合及其应用。译有《深度学习基础与实践》《详解深度学习》《白话机器学习的数学》等书。

320 __ |a 有书目 (第310-313页)

330 __ |a 本书前半部分介绍强化学习的重要思想和基础知识，后半部分介绍如何将深度学习应用于强化学习，遴选讲解了深度强化学习的最新技术。全书从最适合入门的多臂老虎机问题切入，依次介绍了定义一般强化学习问题的马尔可夫决策过程、用于寻找最佳答案的贝尔曼方程，以及解决贝尔曼方程的动态规划法、蒙特卡洛方法和TD方法。随后，神经网络和Q学习、DQN、策略梯度法等几章则分别讨论了深度学习在强化学习领域的应用。本书延续“鱼书”系列的风格，搭配丰富的图、表、代码示例，加上轻松、简明的讲解，让人循序渐进地理解强化学习中各种方法之间的关系，于不知不觉中登堂入室。

410 _0 |1 2001 |a 图灵程序设计丛书

500 10 |a ゼロから作る deep learning |A ゼロからzuoるDeep Learning |h 4 |i 強化学習編 |m Chinese

517 1_ |a 强化学习 |A qiang hua xue xi

606 0_ |a 机器学习 |A ji qi xue xi

690 __ |a TP18 |v 5

690 __ |a TP311.56 |v 4

701 _0 |a 斋藤康毅, |A zhai teng kang yi |f 1984- |4 著

702 _0 |a 郑明智 |A zheng ming zhi |4 译

801 _0 |a CN |b WFKJXY |c 20250611

905 __ |a WFKJXY |d TP311.56/245:4