机读格式显示(MARC)
- 000 01263nam0 2200289 450
- 010 __ |a 978-7-302-57820-8 |d CNY59.80
- 100 __ |a 20210915d2021 em y0chiy50 ea
- 200 1_ |a 深度强化学习 |b 专著 |e 原理、算法与PyTorch实战 |f 刘全,黄志刚编著 |A shen du qiang hua xue xi
- 210 __ |a 北京 |c 清华大学出版社 |d 2021
- 215 __ |a 12,243页 |c 图 |d 26cm
- 225 2_ |a 大数据与人工智能技术丛书 |A Da Shu Ju Yu Ren Gong Zhi Neng Ji Shu Cong Shu
- 330 __ |a 本书共分三部分:第一和第二部分(第1~8章)为表格式强化学习部分,着重介绍深度强化学习概述、环境的配置、数学建模、动态规划法、蒙特卡洛法、时序差分法、n-步时序差分法、规划和蒙特卡洛树搜索;第三部分(第9~14章)为深度强化学习部分,着重介绍深度学习、PyTorch与神经网络、深度Q网络、策略梯度、基于确定性策略梯度的深度强化学习、AC框架的拓展。
- 410 _0 |1 2001 |a 大数据与人工智能技术丛书
- 517 1_ |a 原理、算法与PyTorch实战 |A Yuan Li、Suan Fa Yu Pytorch Shi Zhan
- 606 0_ |a 机器学习 |A Ji Qi Xue Xi
- 701 _0 |a 刘全 |f (1969~) |4 编著 |A liu quan
- 701 _0 |a 黄志刚 |4 编著 |A huang zhi gang
- 801 _0 |a CN |b DQNU |c 20220925
- 905 __ |a DQNU |d TP181/L71 |s 3