文献类型:专著 浏览次数:62
  • 题名:深入浅出强化学习.编程实战
  • 责任者:郭宪,宋俊潇,方勇纯著
  • 出版社电子工业出版社
  • 出版年:2020.03
  • ISBN:978-7-121-36746-5
  • 定价:89.00
  • 载体形态项:264页 24cm
  • 个人责任者:郭宪著、宋俊潇著、方勇纯著
  • 学科主题:机器学习
  • 中图法分类号:TP181
  • 提要文摘附注:本书分三大篇介绍了目前强化学习算法中最基本的算法。第一篇为基于值函数的强化学习算法,该篇介绍了基于两种策略评估方法(蒙特卡洛策略评估和时间差分策略评估)的强化学习算法,进而介绍了如何将函数逼近的方法引入到强化学习算法中。第二篇为直接策略搜索方法,该篇介绍了最基本的策略梯度方法、基本的AC方法、PPO方法和DDPG算法。第三篇为基于模型的强化学习方法,该篇介绍了基于mpc的方法,AlphaZero算法基本原理及在五子棋上的具体实现细节。
  • 统一资源定位(URL):
总体评价(共0票) 评价
索书号 条码号 年卷期 馆藏地 排架号 书刊状态 流通类型 流通状态

书籍封面

相关资源

图书馆微博二维码

图书馆微信公众号二维码