机读格式显示(MARC)
- 000 01074oam2 2200253 450
- 010 __ |a 978-7-03-040640-8 |d CNY89.00
- 100 __ |a 20021229d1997 em y0chiy0121 ea
- 200 1_ |a 强化学习原理及其应用 |A qiang hua xue xi yuan li ji qi ying yong |f 王雪松,朱美强,程玉虎著
- 210 __ |a 北京 |c 科学出版社 |d 2014
- 215 __ |a 12,253页 |d 24cm
- 225 __ |a 智能科学技术著作丛书 |A zhi neng ke xue ji shu zhu zuo cong shu
- 330 __ |a 本书分别从值函数逼近、直接策略搜索和基于谱方法的学习三个方面来阐述强化学习的理论、方法及其应用。全书分为13章,其中第1-2章为强化学习概述和相关基础理论;第3-5章为基于值函数估计的强化学习方法及其应用;第6-9章为直接策略搜索强化学习方法及其应用;第10-13章是对基于谱方法的强化学习进行研究。
- 606 __ |a 学习方法 |A xue xi fang fa
- 701 _0 |a 王雪松 |A wang xue song |4 著
- 711 _1 |a 朱美强,程玉虎 |A zhu mei qiang ,cheng yu hu |4 著
- 801 _0 |a CN |b NYZZJGYXY |c 20141028
- 905 __ |a JDZXY |d G791/78