書單推薦
更多
新書推薦
更多

強化學(xué)習(xí)基本原理

強化學(xué)習(xí)基本原理

定  價:35 元

        

  • 作者:郭憲,許靜,方勇純編著
  • 出版時間:2025/11/1
  • ISBN:9787560677996
  • 出 版 社:西安電子科技大學(xué)出版社
  • 中圖法分類:TP181 
  • 頁碼:183頁
  • 紙張:
  • 版次:1
  • 開本:26cm
9
7
6
8
7
7
7
5
9
6
9
0
6
本書深入探討了單智能體和多智能體強化學(xué)習(xí)算法,系統(tǒng)介紹了多臂賭博機、馬爾科夫決策過程、動態(tài)規(guī)劃、基于值函數(shù)的強化學(xué)習(xí)算法、深度值函數(shù)算法、隨機策略梯度算法、近端策略優(yōu)化算法、深度確定性策略優(yōu)化算法以及多智能體強化學(xué)習(xí)。這些主題既包括經(jīng)典強化學(xué)習(xí)算法,也涵蓋了近年來發(fā)展起來的深度強化學(xué)習(xí)算法。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容