書單推薦 新書推薦 |
強化學(xué)習(xí)基本原理
本書深入探討了單智能體和多智能體強化學(xué)習(xí)算法,系統(tǒng)介紹了多臂賭博機、馬爾科夫決策過程、動態(tài)規(guī)劃、基于值函數(shù)的強化學(xué)習(xí)算法、深度值函數(shù)算法、隨機策略梯度算法、近端策略優(yōu)化算法、深度確定性策略優(yōu)化算法以及多智能體強化學(xué)習(xí)。這些主題既包括經(jīng)典強化學(xué)習(xí)算法,也涵蓋了近年來發(fā)展起來的深度強化學(xué)習(xí)算法。
你還可能感興趣
我要評論
|