![]() ![]() |
大規(guī)模強(qiáng)化學(xué)習(xí)中的新型函數(shù)近似技術(shù)研究 本書主要研究如何通過新型函數(shù)近似技術(shù)提升大規(guī)模強(qiáng)化學(xué)習(xí)器的性能。本書首先分析了傳統(tǒng)的函數(shù)近似技術(shù),如Tile編碼與Kanerva編碼在處理大規(guī)模問題性能不佳的原因,即原型沖突與不均勻的原型訪問頻率分布。為了解決這些問題,本書分別應(yīng)用自適應(yīng)Kanerva函數(shù)近似、模糊邏輯函數(shù)近似與基于粗糙集的函數(shù)近似等方法對強(qiáng)化學(xué)習(xí)中的函數(shù)近似方法進(jìn)行改進(jìn)。本書還將以上函數(shù)近似方法分別應(yīng)用于強(qiáng)化學(xué)習(xí)中不同難度的捕食者-獵物追逐問題與認(rèn)知無線電網(wǎng)絡(luò)應(yīng)用問題,以此進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明:本書所提方法不僅提高了類似問題的求解率,同時(shí)減少了所需原型數(shù)量,最終顯著提高了函數(shù)近似技術(shù)解決大規(guī)模強(qiáng)化學(xué)習(xí)與多智能體問題的有效性。
你還可能感興趣
我要評論
|