書單推薦
更多
新書推薦
更多

大規(guī)模強(qiáng)化學(xué)習(xí)中的新型函數(shù)近似技術(shù)研究

 大規(guī)模強(qiáng)化學(xué)習(xí)中的新型函數(shù)近似技術(shù)研究

定  價(jià):42 元

        

  • 作者:吳澄 編著
  • 出版時(shí)間:2024/9/1
  • ISBN:9787567249363
  • 出 版 社:蘇州大學(xué)出版社
  • 中圖法分類:O174 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
2
8
4
7
9
5
3
6
6
7
3

本書主要研究如何通過新型函數(shù)近似技術(shù)提升大規(guī)模強(qiáng)化學(xué)習(xí)器的性能。本書首先分析了傳統(tǒng)的函數(shù)近似技術(shù),如Tile編碼與Kanerva編碼在處理大規(guī)模問題性能不佳的原因,即原型沖突與不均勻的原型訪問頻率分布。為了解決這些問題,本書分別應(yīng)用自適應(yīng)Kanerva函數(shù)近似、模糊邏輯函數(shù)近似與基于粗糙集的函數(shù)近似等方法對強(qiáng)化學(xué)習(xí)中的函數(shù)近似方法進(jìn)行改進(jìn)。本書還將以上函數(shù)近似方法分別應(yīng)用于強(qiáng)化學(xué)習(xí)中不同難度的捕食者-獵物追逐問題與認(rèn)知無線電網(wǎng)絡(luò)應(yīng)用問題,以此進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明:本書所提方法不僅提高了類似問題的求解率,同時(shí)減少了所需原型數(shù)量,最終顯著提高了函數(shù)近似技術(shù)解決大規(guī)模強(qiáng)化學(xué)習(xí)與多智能體問題的有效性。

 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容