書單推薦
更多
新書推薦
更多

強(qiáng)化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用

強(qiáng)化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用

定  價(jià):99 元

        

  • 作者:張百珂
  • 出版時(shí)間:2025/5/1
  • ISBN:9787302685913
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP312.8PY 
  • 頁(yè)碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
6
8
8
7
5
3
9
0
1
2
3

《強(qiáng)化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》循序漸進(jìn)地講解了使用Python語(yǔ)言實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)的核心算法開發(fā)的知識(shí),內(nèi)容涵蓋了數(shù)據(jù)處理、算法、大模型等知識(shí),并通過具體實(shí)例的實(shí)現(xiàn)過程演練了各個(gè)知識(shí)點(diǎn)的使用方法和使用流程!稄(qiáng)化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》共分為17章,主要內(nèi)容包括強(qiáng)化學(xué)習(xí)基礎(chǔ)、馬爾可夫決策過程、蒙特卡洛方法、Q-learning與貝爾曼方程、時(shí)序差分學(xué)習(xí)和SARSA算法、DQN算法、DDQN算法、競(jìng)爭(zhēng)DQN算法、REINFORCE算法、Actor-Critic算法、PPO算法、TRPO算法、連續(xù)動(dòng)作空間的強(qiáng)化學(xué)習(xí)、值分布式算法、基于模型的強(qiáng)化學(xué)習(xí)、多智能體強(qiáng)化學(xué)習(xí)實(shí)戰(zhàn):Predator-Prey 游戲及自動(dòng)駕駛系統(tǒng)。本書內(nèi)容簡(jiǎn)潔而不失技術(shù)深度,以極簡(jiǎn)的文字介紹了復(fù)雜的案例,易于閱讀和理解。
《強(qiáng)化學(xué)習(xí)基礎(chǔ)、原理與應(yīng)用》適用于已經(jīng)了解Python語(yǔ)言基礎(chǔ)語(yǔ)法的讀者,想進(jìn)一步學(xué)習(xí)強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)及相關(guān)技術(shù)的讀者,還可作為大專院校相關(guān)專業(yè)的師生用書和培訓(xùn)機(jī)構(gòu)的教材使用。

 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容