書單推薦
更多
新書推薦
更多

Lessons from alphazero for optimal, model predictive, and adaptive control

Lessons from alphazero for optimal, model predictive, and adaptive control

定  價:79 元

叢書名:國際知名大學原版教材

        

  • 作者:Dimitri P. Bertsekas
  • 出版時間:2025/4/1
  • ISBN:9787302684718
  • 出 版 社:清華大學出版社
  • 中圖法分類:TP181 
  • 頁碼:xiv, 227頁
  • 紙張:
  • 版次:影印版
  • 開本:24cm
9
7
6
8
8
7
4
3
7
0
1
2
8
本書構建了近似動態(tài)規(guī)劃和強化學習的新的理論框架, 簡潔但雄心勃勃。這一框架以離線訓練和在線學習這兩個算法為中心, 彼此獨立又通過牛頓法有機融合。當今新一代人工智能技術發(fā)展絢麗多彩。在看似紛繁復雜的數(shù)據(jù)與算法表象之下, 其實蘊藏著簡潔而美妙的規(guī)律。通過本書的學習, 讀者將能體會經(jīng)典優(yōu)化控制理論在分析理解當代強化學習算法性能中的強大威力, 更能領悟到以阿爾法零為代表的新一代算法浪潮對經(jīng)典理論提供的新的發(fā)展機遇。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內容