123,123,123

<small id="61111"></small>

<big id="61111"></big>

歡迎進入網(wǎng)上館配會薦購選采服務(wù)平臺圖書館單位會員注冊圖書館讀者/館員登錄

書單推薦

·二十四節(jié)氣｜冬至

·二十四節(jié)氣｜白露

·二十四節(jié)氣｜處暑

·二十四節(jié)氣｜立秋

·二十四節(jié)氣｜大暑

·二十四節(jié)氣｜夏至

·科學(xué)出版社精品典藏

·清華大學(xué)出版社—2024年度好

新書推薦

更多

·《中國經(jīng)濟學(xué)(2025年第2輯總

·《行為博弈》

·《神經(jīng)網(wǎng)絡(luò)設(shè)計與應(yīng)用》

·《精準落實》

·《新生物學(xué)本質(zhì)主義研究》

·《賞文物話中醫(yī)》

·《把熱愛變成事業(yè)》

Lessons from alphazero for optimal, model predictive, and adaptive control

Lessons from alphazero for optimal, model predictive, and adaptive control

定　　價：79 元

叢書名：國際知名大學(xué)原版教材

當(dāng)前圖書已被 3 所學(xué)校薦購過！

查看明細

作者：Dimitri P. Bertsekas
出版時間：2025/4/1
ISBN：9787302684718
出版社：清華大學(xué)出版社

中圖法分類：TP181
頁碼：xiv, 227頁
紙張：
版次：影印版
開本：24cm

9

7

6

8

8

7

4

3

7

0

1

2

8

內(nèi)容簡介

本書構(gòu)建了近似動態(tài)規(guī)劃和強化學(xué)習(xí)的新的理論框架, 簡潔但雄心勃勃。這一框架以離線訓(xùn)練和在線學(xué)習(xí)這兩個算法為中心, 彼此獨立又通過牛頓法有機融合。當(dāng)今新一代人工智能技術(shù)發(fā)展絢麗多彩。在看似紛繁復(fù)雜的數(shù)據(jù)與算法表象之下, 其實蘊藏著簡潔而美妙的規(guī)律。通過本書的學(xué)習(xí), 讀者將能體會經(jīng)典優(yōu)化控制理論在分析理解當(dāng)代強化學(xué)習(xí)算法性能中的強大威力, 更能領(lǐng)悟到以阿爾法零為代表的新一代算法浪潮對經(jīng)典理論提供的新的發(fā)展機遇。

你還可能感興趣

我要評論

感谢您访问我们的网站，您可能还对以下资源感兴趣：

免费的a级毛片

性欧美牲交xxxxx视频极品美女扒开粉嫩小泬高潮 av视频一区在线播放亚洲最大无码一区二区三区