書單推薦
更多
新書推薦
更多

多智能體強(qiáng)化學(xué)習(xí):基礎(chǔ)與現(xiàn)代方法 [德]斯特凡諾·V. 阿爾布萊希特 [希]菲利波斯·克里斯蒂安諾斯 [德]盧卡斯·舍費(fèi)

 多智能體強(qiáng)化學(xué)習(xí):基礎(chǔ)與現(xiàn)代方法 [德]斯特凡諾·V. 阿爾布萊希特 [希]菲利波斯·克里斯蒂安諾斯 [德]盧卡斯·舍費(fèi)

定  價(jià):109 元

        

  • 作者:[德]斯特凡諾·V. 阿爾布萊希特(Stefano V. Albrecht)[希]菲利波斯·克里斯蒂安諾斯(Filippos Christianos)[德]盧卡斯·舍費(fèi)爾(Lukas Sch?fer)
  • 出版時(shí)間:2025/5/1
  • ISBN:9787111776871
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP18 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
7
8
7
7
6
1
8
1
7
1
1
多智能體強(qiáng)化學(xué)習(xí)(Multi-Agent Reinforcement Learning, MARL)是機(jī)器學(xué)習(xí)中的一個(gè)領(lǐng)域,研究多個(gè)智能體如何在共享環(huán)境中學(xué)習(xí)最優(yōu)的交互方式。這一領(lǐng)域在現(xiàn)代生活中有著廣泛的應(yīng)用,包括自動(dòng)駕駛、多機(jī)器人工廠、自動(dòng)化交易和能源網(wǎng)絡(luò)管理等。 本書是一部系統(tǒng)闡述多智能體強(qiáng)化學(xué)習(xí)理論與技術(shù)的權(quán)威著作,清晰而嚴(yán)謹(jǐn)?shù)亟榻B了MARL的模型、解決方案概念、算法思想、技術(shù)挑戰(zhàn)以及現(xiàn)代方法。書中首先介紹了該領(lǐng)域的基礎(chǔ)知識(shí),包括強(qiáng)化學(xué)習(xí)理論和算法的基礎(chǔ)、交互式博弈模型、博弈中的不同解決方案概念以及支撐MARL研究的算法思想。隨后,書中詳細(xì)介紹了利用深度學(xué)習(xí)技術(shù)的現(xiàn)代MARL算法,涵蓋集中訓(xùn)練與分散執(zhí)行、價(jià)值分解、參數(shù)共享和自博弈等思想。本書還附帶了一個(gè)用Python編寫的MARL代碼庫,其中包括自包含且易于閱讀的MARL算法實(shí)現(xiàn)。 本書技術(shù)內(nèi)容以易于理解的語言解釋,并通過大量示例進(jìn)行說明,既為初學(xué)者闡明了MARL的概念,也為專業(yè)的讀者提供了高層次的見解。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容