書單推薦
更多
新書推薦
更多

強化學(xué)習(xí)

強化學(xué)習(xí)

定  價:69.8 元

        

當(dāng)前圖書已被 33 所學(xué)校薦購過!
查看明細(xì)

  • 作者:余欣航
  • 出版時間:2024/4/1
  • ISBN:9787121476617
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP181 
  • 頁碼:280
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
4
8
7
7
6
1
6
2
1
1
7

讀者對象:高等學(xué)校數(shù)據(jù)科學(xué)與大數(shù)據(jù)、人工智能、計算機科學(xué)與技術(shù)等相關(guān)專業(yè)的學(xué)生,相關(guān)技術(shù)人員

本書詳細(xì)介紹了強化學(xué)習(xí)的理論推導(dǎo)、算法細(xì)節(jié)。全書共12章,包括強化學(xué)習(xí)概述、馬爾可夫決策過程、退化的強化學(xué)習(xí)問題、環(huán)境已知的強化學(xué)習(xí)問題、基于價值的強化學(xué)習(xí)算法、基于策略的強化學(xué)習(xí)算法、AC型算法、基于模型的強化學(xué)習(xí)算法等相關(guān)知識。本書系統(tǒng)性強、概念清晰,內(nèi)容簡明通俗。除了側(cè)重于理論推導(dǎo),本書還提供了許多便于讀者理解的例子,以及大量被實踐證明有效的算法技巧,旨在幫助讀者進(jìn)一步了解強化學(xué)習(xí)領(lǐng)域的相關(guān)知識,提升其現(xiàn)實中的工程能力。本書可作為高等院校數(shù)學(xué)、計算機、人工智能等相關(guān)專業(yè)的強化學(xué)習(xí)教材,但需要有機器學(xué)習(xí)、深度學(xué)習(xí)等前置課程作為基礎(chǔ)。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容