關(guān)于我們
書單推薦
新書推薦

現(xiàn)場實操:Python深度強(qiáng)化學(xué)習(xí)入門:強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制

現(xiàn)場實操:Python深度強(qiáng)化學(xué)習(xí)入門:強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制

定  價:89 元

        

  • 作者:伊藤多一 等
  • 出版時間:2022/4/1
  • ISBN:9787111700722
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:240
  • 紙張:
  • 版次:
  • 開本:16
9
7
7
8
0
7
0
1
7
1
2
1
2

讀者對象:人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)相關(guān)專業(yè)領(lǐng)域的技術(shù)人員和愛好者

《Python深度強(qiáng)化學(xué)習(xí)入門:強(qiáng)化學(xué)習(xí)和深度學(xué)習(xí)的搜索與控制》共7章。其中,第1章介紹了機(jī)器學(xué)習(xí)的分類、強(qiáng)化學(xué)習(xí)的學(xué)習(xí)機(jī)制以及深度強(qiáng)化學(xué)習(xí)的概念;第2章通過強(qiáng)化學(xué)習(xí)的基本概念、馬爾科夫決策過程和貝爾曼方程、貝爾曼方程的求解方法、無模型控制等介紹了強(qiáng)化學(xué)習(xí)的基本算法;第3章通過深度學(xué)習(xí)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)介紹了強(qiáng)化學(xué)習(xí)中深度學(xué)習(xí)的特征提取方法;第4章通過行動價值函數(shù)的網(wǎng)絡(luò)表示、策略函數(shù)的網(wǎng)絡(luò)表示介紹了深度強(qiáng)化學(xué)習(xí)的實現(xiàn);第5章通過策略梯度法的連續(xù)控制、學(xué)習(xí)算法和策略模型等,詳細(xì)介紹了深度強(qiáng)化學(xué)習(xí)在連續(xù)控制問題中的應(yīng)用及具體實現(xiàn);第6章通過巡回推銷員問題和魔方問題詳細(xì)介紹了深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化中的應(yīng)用及具體實現(xiàn);第7章通過SeqGAN的文本生成和神經(jīng)網(wǎng)絡(luò)的架構(gòu)搜索詳細(xì)介紹了深度強(qiáng)化學(xué)習(xí)在時間序列數(shù)據(jù)生成的應(yīng)用。在附錄中還給出了Colaboratory和Docker等深度強(qiáng)化學(xué)習(xí)開發(fā)環(huán)境的構(gòu)建。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容