国产成A人亚洲精V品无码樱花,强奷人妻日本中文字幕

歡迎進入網(wǎng)上館配會薦購選采服務(wù)平臺圖書館單位會員注冊圖書館讀者/館員登錄

書單推薦

·二十四節(jié)氣｜白露

·二十四節(jié)氣｜處暑

·二十四節(jié)氣｜立秋

·二十四節(jié)氣｜大暑

·二十四節(jié)氣｜夏至

·科學出版社精品典藏

·清華大學出版社—2024年度好

·二十四節(jié)氣 | 立春

新書推薦

·《中國經(jīng)濟學(2025年第2輯總

·《行為博弈》

·《神經(jīng)網(wǎng)絡(luò)設(shè)計與應(yīng)用》

·《精準落實》

·《新生物學本質(zhì)主義研究》

·《賞文物話中醫(yī)》

·《把熱愛變成事業(yè)》

Joy RL

定　　價：59.8 元

當前圖書已被 6 所學校薦購過！

查看明細

作者：江季，王琦，楊毅遠著
出版時間：2023/12/1
ISBN：9787115631541
出版社：人民郵電出版社

中圖法分類：TP181
頁碼：222頁
紙張：
版次：1
開本：26cm

讀者對象:機器學習人員

內(nèi)容簡介

本書是《EasyRL：強化學習教程》的配套實踐教程。本書將在第一版的基礎(chǔ)上以更加嚴謹?shù)娘L格深入淺出地介紹馬爾可夫決策過程、蒙特卡羅方法、時序差分方法、Sarsa、Q-learning等傳統(tǒng)強化學習算法，以及策略梯度、近端策略優(yōu)化、深度Q網(wǎng)絡(luò)、深度確定性策略梯度等常見深度強化學習算法的基本概念和方法，并以大量生動有趣的例子幫助讀者理解強化學習問題的建模過程以及核心算法的細節(jié)。同時，增加最大熵學習、多智能體學習、離線強化學習等內(nèi)容，極大豐富強化學習的入門內(nèi)容。

你還可能感興趣

我要評論

^{<tbody id="66666"></tbody>}