日本一区免费电影,毛片大全在线观看,国产亚洲拍拍拍

本書基于強(qiáng)化學(xué)的庫(kù)Chainer（Chainere）和AI模擬環(huán)境的OpenAI gym，不僅僅是軟件模擬，也詳述了使用RaspbbilryPi和ARduino的實(shí)際環(huán)境的應(yīng)用。

近年來(lái)，機(jī)器學(xué)習(xí)受到了人們的廣泛關(guān)注。在機(jī)器學(xué)習(xí)中，主要通過(guò)向?qū)W習(xí)器提供受訓(xùn)目標(biāo)（有標(biāo)簽信息）來(lái)進(jìn)行有監(jiān)督學(xué)習(xí)，例如，大多數(shù)圖像識(shí)別和語(yǔ)音識(shí)別都是通過(guò)有監(jiān)督學(xué)習(xí)來(lái)進(jìn)行的。
另外，還存在一種稱為半監(jiān)督學(xué)習(xí)的方法，該方法不像有監(jiān)督學(xué)習(xí)那樣提供有標(biāo)簽信息，這種機(jī)器學(xué)習(xí)方法中典型的便是強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種，它根據(jù)特定環(huán)境（例如游戲的棋盤盤面等）中的當(dāng)前情況來(lái)決定下一步要采取的行動(dòng)。例如，讓計(jì)算機(jī)學(xué)習(xí)下圍棋時(shí)，思考在某種局面下，接下來(lái)應(yīng)該在哪里放置棋子更好。
強(qiáng)化學(xué)習(xí)會(huì)對(duì)計(jì)算機(jī)考慮到的行動(dòng)進(jìn)行評(píng)估，并以獎(jiǎng)勵(lì)的形式進(jìn)行反饋，評(píng)估行動(dòng)的好壞（例如在圍棋比賽中的贏或輸），這樣一來(lái)，計(jì)算機(jī)將自動(dòng)采取在特定情況下會(huì)增加獎(jiǎng)勵(lì)的行動(dòng)。深度強(qiáng)化學(xué)習(xí)將強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)融合在一起，取得了很好的成效。其中讓我們記憶猶新的便是由DeepMind公司開(kāi)發(fā)的圍棋智能體AlphaGo Zero。它在不使用任何人類對(duì)弈數(shù)據(jù)的情況下和自己進(jìn)行對(duì)局（計(jì)算機(jī)對(duì)戰(zhàn)計(jì)算機(jī)），僅用一個(gè)多月就達(dá)到了很高的水平，而且?guī)缀鯖](méi)有弱點(diǎn)。
深度學(xué)習(xí)成為眾人矚目的焦點(diǎn)已經(jīng)將近10年了，但它并非一開(kāi)始就是一種全新的技術(shù)，它是自1970年以來(lái)研究的人工神經(jīng)網(wǎng)絡(luò)發(fā)展而來(lái)的一種方法。當(dāng)前的深度學(xué)習(xí)熱潮也被稱為第三次人工智能熱潮，它與目前為止的人工智能熱潮的區(qū)別之一是，多家公司已經(jīng)發(fā)布了機(jī)器學(xué)習(xí)框架，非專業(yè)人士也可以免費(fèi)使用它們，因而不論是學(xué)生還是在職人員都可以輕松嘗試深度學(xué)習(xí)。此外，機(jī)器學(xué)習(xí)的某些框架不僅支持深度學(xué)習(xí)，而且還支持結(jié)合了強(qiáng)化學(xué)習(xí)的深度強(qiáng)化學(xué)習(xí)。因此，當(dāng)前學(xué)習(xí)深度學(xué)習(xí)的門檻遠(yuǎn)低于此前的幾次人工智能熱潮。
在本書中，除了詳細(xì)的理論說(shuō)明外，還有針對(duì)在Python上運(yùn)行的深度強(qiáng)化學(xué)習(xí)框架ChainerRL的講解，從而引導(dǎo)讀者在實(shí)際中使用深度強(qiáng)化學(xué)習(xí)。如果你想通過(guò)模擬實(shí)驗(yàn)檢驗(yàn)深度強(qiáng)化學(xué)習(xí)的結(jié)果，只要有臺(tái)個(gè)人計(jì)算機(jī)就可以輕松嘗試。另外，如果你有一臺(tái)像Raspberry Pi這樣的小型計(jì)算機(jī)，則可以通過(guò)連接來(lái)控制電路元件和機(jī)器人。深度強(qiáng)化學(xué)習(xí)適用于“情況因操作而異”的問(wèn)題，因此，它適用于在一方操作之后局面會(huì)發(fā)生改變的問(wèn)題，如圍棋和將棋等棋局問(wèn)題。此外，用機(jī)械臂自動(dòng)識(shí)別物體，將其進(jìn)行抓握和移動(dòng)也是深度強(qiáng)化學(xué)習(xí)的擅長(zhǎng)領(lǐng)域。因此，在本書中，我們會(huì)講解如何通過(guò)深度強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行黑白棋對(duì)戰(zhàn)，以及如何將其應(yīng)用于實(shí)際的機(jī)器人上。
如前所述，由于深度強(qiáng)化學(xué)習(xí)將強(qiáng)化學(xué)習(xí)整合到了深度學(xué)習(xí)中，因此，如果了解了這兩種學(xué)習(xí)方法的原理，就能更好地運(yùn)用深度強(qiáng)化學(xué)習(xí)。
本書第1章首先介紹進(jìn)行深度強(qiáng)化學(xué)習(xí)所需的PC端環(huán)境構(gòu)建。第2章介紹深度學(xué)習(xí)。為了理解深度強(qiáng)化學(xué)習(xí)，有必要了解深度學(xué)習(xí)的相關(guān)知識(shí)。由于市面上已經(jīng)有許多有關(guān)深度學(xué)習(xí)的書籍，因此本書以讀者參考了那些書中的詳細(xì)信息為前提，在第2章中講解理解深度強(qiáng)化學(xué)習(xí)所需掌握的內(nèi)容。使用Chainer進(jìn)行過(guò)深度學(xué)習(xí)編程的人可以跳過(guò)這一章。接下來(lái)，第3章我們將講解強(qiáng)化學(xué)習(xí)中的一種典型方法Q學(xué)習(xí)，希望讀者能在這一章中了解強(qiáng)化學(xué)習(xí)的基礎(chǔ)。在第4章中我們將進(jìn)入深度強(qiáng)化學(xué)習(xí)的討論。第5章介紹如何使用深度強(qiáng)化學(xué)習(xí)來(lái)控制移動(dòng)機(jī)器人。
這樣一來(lái)，本書從基礎(chǔ)出發(fā)，通過(guò)從開(kāi)發(fā)環(huán)境構(gòu)建到深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、深度強(qiáng)化學(xué)習(xí)的逐步深入，來(lái)對(duì)控制實(shí)際事物的應(yīng)用進(jìn)行講解。因此，深度學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)的初學(xué)者和中級(jí)學(xué)習(xí)者（例如，大學(xué)生或希望將深度學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)應(yīng)用于工作的在職人員）可以在逐步學(xué)習(xí)的同時(shí)學(xué)習(xí)深度強(qiáng)化學(xué)習(xí)的基礎(chǔ)。本書將幫助這類讀者加深對(duì)強(qiáng)化學(xué)習(xí)的理解。
此外，本書的附錄中包含的信息有助于學(xué)習(xí)深度強(qiáng)化學(xué)習(xí)。例如，僅使用PC的CPU進(jìn)行深度學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)的計(jì)算需要很長(zhǎng)時(shí)間，因此我們將介紹一種使用圖形操作單元（GPU）加速學(xué)習(xí)過(guò)程的方法。對(duì)于使用Intel CPU的用戶，我們還會(huì)介紹一種使用由Intel發(fā)布的Intel CPU矩陣計(jì)算優(yōu)化引擎來(lái)加速的方法。
在編寫本書時(shí)，為了嘗試讓初學(xué)者也可以學(xué)習(xí)深度強(qiáng)化學(xué)習(xí)，山梨大學(xué)本科院醫(yī)工農(nóng)學(xué)綜合教育學(xué)部的劉震先生和名取智纮先生在閱讀本書的手稿時(shí)構(gòu)造了一個(gè)開(kāi)發(fā)環(huán)境并檢查了程序的運(yùn)行情況，在此對(duì)他們深表謝意。還要感謝協(xié)助進(jìn)行運(yùn)行檢查的山梨大學(xué)工程學(xué)院的佐野祐太先生、村田義倫先生和依田直樹(shù)先生。此外，作者所屬的山梨大學(xué)工學(xué)院信息機(jī)電工程學(xué)系的教職員工以及實(shí)驗(yàn)室的本科生和研究生也提供了支持。后，如果沒(méi)有OHM公司所有人的鼎力相助，本書也難以出版，我們要再次感謝所有向我們提供幫助的人。
使用本書時(shí)的注意事項(xiàng)
本書中涉及的程序可以從OHM公司的網(wǎng)站（https://www.ohmsha.co.jp/）以及華章圖書官網(wǎng)（http://www.hzbook.com）進(jìn)行下載。
本書的程序可以在以下環(huán)境中運(yùn)行。
Windows 8.1/10
搭載了macOS 10.13 High Sierra的MacBook和MacBook Pro
Raspbian OS（版本2.7.0）/ Raspberry Pi2 Model B或Raspberry Pi3 Model B
搭載Ubuntu 16.04 / Intel Core i7的PC 或 VirtualBox上的虛擬環(huán)境
Python 2.7.14或Python 3.6.4
大部分程序在Pyt

你還可能感興趣

我要評(píng)論