丁香五月缴情在线,2022国产麻豆剧传媒在线

　　《Python爬蟲項目教程（微課版）》以Python語言為基礎(chǔ)，介紹了爬蟲的基礎(chǔ)知識。
　　《Python爬蟲項目教程（微課版）》包括6個實戰(zhàn)項目，分別為爬取外匯網(wǎng)站數(shù)據(jù)、爬取名言網(wǎng)站數(shù)據(jù)、爬取電影網(wǎng)站數(shù)據(jù)、爬取圖書網(wǎng)站數(shù)據(jù)、爬取商城網(wǎng)站數(shù)據(jù)、爬取景區(qū)網(wǎng)站數(shù)據(jù)。
　　《Python爬蟲項目教程（微課版）》通過這些項目講解了Python的Web訪問技術(shù)、BeautifulSoup的數(shù)據(jù)分析與提取技術(shù)、深度優(yōu)先與廣度優(yōu)先順序爬取技術(shù)、多線程網(wǎng)頁爬取技術(shù)、scrapy分布式爬取框架技術(shù)、selenium爬蟲程序技術(shù)、AWS中的DynamoDB數(shù)據(jù)庫的NoSQL存儲技術(shù)等。
　　《Python爬蟲項目教程（微課版）》每個項目都遵循由淺入深的學(xué)習(xí)規(guī)律，采取理論與實踐相結(jié)合的方式來引導(dǎo)讀者完成實戰(zhàn)。
　　《Python爬蟲項目教程（微課版）》可作為計算機軟件技術(shù)專業(yè)及其相關(guān)專業(yè)的程序設(shè)計課程教材。

　　爬蟲程序指能自動從相關(guān)網(wǎng)頁中搜索與提取所需數(shù)據(jù)的程序，提取與存儲這些數(shù)據(jù)是進(jìn)行數(shù)據(jù)分析的前提與關(guān)鍵。Python語言因其簡單、易讀、可擴(kuò)展的特性，在編寫爬蟲程序方面有特別的優(yōu)勢。尤其是業(yè)界有用Python編寫的各種各樣的爬蟲程序框架供學(xué)習(xí)者參考，使得Python爬蟲程序的編寫更加簡單、高效。
　　本書包括6個項目。項目1基于爬取外匯網(wǎng)站數(shù)據(jù)，講解Python的Web訪問技術(shù)及正則表達(dá)式匹配字符串方法。項目2基于爬取名言網(wǎng)站數(shù)據(jù)，講解BeautifulSoup的數(shù)據(jù)分析與提取技術(shù)。項目3基于爬取電影網(wǎng)站數(shù)據(jù)，講解爬取多個網(wǎng)頁數(shù)據(jù)的方法，重點講解網(wǎng)頁的深度優(yōu)先與廣度優(yōu)先順序爬取路徑的構(gòu)造方法與多線程網(wǎng)頁爬取技術(shù)。項目4基于爬取圖書網(wǎng)站數(shù)據(jù)，講解目前功能強大的分布式爬取框架scrapy的程序技術(shù)。項目5基于爬取商城網(wǎng)站數(shù)據(jù)，講解selenium爬蟲程序技術(shù)。項目6基于爬取景區(qū)網(wǎng)站數(shù)據(jù)，講解AWS中的DynamoDB數(shù)據(jù)庫的NoSQL存儲技術(shù)。每個項目都遵循由淺人深的學(xué)習(xí)規(guī)律，理論與實踐相結(jié)合，引導(dǎo)讀者完成實戰(zhàn)。
　　學(xué)習(xí)是一個循序漸進(jìn)的過程，實際的網(wǎng)站結(jié)構(gòu)比較復(fù)雜，對初學(xué)者來說，一開始就編寫爬蟲程序去爬取一個實際網(wǎng)站的數(shù)據(jù)是比較困難的。因此本書的每個項目都是先指導(dǎo)讀者搭建一個本地模擬網(wǎng)站，再編寫爬蟲程序來爬取本地模擬網(wǎng)站的數(shù)據(jù)，從而幫助讀者掌握爬蟲程序的編寫技術(shù)。這樣做的好處是使學(xué)習(xí)內(nèi)容變得簡單、易學(xué)，讀者可以先把主要精力放在爬蟲程序的編寫上，而非放在分析網(wǎng)站結(jié)構(gòu)上，等有了一定的編程基礎(chǔ)再去爬取實際網(wǎng)站的數(shù)據(jù)就容易多了。
　　對于本書，建議分為54學(xué)時實施教學(xué)。
　　由于編者知識水平有限，書中難免出現(xiàn)疏漏與不妥之處，歡迎讀者批評指正。

你還可能感興趣

我要評論