關(guān)于我們
書單推薦
新書推薦
|
網(wǎng)絡(luò)爬蟲(chóng)技術(shù) 讀者對(duì)象:軟件工具程序設(shè)計(jì)人員
本書內(nèi)容主要包含6部分,第1部分認(rèn)識(shí)網(wǎng)頁(yè)的構(gòu)造及爬蟲(chóng)的原理,第2部分實(shí)現(xiàn)靜態(tài)網(wǎng)頁(yè)的爬取,第3部分實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)到文件、數(shù)據(jù)庫(kù),第4部分實(shí)現(xiàn)動(dòng)態(tài)網(wǎng)頁(yè)的爬取,第5部分針對(duì)不同反爬限制技術(shù)實(shí)現(xiàn)數(shù)據(jù)爬取,第6部分使用Scrapy爬蟲(chóng)框架進(jìn)行爬取。內(nèi)容較好地涵蓋了企業(yè)爬蟲(chóng)崗位所需要掌握得requests、httpx、BeautifulSoup、lxml、parsel、Selenium等第三方庫(kù)及正則,數(shù)據(jù)的文本、CSV、JSON文件存儲(chǔ),MySQL、MongoDB數(shù)據(jù)庫(kù)存儲(chǔ),中間件集成中的Redis、Kafka等使用,Scrapy框架以及解決如圖片驗(yàn)證碼、賬號(hào)限制、IP限制等問(wèn)題。本書以企業(yè)級(jí)的項(xiàng)目為主線進(jìn)行講解,每個(gè)部分通過(guò)“項(xiàng)目-任務(wù)-案例”展開(kāi),對(duì)所需的知識(shí)點(diǎn)進(jìn)行全面的介紹,并給出了任務(wù)實(shí)現(xiàn)的詳細(xì)操作步驟和相應(yīng)的實(shí)戰(zhàn)練習(xí)題。全書由淺入深、實(shí)例生動(dòng)、易學(xué)易用,可以滿足不同層次讀者的需求。
你還可能感興趣
我要評(píng)論
|