關于我們
書單推薦
新書推薦
|
Python爬蟲實戰(zhàn)基礎
本書介紹Python網絡爬蟲開發(fā)從業(yè)者應掌握的基礎技能。本書以網絡爬蟲為核心,涉及大大小小數十個能力體系。本書的前半部分介紹爬蟲開發(fā)的基礎知識,包括爬蟲開發(fā)必備的環(huán)境搭建方法、開發(fā)中常用工具的使用方法和技巧、網頁的構成原理和網頁信息提取的方法、常用數據庫的使用方法和應用場景,如通過Redis內置的布隆過濾器實現大規(guī)模URL地址的去重任務。本書的后半部分主要講解網絡爬蟲開發(fā)所需的必要能力,包括網絡通信的底層原理、背后涉及的互聯網協議標準及如何對這些協議進行分析并加以利用,使用Docker部署網絡爬蟲所需的環(huán)境和爬蟲項目的打包部署,使用網絡爬蟲的核心請求庫實現與服務器端和客戶端的通信和交互,使用自動化神器Selenium對復雜的爬蟲需求進行快速實現,以及網絡爬蟲的多任務開發(fā),重點是通過多線程和多進程來提高爬蟲效率。
本書面向準備從事或正在從事網絡爬蟲開發(fā)的從業(yè)者以及對網絡爬蟲有濃厚興趣的愛好者。
你還可能感興趣
我要評論
|