書單推薦
更多
新書推薦
更多

Python爬蟲從菜鳥到高手

Python爬蟲從菜鳥到高手

定  價(jià):119 元

        

當(dāng)前圖書已被 40 所學(xué)校薦購過!
查看明細(xì)

  • 作者:李寧
  • 出版時(shí)間:2023/9/1
  • ISBN:9787302640516
  • 出 版 社:清華大學(xué)出版社
  • 中圖法分類:TP312PY 
  • 頁碼:
  • 紙張:膠版紙
  • 版次:
  • 開本:16開
9
7
6
8
4
7
0
3
5
0
1
2
6

本書從實(shí)戰(zhàn)角度系統(tǒng)論述了Python 爬蟲技術(shù)的核心知識(shí),并通過大量的真實(shí)項(xiàng)目幫助讀者深入掌握Python 爬蟲技術(shù)及其實(shí)現(xiàn)。本書提供了大量實(shí)戰(zhàn)案例,演繹采用各種技術(shù)編寫Python 爬蟲的方式。讀者可以任意組合使用這些技術(shù),完成非常復(fù)雜的爬蟲應(yīng)用。本書共20 章,分為五篇。第一篇:基礎(chǔ)知識(shí)(第1~2 章),主要包括Python 編程環(huán)境的搭建、IDE 的安裝和使用、HTTP 的基礎(chǔ)知識(shí)、網(wǎng)頁基礎(chǔ)(HTML、CSS、JavaScript)、爬蟲的基本原理、Session、Cookie。第二篇:網(wǎng)絡(luò)庫(第3~5 章),主要包括網(wǎng)絡(luò)庫urllib、urllib3 和requests 的核心使用方法,例如,發(fā)送HTTP 請求、處理超時(shí)、設(shè)置HTTP 請求頭、處理中文字符、搭建和使用代理、解析鏈接、Robots 協(xié)議等。第三篇:解析庫(第6~9 章),主要包括3 個(gè)常用解析庫(lxml、Beautiful Soup 和pyquery)的使用方法,同時(shí)介紹了多種用于分析HTML 代碼的技術(shù),例如,正則表達(dá)式、XPath、CSS 選擇器、方法選擇器等。第四篇:數(shù)據(jù)存儲(chǔ)(第10~11 章),主要包括Python 中數(shù)據(jù)存儲(chǔ)的解決方案,如文件存儲(chǔ)和SQLite 數(shù)據(jù)庫。第五篇:爬蟲高級應(yīng)用(第12~20 章),主要包括Python 爬蟲的一些高級技術(shù),如抓取異步數(shù)據(jù)、Selenium、Splash、抓取移動(dòng)App 數(shù)據(jù)、Appium、多線程爬蟲、爬蟲框架Scrapy、通過OpenCV 技術(shù)識(shí)別驗(yàn)證碼;最后給出一個(gè)綜合的實(shí)戰(zhàn)案例,該案例綜合了Python 爬蟲、數(shù)據(jù)存儲(chǔ)、PyQt、多線程、數(shù)據(jù)可視化、Web 等多種技術(shù)實(shí)現(xiàn)一個(gè)可視化爬蟲。

 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容