關(guān)于我們
書單推薦
新書推薦

Python網(wǎng)絡(luò)爬蟲

Python網(wǎng)絡(luò)爬蟲

定  價(jià):49 元

        

  • 作者:龔衛(wèi),郭嗣鑫主編
  • 出版時(shí)間:2023/9/1
  • ISBN:9787121468513
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:209頁
  • 紙張:
  • 版次:1
  • 開本:26cm
9
7
4
8
6
7
8
1
5
2
1
1
3

讀者對(duì)象:高校軟件工程專業(yè)師生

本教材是一門基于工作過程開發(fā)出來的學(xué)習(xí)領(lǐng)域教材,主要講解了爬取靜態(tài)網(wǎng)頁、爬取動(dòng)態(tài)網(wǎng)頁、爬取APP數(shù)據(jù)、反爬蟲策略及解決辦法、爬蟲優(yōu)化策略,面向不同工作場景,劃分為若干個(gè)學(xué)習(xí)情境,內(nèi)容由淺入深,囊括了目前行業(yè)爬取數(shù)據(jù)的全部主流技術(shù)。第一部分是爬取靜態(tài)網(wǎng)頁,由三個(gè)學(xué)習(xí)情境講述:使用Requests+BeautifulSoup4+CSV,使用Mechanize+BeautifulSoup4+CSV,使用Scrapy+XPath+MySQL爬取數(shù)據(jù)。第二部分是爬取動(dòng)態(tài)網(wǎng)頁,使用兩個(gè)學(xué)習(xí)情境描述:使用Scrapy+JSON+MySQL使用Selenium+PhantomJS爬取數(shù)據(jù)。第三部分是爬取APP數(shù)據(jù)由使用Fiddler+Requests爬取新聞?lì)怉PP接口數(shù)據(jù)描述。第四部分反爬蟲策略及解決辦法。由常見反爬蟲策略及解決辦法,處理輸入式驗(yàn)證碼校驗(yàn)講述。第五部分是爬蟲優(yōu)化策略,講述了Scrapy+Redis分布式爬取數(shù)據(jù)。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容