關(guān)于我們
書單推薦
新書推薦

網(wǎng)絡(luò)數(shù)據(jù)爬取與分析實務(wù)

網(wǎng)絡(luò)數(shù)據(jù)爬取與分析實務(wù)

定  價:68 元

        

  • 作者:李周平 著
  • 出版時間:2018/9/1
  • ISBN:9787313200327
  • 出 版 社:上海交通大學(xué)出版社
  • 中圖法分類:TP311.561 
  • 頁碼:
  • 紙張:特種紙
  • 版次:1
  • 開本:16開
9
7
2
8
0
7
0
3
3
1
2
3
7

本書按照網(wǎng)絡(luò)數(shù)據(jù)爬取、數(shù)據(jù)清洗與處理、數(shù)據(jù)存儲、數(shù)據(jù)分析的邏輯脈絡(luò),介紹了數(shù)據(jù)科學(xué)的相關(guān)知識。

全書主要內(nèi)容涉及理論、實戰(zhàn)、工具三個層面。其中,理論層面主要介紹了網(wǎng)絡(luò)爬蟲,數(shù)據(jù)處理與存儲,機器學(xué)習(xí)的相關(guān)概念、原理與算法;實戰(zhàn)層面主要通過影評、二手房、招聘網(wǎng)站等實戰(zhàn)項目,闡述了數(shù)據(jù)爬取、處理與存儲的代碼實現(xiàn),并通過相關(guān)數(shù)據(jù)集的實例,介紹了機器學(xué)習(xí)算法的實現(xiàn)與效果評估;工具層面主要講解了如何通過Python的Urllib、Request、BeautifulSoup、Pandas、Scikit-learn等第三方工具包實現(xiàn)數(shù)據(jù)的爬取、處理與分析,以及通過SQLite這一輕量級數(shù)據(jù)庫工具實現(xiàn)數(shù)據(jù)的存儲。


 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容