關(guān)于我們
書單推薦
新書推薦
|
Python大數(shù)據(jù)基礎(chǔ) 本書介紹了大數(shù)據(jù)處理中的數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析與挖掘等內(nèi)容,還介紹了使用Python語言進(jìn)行大數(shù)據(jù)處理的方法。全書共8章。第1章簡要介紹大數(shù)據(jù)的概念、大數(shù)據(jù)處理的過程和涉及的不同方面,以及使用Python解決大數(shù)據(jù)問題的優(yōu)勢。第2章介紹如何安裝和準(zhǔn)備Python編程環(huán)境,包括編譯器、集成開發(fā)環(huán)境(IDE)的安裝,以及第三方包的管理和安裝方法。第3章介紹獲取數(shù)據(jù)的方法,即如何使用爬蟲技術(shù)從網(wǎng)站獲取網(wǎng)頁,并通過解析網(wǎng)頁獲取其中的數(shù)據(jù)。第4章介紹數(shù)據(jù)存儲(chǔ)和使用的方法,包括操作常見類型文件的方法,以及操作關(guān)系型數(shù)據(jù)庫和NoSQL數(shù)據(jù)庫的方法。第5章介紹如何使用NumPy和Pandas操作數(shù)組、矩陣以及如何使用其中的隨機(jī)數(shù)功能。第6章介紹數(shù)據(jù)預(yù)處理的概念,并介紹數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)規(guī)約的方法。第7章介紹數(shù)據(jù)挖掘的常見模型,并介紹利用scikit-learn進(jìn)行有監(jiān)督分類、回歸預(yù)測以及聚類分析的方法。第8章介紹數(shù)據(jù)可視化基礎(chǔ),包括可視化的過程和如何選擇合適的圖表,并介紹了利用Matplotlib繪制常見的圖表。 本書的第1、2章是基礎(chǔ),第3~8章分別介紹了大數(shù)據(jù)處理的某一環(huán)節(jié)。這些章節(jié)的內(nèi)容相互獨(dú)立,讀者在自學(xué)時(shí)可根據(jù)興趣和時(shí)間調(diào)整學(xué)習(xí)順序。
你還可能感興趣
我要評論
|