關(guān)于我們
書(shū)單推薦
新書(shū)推薦
|
PySpark原理深入與編程實(shí)戰(zhàn)(微課視頻版)
本書(shū)系統(tǒng)講述Apache Spark/PySpark大數(shù)據(jù)計(jì)算平臺(tái)的原理,以及如果將Apache PySpark應(yīng)用于大數(shù)據(jù)的實(shí)時(shí)流處理、批處理等各個(gè)場(chǎng)景。通過(guò)原理深入學(xué)習(xí)和實(shí)踐示例、案例的學(xué)習(xí)應(yīng)用,使讀者了解并掌握Apache Spark/PySpark的基本原理和技能,接近理論與實(shí)踐的距離。
全書(shū)共分為8章,主要內(nèi)容包括:Spark架構(gòu)原理與集群搭建、開(kāi)發(fā)和部署PySpark應(yīng)用程序、PySpark核心編程、PySpark SQL、PySpark SQL高級(jí)分析、PySpark結(jié)構(gòu)化流、PySpark結(jié)構(gòu)化流高級(jí)處理、Spark大數(shù)據(jù)處理綜合案例。本書(shū)源碼全部在Apache Spark 3.1.2上調(diào)試成功,所有示例和案例均基于Python 3.x語(yǔ)言。 為降低讀者學(xué)習(xí)大數(shù)據(jù)技術(shù)的門檻,本書(shū)除了提供了豐富的上機(jī)實(shí)踐操作和范例程序詳解之外,本書(shū)作者還為購(gòu)買和使用本書(shū)的讀者提供了搭建好的Hadoop、Hive數(shù)倉(cāng)和PySpark大數(shù)據(jù)開(kāi)發(fā)和學(xué)習(xí)環(huán)境。讀者既可以參照本書(shū)的講解自行搭建Hadoop和PySpark環(huán)境,也可直接使用作者提供的開(kāi)始和學(xué)習(xí)環(huán)境,快速開(kāi)始大數(shù)據(jù)和PySpark的學(xué)習(xí)。 本書(shū)系統(tǒng)講解了Apache Spark/PySpark大數(shù)據(jù)計(jì)算平臺(tái)的原理和流、批處理的開(kāi)發(fā)實(shí)踐,內(nèi)容全面、實(shí)例豐富、可操作性強(qiáng),做到了理論與實(shí)踐相結(jié)合。本書(shū)適合大數(shù)據(jù)學(xué)習(xí)愛(ài)好者、想要入門Apache Spark/PySpark的讀者作為入門和提高的技術(shù)參考書(shū),也適合用作大中專院校大數(shù)據(jù)專業(yè)相關(guān)的學(xué)生和老師的教材或教學(xué)參考書(shū)。
你還可能感興趣
我要評(píng)論
|