Python+Superset:商業(yè)智能數(shù)據(jù)分析與實(shí)戰(zhàn)
定 價(jià):79 元
- 作者:王國(guó)平
- 出版時(shí)間:2022/2/1
- ISBN:9787121428654
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.561
- 頁(yè)碼:248
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
本書(shū)通過(guò)實(shí)際案例深入介紹了基于Python的開(kāi)源商業(yè)智能工具Apache Superset。本書(shū)立足于為企業(yè)建立一套開(kāi)源免費(fèi)的BI(商業(yè)智能)數(shù)據(jù)分析平臺(tái),實(shí)現(xiàn)自助數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化,概述了該系統(tǒng)的基本情況、總體需求、解決方案和業(yè)務(wù)理解等。本書(shū)從企業(yè)BI系統(tǒng)建設(shè)的實(shí)際需求出發(fā),詳細(xì)闡述了商業(yè)智能系統(tǒng)開(kāi)發(fā)的概念、流程及相關(guān)技術(shù),同時(shí)結(jié)合實(shí)際案例介紹了基于Apache Superset的最新且常用的商業(yè)智能技術(shù),包括Redis、Hive、Presto、Vertica、ClickHouse、TiDB、Dremio等。
王國(guó)平:具有十余年金融、電力、互聯(lián)網(wǎng)等行業(yè)從業(yè)經(jīng)歷,現(xiàn)已出版十余部專著。擅長(zhǎng)數(shù)據(jù)分析、數(shù)據(jù)可視化、機(jī)器學(xué)習(xí)等,精通Python、SPSS、Tableau、Power BI等數(shù)據(jù)分析工具,熟悉MySQL、SQL Server等數(shù)據(jù)庫(kù),以及Hadoop、Hive、Zeppelin、Spark等大數(shù)據(jù)分析及可視化工具。
第1章 商業(yè)智能概述 1
1.1 商業(yè)智能簡(jiǎn)介 1
1.1.1 商業(yè)智能的發(fā)展 1
1.1.2 商業(yè)智能的價(jià)值 3
1.1.3 商業(yè)智能的流程 4
1.2 商業(yè)智能技術(shù) 4
1.2.1 數(shù)據(jù)倉(cāng)庫(kù)技術(shù) 4
1.2.2 ETL技術(shù) 6
1.2.3 數(shù)據(jù)可視化技術(shù) 6
1.3 幾個(gè)概念的比較 10
1.3.1 商業(yè)智能與報(bào)表工具 10
1.3.2 商業(yè)智能與數(shù)據(jù)分析 11
1.3.3 商業(yè)智能與數(shù)據(jù)可視化 11
第2章 系統(tǒng)開(kāi)發(fā)需求分析 12
2.1 項(xiàng)目背景概述 12
2.1.1 項(xiàng)目意義與需求 12
2.1.2 項(xiàng)目目標(biāo)、系統(tǒng)設(shè)計(jì)與階段劃分 16
2.2 平臺(tái)總體需求 18
2.2.1 平臺(tái)總體規(guī)劃 19
2.2.2 平臺(tái)用戶角色 20
2.3 解決方案概述 21
2.3.1 BI平臺(tái)功能簡(jiǎn)介 21
2.3.2 BI平臺(tái)總體架構(gòu) 22
2.4 業(yè)務(wù)數(shù)據(jù)理解 23
2.4.1 表及其字段含義 24
2.4.2 重要需求點(diǎn)闡述 28
第3章 系統(tǒng)開(kāi)發(fā)相關(guān)技術(shù) 31
3.1 系統(tǒng)主要軟件 31
3.1.1 Hadoop 31
3.1.2 Python 34
3.1.3 Apache Superset 35
3.2 數(shù)據(jù)倉(cāng)庫(kù)技術(shù) 37
3.2.1 數(shù)據(jù)倉(cāng)庫(kù)構(gòu)建過(guò)程 37
3.2.2 數(shù)據(jù)倉(cāng)庫(kù)拉鏈算法 38
3.3 Apache Superset的安裝 39
3.3.1 在Docker中部署Apache Superset 39
3.3.2 在Windows下安裝Apache Superset 44
第4章 Apache Superset連接數(shù)據(jù)源 47
4.1 讀取本地?cái)?shù)據(jù) 47
4.1.1 讀取CSV文件 47
4.1.2 讀取TXT文件 51
4.2 連接關(guān)系型數(shù)據(jù)庫(kù) 51
4.2.1 安裝驅(qū)動(dòng)程序 52
4.2.2 配置連接參數(shù) 53
4.2.3 添加數(shù)據(jù)庫(kù)表 58
第5章 Apache Superset基礎(chǔ)操作 61
5.1 Apache Superset可視化分析 61
5.1.1 SQL Lab提取數(shù)據(jù) 61
5.1.2 制作報(bào)表與看板 64
5.2 Apache Superset用戶管理 68
5.2.1 創(chuàng)建新的系統(tǒng)用戶 68
5.2.2 刪除已有系統(tǒng)用戶 70
5.2.3 查看用戶日志記錄 71
5.3 Apache Superset角色管理 72
5.3.1 設(shè)置用戶角色類型 73
5.3.2 創(chuàng)建新的用戶角色 73
5.3.3 修改用戶角色類型 75
5.4 Apache Superset看板設(shè)置與編輯 77
5.4.1 Apache Superset看板設(shè)置 77
5.4.2 Apache Superset看板編輯 81
第6章 Apache Superset前端集成開(kāi)發(fā) 84
6.1 前端開(kāi)發(fā)概述 84
6.1.1 HTML及其應(yīng)用案例 84
6.1.2 JavaScript及其特點(diǎn) 88
6.2 系統(tǒng)參數(shù)設(shè)置 89
6.3 Apache Superset前端集成實(shí)戰(zhàn) 90
6.3.1 報(bào)表嵌入Web頁(yè)面 90
6.3.2 看板嵌入Web頁(yè)面 97
第7章 Apache Superset系統(tǒng)性能優(yōu)化 100
7.1 系統(tǒng)性能優(yōu)化 100
7.2 搭建開(kāi)發(fā)環(huán)境 102
7.2.1 Redis緩存概述 102
7.2.2 配置Redis環(huán)境 104
7.3 集成開(kāi)發(fā)實(shí)戰(zhàn) 106
7.3.1 測(cè)試集成前看板 106
7.3.2 刷新集成后看板 108
第8章 Apache Superset與數(shù)據(jù)倉(cāng)庫(kù) 109
8.1 數(shù)據(jù)倉(cāng)庫(kù)概述 109
8.1.1 傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù) 109
8.1.2 大數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù) 111
8.2 Apache Superset集成Hive 113
8.2.1 Hive數(shù)據(jù)倉(cāng)庫(kù)概述 113
8.2.2 搭建Hive開(kāi)發(fā)環(huán)境 115
8.3 物流配送影響因素分析 117
第9章 Apache Superset與實(shí)時(shí)計(jì)算引擎 121
9.1 實(shí)時(shí)計(jì)算引擎概述 121
9.1.1 實(shí)時(shí)計(jì)算應(yīng)用場(chǎng)景 121
9.1.2 實(shí)時(shí)計(jì)算重要架構(gòu) 123
9.2 Apache Superset集成Presto 126
9.2.1 Presto計(jì)算引擎概述 126
9.2.2 搭建Presto開(kāi)發(fā)環(huán)境 128
9.3 網(wǎng)購(gòu)?fù)素浽蚍治?132
9.3.1 網(wǎng)購(gòu)?fù)素浿饕?132
9.3.2 個(gè)人原因退貨分析 134
第10章 Apache Superset與列式存儲(chǔ)引擎 136
10.1 列式存儲(chǔ)引擎 136
10.2 Apache Superset集成Vertica 138
10.2.1 Vertica存儲(chǔ)引擎概述 138
10.2.2 搭建Vertica開(kāi)發(fā)環(huán)境 140
10.3 客戶流失原因分析 144
10.3.1 客戶流失主要原因 144
10.3.2 客戶流失服務(wù)因素分析 145
第11章 Apache Superset與聯(lián)機(jī)分析處理 147
11.1 聯(lián)機(jī)分析處理概述 147
11.1.1 聯(lián)機(jī)分析處理特性 147
11.1.2 聯(lián)機(jī)分析處理操作 149
11.2 Apache Superset集成ClickHouse 150
11.2.1 ClickHouse存儲(chǔ)引擎概述 151
11.2.2 搭建ClickHouse開(kāi)發(fā)環(huán)境 152
13.3 商家物流運(yùn)營(yíng)分析 155
11.3.1 物流運(yùn)營(yíng)主要模式 156
11.3.2 商家交貨周期分析 157
第12章 Apache Superset與混合事務(wù)分析處理 159
12.1 混合事務(wù)分析處理 159
12.1.1 混合事務(wù)分析處理概述 159
12.1.2 混合事務(wù)分析處理操作 161
12.2 Apache Superset集成TiDB 163
12.2.1 TiDB存儲(chǔ)引擎概述 163
12.2.2 搭建TiDB開(kāi)發(fā)環(huán)境 166
12.3 物流配送溝通性 168
12.3.1 物流配送溝通性概述 169
12.3.2 物流配送溝通性分析 169
第13章 Apache Superset與數(shù)據(jù)湖引擎 172
13.1 數(shù)據(jù)湖引擎 172
13.1.1 數(shù)據(jù)湖引擎概述 172
13.1.2 數(shù)據(jù)湖與數(shù)據(jù)倉(cāng)庫(kù) 173
13.2 Apache Superset集成Dremio 174
13.2.1 Dremio引擎概述 175
13.2.2 搭建Dremio開(kāi)發(fā)環(huán)境 176
13.3 客戶流失價(jià)格因素 182
13.3.1 客戶流失價(jià)格因素概述 182
13.3.2 客戶流失價(jià)格因素分析 182
第14章 客戶細(xì)分主題分析 184
14.1 客戶細(xì)分的價(jià)值及其方法 184
14.1.1 客戶細(xì)分的概念 184
14.1.2 客戶細(xì)分的目的 185
14.1.3 客戶細(xì)分的方法 185
14.2 基于客戶屬性的客戶細(xì)分 187
14.2.1 提取SQL數(shù)據(jù)庫(kù)數(shù)據(jù) 187
14.2.2 制作可視化分析報(bào)表 188
14.2.3 基于屬性的細(xì)分看板 192
14.3 基于客戶價(jià)值的客戶細(xì)分 193
14.3.1 提取SQL數(shù)據(jù)庫(kù)數(shù)據(jù) 193
14.3.2 制作可視化分析報(bào)表 194
14.3.3 基于價(jià)值的細(xì)分看板 198
14.4 基于消費(fèi)行為的客戶細(xì)分 199
14.4.1 RFM模型及客戶價(jià)值類型 199
14.4.2 提取與清洗SQL數(shù)據(jù) 200
14.4.3 制作可視化分析報(bào)表 204
14.4.4 基于行為的細(xì)分看板 208
14.5 對(duì)細(xì)分客戶進(jìn)行營(yíng)銷 208
第15章 客戶滿意度主題分析 211
15.1 客戶滿意度概述 211
15.2 客戶滿意信賴度分析 214
15.3 客戶滿意專業(yè)度分析 215
15.4 客戶滿意有形度分析 217
15.5 客戶滿意同理度分析 218
15.6 客戶滿意反應(yīng)度分析 220
15.7 提升客戶滿意度 221
附錄A 安裝Python 3.10.0 224
附錄B 集群各節(jié)點(diǎn)的參數(shù)配置 228
B.1 Hadoop的參數(shù)配置 228
B.2 Hive的參數(shù)配置 231
B.3 集群的啟動(dòng)與關(guān)閉 233
附錄C 數(shù)據(jù)源及其連接方式 234