本書在提供時間序列分析基本原理的基礎上,重點對統(tǒng)計方法、 機器學習、 深度學習及其時間序列分析應用進行案例分析, 并提供了Python實例。本書還考慮了大數(shù)據(jù)背景下對海量時間序列數(shù)據(jù)的處理與分析方法, 對大數(shù)據(jù)分析引擎Apache Spark及其時間序列分析也提供了應用實例。
本書共包含4章, 組織結構如下: 第1章對時間序列分析方法進行概述; 第2章對統(tǒng)計方法及其時間序列分析進行介紹并提供Python實例; 第3章對機器學習及其時間序列分析進行介紹并提供Python實例; 第4章對深度學習及其時間序列分析進行介紹并提供Python實例。
本書主要為讀者提供快速的問題解決思路和一般策略,未深入討論各類算法模型的底層原理、 推導過程及具體任務的優(yōu)化改進。讀者可在本書提供的方法和源碼基礎上, 進行模型結構或算法流程優(yōu)化和創(chuàng)新, 以滿足讀者在實際學習、 研究和工程應用中的需要。為保證代碼清晰明確, 本書執(zhí)行PEP 8(python enterprise proposal 8)代碼格式。書中實例圍繞時間序列分析目標開展編程,應用范圍較為廣泛, 有望滿足不同領域科研工作者及工程技術從業(yè)人員的使用需要, 既可作為本科生、 研究生相關課程教學教材, 也能作為相關領域工程人員的技術參考書。
第1章 概述 / 1
1.1 時間序列分析基礎 / 1
1.1.1 時間序列特性 / 1
1.1.2 時間序列數(shù)據(jù)預處理 / 3
1.2 時間序列預測 / 14
1.2.1 滑動窗口 / 14
1.2.2 數(shù)據(jù)集劃分 / 20
1.2.3 預測任務分類 / 20
1.2.4 預測任務描述 / 22
1.2.5 預測誤差評價 / 24
1.2.6 預測可視化 / 30
1.3 時間序列預測常用框架 / 39
1.3.1 統(tǒng)計方法框架 / 39
1.3.2 機器學習模型框架 / 40
1.3.3 深度學習模型框架 / 40
1.4 常用優(yōu)化技術 / 41
1.4.1 交叉驗證 / 41
1.4.2 網(wǎng)格搜索 / 41
1.4.3 隨機搜索 / 41
第2章 統(tǒng)計方法時間序列分析 / 42
2.1 時間序列分析 / 43
2.1.1 時間序列分析模型 / 43
2.1.2 時間序列分析流程 / 44
2.2 ARIMA模型預測實例 / 45
2.2.1 實例: Grid-SARIMA客流預測 / 45
2.2.2 實例: Auto-SARIMA銷量預測 / 57
第3章 機器學習時間序列分析 / 66
3.1 數(shù)據(jù)集 / 67
3.2 K最近鄰回歸 / 69
3.2.1 模型介紹 / 69
3.2.2 實例: K最近鄰(KNN)回歸預測 / 69
3.3 多元線性回歸 / 75
3.3.1 模型介紹 / 75
3.3.2 實例: 多元線性回歸(MLR)預測 / 75
3.4 支持向量回歸 / 81
3.4.1 模型介紹 / 81
3.4.2 實例: 支持向量回歸(SVR)預測 / 81
3.5 決策樹回歸 / 87
3.5.1 模型介紹 / 87
3.5.2 實例: 決策樹(DT)回歸預測 / 87
3.6 隨機森林回歸 / 92
3.6.1 模型介紹 / 92
3.6.2 實例: 隨機森林(RF)回歸預測 / 93
3.7 梯度提升回歸樹 / 98
3.7.1 模型介紹 / 98
3.7.2 實例: 梯度提升回歸樹(GBRT)預測 / 98
3.8 極度梯度提升回歸 / 104
3.8.1 模型介紹 / 104
3.8.2 實例: 極度梯度提升(XGBosst)回歸預測 / 104
3.9 輕量梯度提升機回歸 / 112
3.9.1 模型介紹 / 112
3.9.2 實例: 輕量梯度提升機(LightGBM)回歸預測 / 113
3.10 Spark模型實現(xiàn) / 121
第4章 深度學習時間序列分析 / 134
4.1 前饋神經(jīng)網(wǎng)絡 / 135
4.1.1 模型介紹 / 135
4.1.2 實例: 前饋神經(jīng)網(wǎng)絡(FNN)太陽黑子預測 / 136
4.2 循環(huán)神經(jīng)網(wǎng)絡 / 145
4.2.1 模型介紹 / 145
4.2.2 實例: 長短期記憶(LSTM)網(wǎng)絡風速預測 / 147
4.2.3 實例: 門控循環(huán)單元(GRU)網(wǎng)絡風電功率預測 / 155
4.3 卷積神經(jīng)網(wǎng)絡 / 164
4.3.1 模型介紹 / 164
4.3.2 實例: 卷積神經(jīng)網(wǎng)絡(CNN)電力負荷預測 / 166
4.3.3 實例: 時間卷積網(wǎng)絡(TCN)網(wǎng)絡流量預測 / 175
4.4 圖神經(jīng)網(wǎng)絡 / 184
4.4.1 模型介紹 / 184
4.4.2 實例: 圖卷積網(wǎng)絡(GCN)空氣污染指數(shù)預測 / 186
4.4.3 實例: 圖注意力網(wǎng)絡(GAT)交通流量預測 / 210
4.5 注意力網(wǎng)絡 / 221
4.5.1 模型介紹 / 221
4.5.2 實例: 多頭自注意力(MSA)網(wǎng)絡溫度預測 / 222
附錄A Python開發(fā)環(huán)境配置 / 239
A.1 Ubuntu安裝配置 / 239
A.2 Anaconda安裝配置 / 240
A.3 pip配置 / 241
A.4 Python虛擬環(huán)境配置 / 242
A.5 Vscode安裝配置 / 243
附錄B Spark開發(fā)環(huán)境配置 / 245
B.1 Java安裝配置 / 245
B.2 Scala和Hadoop安裝配置 / 246
B.3 Spark安裝配置 / 246
B.4 PySpark安裝配置 / 248
附錄C 項目工程結構 / 250
參考文獻/ 253