本書分為8 章,內(nèi)容包括時間序列分析的基礎(chǔ)知識、時間序列預(yù)測的常用方法,以及神經(jīng)網(wǎng)絡(luò)在時間序列預(yù)測中的應(yīng)用;時間序列異常檢測算法的技術(shù)與框架,如何識別異常的時間點及多種異常檢測方法;時間序列的相似性度量方法、聚類算法;多維時間序列在廣告分析和業(yè)務(wù)運維領(lǐng)域的應(yīng)用,利用OLAP 技術(shù)對多維時間序列進行有效處理,通過根因分析技術(shù)獲得導(dǎo)致故障的維度和元素;智能運維領(lǐng)域(AIOps)和金融領(lǐng)域的兩個應(yīng)用場景。
張戎,新加坡國立大學(xué)數(shù)學(xué)博士,深圳孔雀計劃高層次人才,數(shù)學(xué)和機器學(xué)習(xí)領(lǐng)域科普作家,數(shù)學(xué)、科研和深度學(xué)習(xí)等話題的優(yōu)秀自媒體工作者, 曾多次擔(dān)任行業(yè)技術(shù)大會講師。博士期間從事動力系統(tǒng)的研究工作,博士論文中解決了非正則吸引子的存在性問題。畢業(yè)之后在工業(yè)界從事人工智能的研發(fā)工作,涉及業(yè)務(wù)包括推薦系統(tǒng)、安全大數(shù)據(jù)和智能運維等內(nèi)容。羅齊,碩士畢業(yè)于香港中文大學(xué)(深圳),現(xiàn)就職于某互聯(lián)網(wǎng)公司,從事算法應(yīng)用研究工作,研究方向為游戲數(shù)據(jù)挖掘和智能運維,曾參與多款熱門游戲的數(shù)據(jù)挖掘和智能運維工作。
第1 章時間序列概述 1
1.1 發(fā)展歷程 1
1.2 應(yīng)用現(xiàn)狀 3
1.3 時間序列分類4
1.3.1 單維時間序列4
1.3.2 多維時間序列6
1.4 小結(jié) 8
第2 章時間序列的信息提取 9
2.1 特征工程的入門知識9
2.1.1 特征工程簡介9
2.1.2 數(shù)值型特征 12
2.1.3 類別型特征 17
2.1.4 交叉特征 17
2.2 時間序列的預(yù)處理 18
2.2.1 時間序列的缺失值 18
2.2.2 時間序列的縮放 20
2.3 時間序列的特征工程24
2.4 時間序列的統(tǒng)計特征28
2.5 時間序列的熵特征 32
2.6 時間序列的降維特征38
2.6.1 分段聚合逼近38
2.6.2 分段線性逼近39
2.6.3 分段常數(shù)逼近41
2.6.4 符號逼近 42
2.6.5 最大三角形三桶算法43
2.6.6 用神經(jīng)網(wǎng)絡(luò)自動生成特征的算法 44
2.7 時間序列的單調(diào)性 53
2.7.1 線性擬合方法54
2.7.2 控制圖方法 55
2.7.3 均線方法 60
2.8 小結(jié) 63
第3 章時間序列預(yù)測 64
3.1 時間序列預(yù)測的統(tǒng)計方法 65
3.1.1 自回歸差分移動平均模型 65
3.1.2 指數(shù)平滑方法72
3.1.3 Prophet 75
3.2 時間序列預(yù)測的深度學(xué)習(xí)方法 83
3.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)83
3.2.2 長短期記憶網(wǎng)絡(luò) 85
3.2.3 Transformer 90
3.2.4 Informer96
3.3 小結(jié)·100
第4 章時間序列異常檢測 101
4.1 異常類型及檢測方法分類 101
4.2 基于概率密度的方法 104
4.2.1 核密度估計原理 104
4.2.2 核密度估計方法 106
4.3 基于重構(gòu)的方法 111
4.3.1 變分自編碼器 111
4.3.2 Donut 115
4.4 基于距離的方法 117
4.4.1 孤立森林 118
4.4.2 RRCF 121
4.5 基于有監(jiān)督的方法 125
4.6 基于弱監(jiān)督的方法 127
4.7 小結(jié) 129
第5 章時間序列的相似度與聚類 130
5.1 相似度函數(shù) 130
5.1.1 經(jīng)典的相似度函數(shù) 131
5.1.2 基于分段聚合逼近的相似度函數(shù) 134
5.1.3 基于時間序列平滑的相似度函數(shù) 135
5.1.4 基于神經(jīng)網(wǎng)絡(luò)的相似度算法 136
5.2 距離函數(shù) 137
5.2.1 歐氏距離 138
5.2.2 DTW 算法139
5.2.3 基于相似性的距離 140
5.2.4 基于符號特征的距離 141
5.2.5 基于自相關(guān)性的距離 142
5.2.6 基于周期性的距離 143
5.2.7 基于模型的距離 144
5.3 基于特征工程的聚類算法 145
5.4 基于距離和相似度的聚類算法 149
5.5 流式聚類算法 151
5.6 小結(jié) 154
第6 章多維時間序列 155
6.1 多維時間序列簡介155
6.2 單維時間序列與多維時間序列 156
6.2.1 廣告分析領(lǐng)域 156
6.2.2 業(yè)務(wù)運維領(lǐng)域 157
6.3 單維時間序列監(jiān)控系統(tǒng)和多維時間序列監(jiān)控系統(tǒng)的對比 159
6.4 根因分析 160
6.4.1 根因分析的基礎(chǔ)概念 160
6.4.2 人工執(zhí)行根因分析的難度 163
6.4.3 OLAP 技術(shù)和方法 164
6.5 基于時間序列異常檢測算法的根因分析 165
6.5.1 時間序列異常檢測 165
6.5.2 根因分析的列表結(jié)構(gòu) 170
6.5.3 根因分析的樹狀結(jié)構(gòu) 172
6.6 基于熵的根因分析 173
6.6.1 熵的概念和性質(zhì) 173
6.6.2 概率之間的距離 174
6.6.3 基于熵的根因分析方法 177
6.7 基于樹模型的根因分析 187
6.7.1 特征工程和樣本 187
6.7.2 決策樹算法 187
6.8 規(guī)則學(xué)習(xí) 188
6.8.1 根因分析的列表結(jié)構(gòu) 188
6.8.2 根因分析的樹狀結(jié)構(gòu) 189
6.8.3 列表結(jié)構(gòu)與樹狀結(jié)構(gòu)的對比 191
6.8.4 規(guī)則的排序 192
6.9 小結(jié) 193
第7 章智能運維的應(yīng)用場景 194
7.1 智能運維 194
7.1.1 智能運維的主要方向 195
7.1.2 智能運維的實施路徑 196
7.2 指標(biāo)監(jiān)控 197
7.2.1 硬件監(jiān)控與軟件監(jiān)控 198
7.2.2 業(yè)務(wù)監(jiān)控 198
7.2.3 節(jié)假日效應(yīng) 201
7.2.4 持續(xù)異常的情況 205
7.2.5 存在基線的情況 205
7.2.6 尋找基線的方法 206
7.3 容量預(yù)估和彈性伸縮 208
7.3.1 容量預(yù)估 208
7.3.2 彈性伸縮 209
7.4 告警系統(tǒng) 210
7.4.1 告警系統(tǒng)的定義與評估指標(biāo) 210
7.4.2 告警關(guān)聯(lián)與收斂 212
7.4.3 基于相似性或聚類算法的告警關(guān)聯(lián)與收斂 214
7.4.4 基于告警屬性泛化層次的告警關(guān)聯(lián)與收斂 219
7.4.5 基于根因分析的告警關(guān)聯(lián)與收斂 224
7.5 小結(jié) 226
第8 章金融領(lǐng)域的應(yīng)用場景 228
8.1 量化交易概述 229
8.1.1 數(shù)據(jù)230
8.1.2 因子 230
8.1.3 回測 231
8.2 因子特征工程 231
8.3 資產(chǎn)定價 234
8.4 資產(chǎn)配置 241
8.5 波動率預(yù)測 243
8.6 小結(jié) 245
參考文獻 246
Ren (2024/7/28 23:57:00):想要一份電子版pdf以用于學(xué)習(xí)