機器學(xué)習(xí)互聯(lián)網(wǎng)業(yè)務(wù)安全實踐
定 價:128 元
- 作者:王帥
- 出版時間:2019/9/1
- ISBN:9787121355684
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP393.08
- 頁碼:512
- 紙張:
- 版次:01
- 開本:16開
互聯(lián)網(wǎng)產(chǎn)業(yè)正在從IT時代邁入DT時代(數(shù)據(jù)時代),同時互聯(lián)網(wǎng)產(chǎn)業(yè)的繁榮也催生了黑灰產(chǎn)這樣的群體。那么,在數(shù)據(jù)時代應(yīng)該如何應(yīng)對互聯(lián)網(wǎng)業(yè)務(wù)安全威脅?機器學(xué)習(xí)技術(shù)在互聯(lián)網(wǎng)業(yè)務(wù)安全領(lǐng)域的應(yīng)用正是答案。本書首先從機器學(xué)習(xí)技術(shù)的原理入手,自成體系地介紹了機器學(xué)習(xí)的基礎(chǔ)知識,從數(shù)學(xué)的角度揭示了算法模型背后的基本原理;然后介紹了互聯(lián)網(wǎng)業(yè)務(wù)安全所涉及的重要業(yè)務(wù)場景,以及機器學(xué)習(xí)技術(shù)在這些場景中的應(yīng)用實踐;最后介紹了如何應(yīng)用互聯(lián)網(wǎng)技術(shù)棧來建設(shè)業(yè)務(wù)安全技術(shù)架構(gòu)。作者根據(jù)多年的一線互聯(lián)網(wǎng)公司從業(yè)經(jīng)驗給出了很多獨到的見解,供讀者參考。本書既適合機器學(xué)習(xí)從業(yè)者作為入門參考書,也適合互聯(lián)網(wǎng)業(yè)務(wù)安全從業(yè)者學(xué)習(xí)黑灰產(chǎn)對抗手段,幫助他們做到知己知彼,了解如何應(yīng)用機器學(xué)習(xí)技術(shù)來提高與黑灰產(chǎn)對抗的能力。
王帥,花名“蓮華”,美麗聯(lián)合集團(蘑菇街)安全部風(fēng)控算法技術(shù)負責(zé)人。2015年初加入蘑菇街,主要負責(zé)風(fēng)控相關(guān)的反作弊算法,從無到有搭建了電商平臺的風(fēng)控策略架構(gòu)體系,主要研究方向是基于機器學(xué)習(xí)的風(fēng)控算法策略。吳哲夫,本科就讀于山東大學(xué),研究生就讀于北京大學(xué),曾在微軟亞洲研究院實習(xí),畢業(yè)后就職于阿里巴巴(北京),現(xiàn)供職于美麗聯(lián)合集團。
第1章 互聯(lián)網(wǎng)業(yè)務(wù)安全簡述 1
1.1 互聯(lián)網(wǎng)業(yè)務(wù)安全現(xiàn)狀 1
1.2 如何應(yīng)對挑戰(zhàn) 4
1.3 本章小結(jié) 6
參考資料 6
第2章 機器學(xué)習(xí)入門 8
2.1 相似性 9
2.1.1 范數(shù) 9
2.1.2 度量 12
2.2 矩陣 20
2.2.1 線性空間 20
2.2.2 線性算子 24
2.3 空間 33
2.3.1 內(nèi)積空間 33
2.3.2 歐幾里得空間(Euclid space) 34
2.3.3 酉空間 37
2.3.4 賦范線性空間 38
2.3.5 巴拿赫空間 39
2.3.6 希爾伯特空間 43
2.3.7 核函數(shù) 44
2.4 機器學(xué)習(xí)中的數(shù)學(xué)結(jié)構(gòu) 46
2.4.1 線性結(jié)構(gòu)與非線性結(jié)構(gòu) 46
2.4.2 圖論基礎(chǔ) 47
2.4.3 樹 56
2.4.4 神經(jīng)網(wǎng)絡(luò) 62
2.4.5 深度網(wǎng)絡(luò)結(jié)構(gòu) 80
2.4.6 小結(jié) 95
2.5 統(tǒng)計基礎(chǔ) 96
2.5.1 貝葉斯統(tǒng)計 96
2.5.2 共軛先驗分布 99
2.6 策略與算法 106
2.6.1 凸優(yōu)化的基本概念 106
2.6.2 對偶原理 120
2.6.3 非線性規(guī)劃問題的解決方法 129
2.6.4 無約束問題的最優(yōu)化方法 134
2.7 機器學(xué)習(xí)算法應(yīng)用的經(jīng)驗 145
2.7.1 如何定義機器學(xué)習(xí)目標(biāo) 145
2.7.2 如何從數(shù)據(jù)中獲取最有價值的信息 149
2.7.3 評估模型的表現(xiàn) 154
2.7.4 測試效果遠差于預(yù)期怎么辦 156
2.8 本章小結(jié) 159
參考資料 160
第3章 模型 163
3.1 基本概念 163
3.2 模型評價指標(biāo) 166
3.2.1 混淆矩陣 167
3.2.2 分類問題的基礎(chǔ)指標(biāo) 167
3.2.3 ROC曲線與AUC 171
3.2.4 基尼系數(shù) 173
3.2.5 回歸問題的評價指標(biāo) 175
3.2.6 交叉驗證 175
3.3 回歸算法 177
3.3.1 最小二乘法 177
3.3.2 脊回歸 181
3.3.3 Lasso回歸線性模型 181
3.3.4 多任務(wù)Lasso 181
3.3.5 L1、L2正則雜談 182
3.4 分類算法 183
3.4.1 CART算法 183
3.4.2 支持向量機 186
3.5 降維 188
3.5.1 貝葉斯網(wǎng)絡(luò) 189
3.5.2 主成分分析 195
3.6 主題模型LDA 198
3.6.1 馬爾可夫鏈蒙特卡羅法 198
3.6.2 貝葉斯網(wǎng)絡(luò)與生成模型 199
3.6.3 學(xué)習(xí)方法在LDA中的應(yīng)用 206
3.7 集成學(xué)習(xí)方法(Ensemble Method) 215
3.7.1 Boosting方法 216
3.7.2 Bootstrap Aggregating方法 220
3.7.3 Stacking方法 221
3.7.4 小結(jié) 222
參考資料 223
第4章 機器學(xué)習(xí)實踐的基礎(chǔ)包 226
4.1 簡介 226
4.2 Python機器學(xué)習(xí)基礎(chǔ)環(huán)境 228
4.2.1 Jupyter Notebook 228
4.2.2 Numpy、Scipy、Matplotlib和pandas 231
4.2.3 scikit-learn、gensim、TensorFlow和Keras 250
4.3 Scala的基礎(chǔ)庫 266
4.3.1 Zeppelin 266
4.3.2 Breeze 267
4.3.3 Spark MLlib 276
4.4 本章小結(jié) 281
參考資料 282
第5章 機器學(xué)習(xí)實踐的金剛鉆 283
5.1 簡介 283
5.2 XGBoost 284
5.3 Prediction IO(PIO) 287
5.3.1 部署PIO 287
5.3.2 機器學(xué)習(xí)模型引擎的開發(fā) 294
5.3.3 機器學(xué)習(xí)模型引擎的部署 296
5.3.4 PIO系統(tǒng)的優(yōu)化 297
5.4 Caffe 298
5.5 TensorFlow 304
5.6 BigDL 306
5.7 本章小結(jié) 308
參考資料 308
第6章 賬戶業(yè)務(wù)安全 310
6.1 背景介紹 310
6.2 賬戶安全保障 312
6.2.1 注冊環(huán)節(jié) 312
6.2.2 登錄環(huán)節(jié) 314
6.3 聚類算法在賬戶安全中的應(yīng)用 315
6.3.1 K-Means算法 315
6.3.2 高斯混合模型(GMM) 317
6.3.3 OPTICS算法和DBSCAN算法 326
6.3.4 應(yīng)用案例 331
6.4 本章小結(jié) 334
參考資料 334
第7章 平臺業(yè)務(wù)安全 335
7.1 背景介紹 335
7.2 電商平臺業(yè)務(wù)安全 338
7.3 社交平臺業(yè)務(wù)安全 343
7.4 復(fù)雜網(wǎng)絡(luò)算法在平臺業(yè)務(wù)安全中的應(yīng)用 346
7.4.1 在電商平臺作弊團伙識別中的應(yīng)用 346
7.4.2 在識別虛假社交關(guān)系中的應(yīng)用 351
7.5 本章小結(jié) 353
參考資料 354
第8章 內(nèi)容業(yè)務(wù)安全 355
8.1 背景介紹 355
8.2 如何做好內(nèi)容業(yè)務(wù)安全工作 357
8.2.1 面臨的挑戰(zhàn) 357
8.2.2 部門協(xié)作 358
8.2.3 技術(shù)體系 359
8.3 卷積神經(jīng)網(wǎng)絡(luò)在內(nèi)容業(yè)務(wù)安全中的應(yīng)用 361
8.3.1 人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network) 361
8.3.2 深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network) 367
8.3.3 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network) 379
8.3.4 應(yīng)用案例 392
8.4 本章小結(jié) 405
參考資料 405
第9章 信息業(yè)務(wù)安全 406
9.1 背景介紹 406
9.2 反欺詐業(yè)務(wù) 407
9.3 反爬蟲業(yè)務(wù) 412
9.3.1 驗證問題的可分性 412
9.3.2 提升模型效果 413
9.4 循環(huán)神經(jīng)網(wǎng)絡(luò)在信息安全中的應(yīng)用 414
9.4.1 原始RNN(Vanilla RNN) 414
9.4.2 LSTM算法及其變種 415
9.4.3 應(yīng)用案例 419
9.5 本章小結(jié) 429
參考資料 430
第10章 信貸業(yè)務(wù)安全 432
10.1 背景介紹 432
10.2 信貸業(yè)務(wù)安全簡介 434
10.3 分類算法在信貸業(yè)務(wù)安全中的應(yīng)用 438
10.3.1 典型分類算法的介紹 438
10.3.2 應(yīng)用案例:邏輯回歸模型在信貸中風(fēng)控階段的應(yīng)用 463
10.4 本章小結(jié) 468
參考資料 469
第11章 業(yè)務(wù)安全系統(tǒng)技術(shù)架構(gòu) 470
11.1 整體介紹 470
11.2 平臺層 471
11.3 數(shù)據(jù)層 473
11.4 策略層 474
11.5 服務(wù)層 480
11.6 業(yè)務(wù)層 481
11.7 本章小結(jié) 484
參考資料 484
第12章 總結(jié)與展望 486
12.1 總結(jié) 486
12.2 展望 487
參考資料 489
后記一 490
后記二 491
本書常見數(shù)學(xué)符號定義 492