網(wǎng)絡(luò)安全大數(shù)據(jù)分析與實戰(zhàn)
定 價:79 元
叢書名:網(wǎng)絡(luò)空間安全技術(shù)叢書
《網(wǎng)絡(luò)安全大數(shù)據(jù)分析與實戰(zhàn)》深入淺出地介紹了大數(shù)據(jù)安全分析的理論和實踐基礎(chǔ),涵蓋大數(shù)據(jù)安全概述、機器學(xué)習(xí)、深度學(xué)習(xí)、開發(fā)編程工具以及相關(guān)法律法規(guī)等內(nèi)容,簡明扼要地介紹了聚類分析、關(guān)聯(lián)分析、預(yù)測分析及分類所涉及的主流算法,并以實戰(zhàn)導(dǎo)向的綜合案例對大數(shù)據(jù)安全分析的相關(guān)知識和技術(shù)進行了整合應(yīng)用。《網(wǎng)絡(luò)安全大數(shù)據(jù)分析與實戰(zhàn)》可以作為高校大數(shù)據(jù)安全分析相關(guān)專業(yè)課程的教材,也可作為從事信息安全咨詢服務(wù)、測評認證、安全建設(shè)、安全管理工作的從業(yè)人員及其他大數(shù)據(jù)安全分析相關(guān)領(lǐng)域工作人員的技術(shù)參考書。
1. 作者權(quán)威。本書由網(wǎng)絡(luò)安全行業(yè)領(lǐng)先企業(yè)安恒信息組織編寫,作者均為企業(yè)資深的技術(shù)專家,有豐富的實戰(zhàn)技術(shù)經(jīng)驗。2. 內(nèi)容實用。本書涵蓋了云計算安全關(guān)鍵技術(shù)、安全運維與服務(wù)、國內(nèi)外法律法規(guī)等內(nèi)容,以及云安全工程師認證培訓(xùn)的全部知識點。
近年來,我國大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展進入爆發(fā)期,越來越多的企業(yè)和組織將大數(shù)據(jù)作為自己經(jīng)營戰(zhàn)略的重要組成部分。大數(shù)據(jù)技術(shù)作為一種新興的生產(chǎn)資料和創(chuàng)新要素,必須結(jié)合具體的行業(yè)和應(yīng)用場景才能發(fā)揮其價值,驅(qū)動產(chǎn)業(yè)發(fā)展和轉(zhuǎn)型。同時,面對日益嚴峻的網(wǎng)絡(luò)安全挑戰(zhàn),業(yè)界提出了以數(shù)據(jù)分析為中心的網(wǎng)絡(luò)安全防護體系,把主動檢測和自動化應(yīng)急的希望寄托于日志、流量和威脅情報為數(shù)據(jù)源的智能分析技術(shù),以解決APT攻擊、用戶行為分析這類復(fù)雜且隱蔽的網(wǎng)絡(luò)安全威脅。而大數(shù)據(jù)分析技術(shù)本身是一種普適性的方法論,雖然業(yè)界提出了眾多的大數(shù)據(jù)處理體系和基于統(tǒng)計學(xué)或機器學(xué)習(xí)的方法,但如何將大數(shù)據(jù)智能分析技術(shù)應(yīng)用于復(fù)雜的網(wǎng)絡(luò)安全防護場景,如何開展大數(shù)據(jù)安全的關(guān)聯(lián)分析和綜合研判,仍然是業(yè)界值得深入思考和研究的熱點問題。在這一背景下,大數(shù)據(jù)安全分析師成為稀缺人才。另外,市面上缺少合理地將大數(shù)據(jù)智能分析技術(shù)與安全防護場景進行有效結(jié)合的書籍,這嚴重制約了安全分析師的成長。杭州安恒信息技術(shù)股份有限公司依托自身的安全服務(wù)業(yè)務(wù),自主研發(fā)了AiLPHA大數(shù)據(jù)智能安全平臺,具備全網(wǎng)流量處理、異構(gòu)日志集成、核心數(shù)據(jù)安全分析、辦公應(yīng)用安全威脅挖掘等前沿大數(shù)據(jù)智能安全威脅挖掘分析與預(yù)警管控能力,深耕公安、網(wǎng)信、金融等多個行業(yè)及領(lǐng)域,曾連續(xù)三年獲評工信部示范試點項目,并獲得浙江省計算機學(xué)會、浙江省計算機行業(yè)協(xié)會2020年度優(yōu)秀產(chǎn)品獎及2020年度中國網(wǎng)絡(luò)安全與信息產(chǎn)業(yè)金智獎等多個獎項。鑒于目前關(guān)于大數(shù)據(jù)安全分析的圖書較少,很難找到一本書系統(tǒng)、有針對性地對大數(shù)據(jù)安全分析這一重要技能以理論與實踐相結(jié)合的方式進行全方位的介紹。因此,編者希望通過編寫此書,將工作中積累的實踐經(jīng)驗與研究成果分享給廣大讀者。《網(wǎng)絡(luò)安全大數(shù)據(jù)分析與實戰(zhàn)》共10章。其中,第1章為大數(shù)據(jù)安全概述,主要介紹大數(shù)據(jù)的定義與特征、大數(shù)據(jù)平臺與架構(gòu)、大數(shù)據(jù)應(yīng)用案例以及大數(shù)據(jù)分析技術(shù)在安全中的應(yīng)用,幫助讀者建立對大數(shù)據(jù)安全分析的整體認知;第2章是大數(shù)據(jù)安全分析基礎(chǔ),從理論基礎(chǔ)和實踐基礎(chǔ)出發(fā),對大數(shù)據(jù)安全分析的基本概念、思路、算法及Python等常見編程工具進行了簡單的介紹;第3章為大數(shù)據(jù)分析工程技術(shù),對大數(shù)據(jù)采集、存儲、搜索、計算引擎以及數(shù)據(jù)可視化的常用方法與工具進行了系統(tǒng)的介紹;第4章是機器學(xué)習(xí)和深度學(xué)習(xí),首先介紹了機器學(xué)習(xí)的基本定義、適用場景,以及監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)算法的概念,然后對深度學(xué)習(xí)的相關(guān)概念、核心思想等進行了闡述;第5章是分類算法,選擇了分類算法中典型的五個算法,即決策樹、樸素貝葉斯、K近鄰(KNN)模型、支持向量機(SVM)和BP神經(jīng)網(wǎng)絡(luò),從算法原理、案例分析及算法優(yōu)缺點等方面進行了介紹;第6章是預(yù)測分析,主要目的是介紹統(tǒng)計預(yù)測的基本概念及典型的統(tǒng)計預(yù)測方法,如時間序列、回歸分析等,并引導(dǎo)讀者如何使用不同的預(yù)測分析方法;第7章是關(guān)聯(lián)分析,對關(guān)聯(lián)分析的基本概念、Apriori算法和FP-growth算法原理,以及應(yīng)用場景進行了詳細的闡述;第8章是聚類分析,介紹了歐氏距離、曼哈頓距離和閔可夫斯基距離等相似度計算方法,以及層次聚類、k-means聚類和EM聚類三個經(jīng)典聚類算法的原理和案例等;第9章是大數(shù)據(jù)安全分析應(yīng)用,圍繞僵尸網(wǎng)絡(luò)檢測、惡意URL檢測、WebShell檢測及Malware檢測四類應(yīng)用展開討論,以便讀者能夠更好地理解前面章節(jié)的算法在實際中的應(yīng)用;第10章是大數(shù)據(jù)安全相關(guān)法律法規(guī),介紹了現(xiàn)行大數(shù)據(jù)安全的國家政策、法治體系建設(shè),以及大數(shù)據(jù)安全分析相關(guān)的行為規(guī)范,為讀者之后的從業(yè)道路提出了警示。《網(wǎng)絡(luò)安全大數(shù)據(jù)分析與實戰(zhàn)》以理論聯(lián)系實際為指導(dǎo)原則,將大數(shù)據(jù)安全分析的理論知識、工具和實踐案例進行有機結(jié)合,可作為普通高等院校和職業(yè)院校相關(guān)專業(yè)的課程教材,以及網(wǎng)絡(luò)安全技術(shù)從業(yè)人員的參考用書。讀者在閱讀本書的過程中,不必執(zhí)著于弄懂算法推導(dǎo)的步驟,對于難度較大的算法只需理解即可,若能輔以實踐操作將理論付諸應(yīng)用,將能加深對大數(shù)據(jù)安全分析技能的理解。《網(wǎng)絡(luò)安全大數(shù)據(jù)分析與實戰(zhàn)》主要由孫佳、苗春雨、劉博編寫,另外,談修竹、姜鵬、莫凡、聶桂兵、楊錦峰、陳子杰、龍文潔、吳鳴旦、金碧霞、郭婷婷、陳美璇、黃施君、葉雷鵬和王倫也參與了本書的編寫和審稿校對工作。大數(shù)據(jù)安全分析須在法律法規(guī)允許、目標(biāo)單位授權(quán)的情況下實施,切勿將本書介紹的方法和手段在未經(jīng)允許的情況下,針對任何生產(chǎn)系統(tǒng)使用。同時,要格外關(guān)注大數(shù)據(jù)安全分析過程中的保密性和規(guī)范性指導(dǎo)。在此,對所有參與本書編寫、審閱和出版等工作的人員表示感謝。由于編者水平有限,本書不妥之處在所難免,望廣大網(wǎng)絡(luò)安全專家、讀者朋友批評指正,共同為我國網(wǎng)絡(luò)安全技術(shù)人才培養(yǎng)和人才認證體系建設(shè)而努力。編者
1. 孫佳,獲浙江大學(xué)和馬里蘭大學(xué)信息管理本碩學(xué)位,現(xiàn)任安恒信息資深數(shù)據(jù)研究員。對大數(shù)據(jù)挖掘、機器學(xué)習(xí)在信息安全領(lǐng)域的應(yīng)用有深入研究,同時致力于大數(shù)據(jù)安全分析的教育工作。曾擔(dān)任美國硅谷互聯(lián)網(wǎng)公司數(shù)據(jù)科學(xué)家,從事大數(shù)據(jù)建模、定量預(yù)測、產(chǎn)品優(yōu)化等工作。2. 苗春雨,博士,杭州安恒信息高級副總裁。西安電子科技大學(xué)、中國科學(xué)技術(shù)大學(xué)等多所高校企業(yè)研究生導(dǎo)師,擅長網(wǎng)絡(luò)安全防護體系、物聯(lián)網(wǎng)安全,發(fā)表各類學(xué)術(shù)論文50余篇,專利和軟著20余項,出版專著和教材6本。3. 劉博,杭州安恒信息首席科學(xué)家,美國馬里蘭大學(xué)計算機博士。完成態(tài)勢感知、數(shù)據(jù)安全、隱私計算等領(lǐng)域300余項技術(shù)發(fā)明專利。主導(dǎo)和重點參與、省級重大科研項目9項。擔(dān)任浙大安恒前沿研究中心副主任、大數(shù)據(jù)態(tài)勢感知國地研究中心副主任、之江實驗室網(wǎng)絡(luò)安全研究中心副主任等。
前言第1章 大數(shù)據(jù)安全概述1.1 大數(shù)據(jù)相關(guān)理論1.1.1 大數(shù)據(jù)產(chǎn)生的背景1.1.2 大數(shù)據(jù)的定義與構(gòu)成1.1.3 大數(shù)據(jù)的特征與價值1.2 大數(shù)據(jù)相關(guān)技術(shù)1.2.1 大數(shù)據(jù)平臺與架構(gòu)1.2.2 大數(shù)據(jù)分析常用工具1.3 大數(shù)據(jù)應(yīng)用案例1.3.1 社交網(wǎng)絡(luò)廣告投放系統(tǒng)1.3.2 圍棋智能AlphaGo1.3.3 圖像識別1.4 大數(shù)據(jù)分析技術(shù)在安全中的應(yīng)用1.4.1 安全需要大數(shù)據(jù)1.4.2 安全大數(shù)據(jù)分析技術(shù)基礎(chǔ)及分析思路本章小結(jié)課后習(xí)題第2章 大數(shù)據(jù)安全分析基礎(chǔ)2.1 大數(shù)據(jù)分析理論基礎(chǔ)2.1.1 基本概念2.1.2 分析思路2.1.3 分析算法2.1.4 常見安全應(yīng)用場景的特征及檢測方法2.2 大數(shù)據(jù)分析實踐基礎(chǔ)2.2.1 編程工具2.2.2 編程環(huán)境2.2.3 Python基礎(chǔ)知識本章小結(jié)課后習(xí)題第3章 大數(shù)據(jù)分析工程技術(shù)3.1 數(shù)據(jù)采集3.1.1 數(shù)據(jù)采集的概念3.1.2 日志采集工具Logstash3.2 非結(jié)構(gòu)化存儲3.2.1 HDFS的基本信息3.2.2 HDFS常用命令3.2.3 HDFS管理命令3.3 結(jié)構(gòu)化存儲3.3.1 HBase基本介紹3.3.2 HBase中的基本概念3.3.3 Hbase常用命令3.4 數(shù)據(jù)搜索3.4.1 Elasticsearch基本概念3.4.2 副本復(fù)制機制3.4.3 映射和分詞3.4.4 映射管理3.4.5 索引管理命令3.4.6 搜索3.4.7 聚合分析3.5 實時計算引擎3.5.1 基本概念3.5.2 主流的大數(shù)據(jù)流計算引擎3.5.3 Apache Flink3.6 批量計算引擎3.6.1 Apache Spark項目簡介3.6.2 Spark核心模塊3.6.3 Spark與Hadoop的區(qū)別3.7 計算管理調(diào)度3.7.1 任務(wù)管理調(diào)度中的挑戰(zhàn)3.7.2 Airflow介紹3.7.3 任務(wù)DAG與任務(wù)依賴3.7.4 Airflow Hook3.7.5 Airflow Operator3.7.6 Airflow命令3.8 數(shù)據(jù)可視化3.8.1 明確表達意圖、選擇數(shù)據(jù)3.8.2 拆解信息圖的要素3.8.3 關(guān)于色彩、字體、圖標(biāo)3.8.4 可視化的交互考慮3.8.5 人類視覺缺陷及對數(shù)據(jù)可視化的影響3.8.6 數(shù)據(jù)可視化工具3.8.7 數(shù)據(jù)可視化類庫本章小結(jié)課后習(xí)題第4章 機器學(xué)習(xí)和深度學(xué)習(xí)4.1 機器學(xué)習(xí)的基本概念4.1.1 基本定義4.1.2 應(yīng)用場景4.2 機器學(xué)習(xí)的算法分類4.2.1 監(jiān)督學(xué)習(xí)算法4.2.2 無監(jiān)督學(xué)習(xí)算法4.2.3 特殊算法4.3 深度學(xué)習(xí)基本理論4.3.1 相關(guān)概念4.3.2 深度學(xué)習(xí)的特點4.4 深度學(xué)習(xí)的進展4.4.1 AlphaGo戰(zhàn)勝李世石4.4.2 圖像識別領(lǐng)域深度學(xué)習(xí)超越人類4.4.3 目標(biāo)識別領(lǐng)域深度學(xué)習(xí)推動無人駕駛的跨越式發(fā)展4.5 深度學(xué)習(xí)核心思想4.5.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)4.5.2 遞歸神經(jīng)網(wǎng)絡(luò)(RNN)4.5.3 長短期記憶網(wǎng)絡(luò)(LSTM)本章小結(jié)課后習(xí)題第5章 分類算法5.1 決策樹5.1.1 基本概念5.1.2 典型算法介紹5.1.3 案例分析及算法優(yōu)缺點5.2 樸素貝葉斯算法5.2.1 概念及原理5.2.2 案例分析及算法優(yōu)缺點5.3 K近鄰(KNN)5.3.1 基本概念及原理5.3.2 案例分析及算法優(yōu)缺點5.4 支持向量機(SVM)算法5.4.1 基本概念及原理5.4.2 案例分析及算法優(yōu)缺點5.5 BP神經(jīng)網(wǎng)絡(luò)5.5.1 基本概念5.5.2 算法原理5.5.3 案例分析及算法優(yōu)缺點本章小結(jié)課后習(xí)題第6章 預(yù)測分析6.1 統(tǒng)計預(yù)測6.1.1 統(tǒng)計預(yù)測的概念及作用6.1.2 統(tǒng)計預(yù)測方法的分類與選擇6.1.3 統(tǒng)計預(yù)測的原則與步驟6.2 時間序列分析6.2.1 時間序列的概念6.2.2 移動平均模型6.2.3 指數(shù)平滑模型6.2.4 隨機時間序列模型6.3 回歸分析6.3.1 回歸分析的原理6.3.2 線性回歸6.3.3 邏輯回歸本章小結(jié)課后習(xí)題第7章 關(guān)聯(lián)分析7.1 基本概念7.1.1 項與項集7.1.2 關(guān)聯(lián)規(guī)則及相關(guān)度量7.2 Apriori算法7.2.1 Apriori算法原理7.2.2 Apriori算法示例7.3 FP-Growth算法7.3.1 FP-Growth算法原理7.3.2 FP-Growth算法示例7.4 關(guān)聯(lián)分析應(yīng)用場景本章小結(jié)課后習(xí)題第8章 聚類分析8.1 聚類概述8.1.1 基本概念8.1.2 聚類分析的應(yīng)用8.2 相似度(距離)計算8.2.1 歐氏距離8.2.2 曼哈頓距離8.2.3 閔可夫斯基距離8.2.4 馬氏距離8.2.5 夾角余弦8.3 層次聚類8.3.1 基本概念及原理8.3.2 案例分析8.4 k-means聚類8.4.1 基本概念及原理8.4.2 案例分析8.5 EM聚類8.5.1 基本原理與概念8.5.2 案例分析本章小結(jié)