·網(wǎng)絡內(nèi)容安全是一個新興的研究領域,也是網(wǎng)絡空間安全的一個重要研究方向,融合了機器學習、自然語言處理、數(shù)據(jù)挖掘、計算機視覺等多個學科的知識,具有廣闊的研究前景和應用價值。本書是網(wǎng)絡空間安全的專業(yè)教材,重點介紹了網(wǎng)絡內(nèi)容安全的基本原理和相關專業(yè)基礎知識。全書共12章,內(nèi)容包括網(wǎng)絡內(nèi)容安全的基本概念及發(fā)展歷史、網(wǎng)絡內(nèi)容數(shù)據(jù)獲取與預處理、文本數(shù)據(jù)分類與聚類、網(wǎng)絡輿情分析、話題檢測與跟蹤、社交網(wǎng)絡分析與社區(qū)檢測、情感分析、圖像與視頻內(nèi)容分析與檢測等。
本書適用于信息安全、網(wǎng)絡空間安全、計算機等相關專業(yè)高年級本科生和研究生的專業(yè)學習,也可供有關科研人員參考使用。
第1章 網(wǎng)絡內(nèi)容安全概述
1.1 網(wǎng)絡內(nèi)容安全的背景
1.1.1 互聯(lián)網(wǎng)的發(fā)展
1.1.2 相關法律法規(guī)
1.1.3 網(wǎng)絡內(nèi)容數(shù)據(jù)類型
1.1.4 網(wǎng)絡內(nèi)容安全面臨的挑戰(zhàn)
1.2 網(wǎng)絡內(nèi)容安全的定義
1.3 網(wǎng)絡內(nèi)容安全的研究
1.3.1 網(wǎng)絡內(nèi)容安全知識體系
1.3.2 網(wǎng)絡內(nèi)容安全研究方法
1.4 網(wǎng)絡內(nèi)容安全的發(fā)展
1.4.1 網(wǎng)絡內(nèi)容安全現(xiàn)狀
1.4.2 網(wǎng)絡內(nèi)容安全的發(fā)展趨勢
1.5 本章小結
參考文獻
第2章 網(wǎng)絡信息內(nèi)容數(shù)據(jù)獲取
2.1 網(wǎng)絡數(shù)據(jù)
2.1.1 網(wǎng)絡媒體數(shù)據(jù)
2.1.2 網(wǎng)絡通信數(shù)據(jù)
2.2 網(wǎng)絡媒體數(shù)據(jù)的爬取
2.2.1 通用網(wǎng)絡爬蟲算法
2.2.2 網(wǎng)頁數(shù)據(jù)處理
2.2.3 網(wǎng)頁解析
2.2.4 鏈接提取與規(guī)范化
2.2.5 爬蟲陷阱
2.2.6 網(wǎng)頁排序
2.2.7 聚焦網(wǎng)絡爬蟲
2.3 網(wǎng)絡爬蟲的評價
2.4 網(wǎng)絡垃圾信息
2.5 網(wǎng)絡媒體數(shù)據(jù)獲取的難點
2.6 本章小結
參考文獻
第3章 文本預處理
3.1 文本的特征抽取
3.1.1 詞條化
3.1.2 詞形規(guī)范化
3.1.3 中文分詞
3.1.4 中文分詞工具
3.2 文檔模型
3.2.1 布爾模
3.2.2 n元語法模型
3.2.3 向最空間模型
3.3 文檔相似度
3.4 本章小結
參考文獻
第4章 文本分類
4.1 概述
4.2 文本表示模型
4.3 特征選擇
4.3.1 互信息法
4.3.2 信息增益法
4.3.3 卡方統(tǒng)計法
4.4 基于統(tǒng)計學習的文本分類算法
4.4.1 樸素貝葉斯分類模型
4.4.2 支持向量機
4.5 性能評價指標
4.6 本章小結
參考文獻
第5章 文本聚類
5.1 概述
5.2 文本相似度計算
5.2.1 樣本間的相似性
5.2.2 簇間的相似性
5.2.3 樣本與簇間的相似性
5.3 文本聚類算法
5.3.1 K均值聚類
5.3.2 單遍聚類
5.3.3 譜聚類算法
5.3.4 層次聚類
5.3.5 密度聚類
5.4 聚類評估
5.4.1 基于外部標準的評估
5.4.2 基于內(nèi)部標準的評估
5.5 本章小結
參考文獻
第6章 網(wǎng)絡輿情分析
6.1 網(wǎng)絡輿情基本概念
6.2 網(wǎng)絡輿情的形成
6.3 網(wǎng)絡輿情的特點
6.4 網(wǎng)絡輿情的發(fā)展
6.5 網(wǎng)絡輿情分析的主要技術
6.5.1 網(wǎng)絡輿情數(shù)據(jù)采集
6.5.2 輿情事件檢測
6.5.3 網(wǎng)絡輿情評估
6.6 網(wǎng)絡謠言
6.6.1 網(wǎng)絡謠言的類型及成因
6.6.2 網(wǎng)絡謠言的特征
6.6.3 網(wǎng)絡謠言的檢測
6.7 網(wǎng)絡水軍
6.7.1 網(wǎng)絡水軍的危害
6.7.2 網(wǎng)絡水軍的分類
6.7.3 網(wǎng)絡水軍的特征
6.7.4 網(wǎng)絡水軍的檢測
6.8 本章小結
參考文獻
第7章 話題檢測與跟蹤
7.1 話題檢測與跟蹤概述
7.2 術語
7.3 任務
7.3.1 報道切分
7.3.2 話題檢測
7.3.3 首次報道檢測
7.3.4 話題跟蹤
7.3.5 關聯(lián)檢測
7.4 語料
7.5 評測
7.6 話題表示與關聯(lián)檢測
7.7 話題檢測
7.7.1 在線話題檢測
7.7.2 話題回溯檢測
7.8 話題跟蹤
7.9 突發(fā)話題檢測
7.9.1 突發(fā)狀態(tài)識別
7.9.2 突發(fā)話題生成
7.10 本章小結
參考文獻
第8章 社交網(wǎng)絡分析
8.1 社交網(wǎng)絡分析基礎
8.1.1 基本概念
8.1.2 社交網(wǎng)絡分析的發(fā)展
8.1.3 社交化媒體的發(fā)展
8.1.4 社交網(wǎng)絡分析的應用
8.1.5 社交網(wǎng)絡分析相關理論
8.1.6 數(shù)據(jù)挖掘中的社交網(wǎng)絡分析
8.2 節(jié)點排序
8.2.1 網(wǎng)絡中的重要節(jié)點
8.2.2 基于節(jié)點近鄰的排序方法
8.2.3 基于路徑的排序方法
8.2.4 基于特征向量的排序方法
8.3 鏈路預測
8.3.1 基于節(jié)點屬性的相似性
8.3.2 基于局部信息的相似性
8.3.3 基于路徑的相似性
8.4 擴散模型
8.4.1 節(jié)點影響力
8.4.2 擴散曲線
8.4.3 影響力傳播模型
8.4.4 影響力最大化
8.5 感染模型
8.5.1 通用方案
8.5.2 SIR模
8.5.3 SIS模型
8.5.4 流行病閾值
8.6 木本章小結
參考文獻
第9章 杜區(qū)檢測
9.1 基木概念
9.2 以節(jié)點為中心的社區(qū)發(fā)現(xiàn)
9.2.1 完全連通
9.2.2 可達性
9.3 以群組為中心的社區(qū)發(fā)現(xiàn)
9.4 以網(wǎng)絡為中心的社區(qū)發(fā)現(xiàn)
9.4.1 頂點相似性
9.4.2 隱含空間模型
9.4.3 塊模型近似
9.4.4 諧聚類
9.4.5 模塊度最大化
9.4.6 社區(qū)檢測的統(tǒng)一過程
9.5 以層次為中心的社區(qū)檢測
9.5.1 分裂式層次聚類法
9.5.2 聚合式層次聚類法
9.6 多維網(wǎng)絡
9.6.1 網(wǎng)絡集成
9.6.2 效用集成
9.6.3 特征集成
9.6.4 劃分集成
9.7 社區(qū)評價
9.8 本章小結
參考文獻
第10章 情感分析
10.1 情感分析任務分類
10.1.1 基于任務目標的分類
10.1.2 基于分析粒度