本書共7章,包括新媒體數(shù)據(jù)分析概述、新媒體數(shù)據(jù)采集、新媒體數(shù)據(jù)預處理、新媒體數(shù)據(jù)分析之文本分析、新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析、新媒體數(shù)據(jù)可視化和新媒體數(shù)據(jù)分析與應用實例。本書以新媒體數(shù)據(jù)的概念及分析為起點,進而詳細介紹各類基本的新媒體數(shù)據(jù)分析方法;結合引導案例及知識要點,輔助讀者進一步掌握所學知識,并以具體的數(shù)據(jù)分析實例了解知識的落腳點與應用場景;最終配合案例分析、實踐訓練、課后習題,幫助讀者回顧所學知識,將理論付諸實踐,檢驗讀者的學習程度。
本書可作為高等院校網(wǎng)絡與新媒體、信息管理、大數(shù)據(jù)分析與應用等專業(yè)的教材,也可供數(shù)據(jù)挖掘、新媒體數(shù)據(jù)挖掘、新媒體信息傳播領域的技術人員學習使用,還可作為新媒體數(shù)據(jù)分析研究人員的參考用書。
1.內容系統(tǒng)。本書系統(tǒng)地從理論到實踐,逐層深入,清晰地介紹了新媒體數(shù)據(jù)分析的流程和各類方法。
2.案例豐富。本書列出了數(shù)個實際案例分析的詳細流程,突出了從數(shù)據(jù)分析過程到構建數(shù)據(jù)分析知識體系的編撰理念。
3.形式新穎。本書以二維碼形式嵌入微課視頻,供讀者掃描觀看相關知識點講解,提高學習效率。
馬曉悅,女,博士,西安交通大學新聞與新媒體學院特聘研究員、博士生導師。一直從事新媒體信息傳播與數(shù)據(jù)挖掘的研究和教學工作。 研究方向:信息行為分析與交互設計、新媒體信息傳播與數(shù)據(jù)挖掘、數(shù)字文化消費。
第 1章 新媒體數(shù)據(jù)分析概述 1
【學習目標】 1
引導案例 1
1.1 認識新媒體數(shù)據(jù)分析 2
1.1.1 新媒體數(shù)據(jù)的含義 2
1.1.2 新媒體數(shù)據(jù)分析的含義 4
1.2 新媒體數(shù)據(jù)分析的特征 5
1.3 新媒體數(shù)據(jù)分析的應用領域 6
1.4 新媒體數(shù)據(jù)分析的基本流程 8
1.4.1 新媒體數(shù)據(jù)采集 9
1.4.2 新媒體數(shù)據(jù)預處理 10
1.4.3 新媒體數(shù)據(jù)建模與分析 11
1.4.4 新媒體數(shù)據(jù)可視化 13
1.5 新媒體數(shù)據(jù)分析的常用工具 18
1.5.1 SPSS 18
1.5.2 Gephi 19
1.5.3 軟件使用說明 20
1.6 案例分析——中國房產(chǎn)網(wǎng)絡輿情分析 21
實踐訓練 22
課后習題 23
第 2章 新媒體數(shù)據(jù)采集 26
【學習目標】 26
引導案例 26
2.1 新媒體數(shù)據(jù)采集基礎 27
2.2 新媒體數(shù)據(jù)采集工具 31
2.2.1 公開數(shù)據(jù)庫 31
2.2.2 網(wǎng)絡爬蟲 33
2.2.3 第三方交互式網(wǎng)絡信息采集器 37
2.3 新媒體數(shù)據(jù)采集質量分析與評估 40
2.3.1 新媒體數(shù)據(jù)采集質量的影響因素分析 41
2.3.2 新媒體數(shù)據(jù)采集質量評估 41
2.4 案例分析——豆瓣電影數(shù)據(jù)抓取 43
實踐訓練 45
課后習題 46
第3章 新媒體數(shù)據(jù)預處理 49
【學習目標】 49
引導案例 49
3.1 新媒體數(shù)據(jù)預處理概述 50
3.1.1 新媒體數(shù)據(jù)預處理的定義 50
3.1.2 新媒體數(shù)據(jù)預處理的基本流程 50
3.2 文本數(shù)據(jù)預處理 53
3.2.1 文本數(shù)據(jù)預處理基本流程 54
3.2.2 文本數(shù)據(jù)預處理軟件操作 58
3.3 社交網(wǎng)絡數(shù)據(jù)預處理 61
3.3.1 社交網(wǎng)絡數(shù)據(jù)預處理流程 62
3.3.2 社交網(wǎng)絡數(shù)據(jù)預處理軟件操作 63
3.4 案例分析——電信用戶社交網(wǎng)絡 分析數(shù)據(jù)預處理 75
實踐訓練 76
課后習題 76
第4章 新媒體數(shù)據(jù)分析之文本分析 80
【學習目標】 80
引導案例 80
4.1 文本分析概述 81
4.1.1 文本分析的含義和特征 81
4.1.2 自然語言處理與文本分析的關系 83
4.1.3 文本分析的基本內容 84
4.2 關鍵詞提取 85
4.2.1 基于統(tǒng)計量的關鍵詞提取 86
4.2.2 基于機器學習的關鍵詞提取 88
4.3 文本聚類分析 89
4.3.1 文本相似度計算 90
4.3.2 常用的文本聚類算法 92
4.3.3 聚類結果評估指標 103
4.4 文本情感分析 105
4.4.1 文本情感分析粒度 105
4.4.2 基于情感詞典的文本情感分析方法 106
4.4.3 基于機器學習的文本情感分析方法 108
4.5 SPSS Modeler文本挖掘概述 109
4.5.1 SPSS Modeler中的文本數(shù)據(jù)讀取節(jié)點 110
4.5.2 SPSS Modeler中的文本數(shù)據(jù)分析節(jié)點 111
實踐訓練 113
課后習題 114
第5章 新媒體數(shù)據(jù)分析之在線社交網(wǎng)絡分析 117
【學習目標】 117
引導案例 117
5.1 在線社交網(wǎng)絡分析概述 118
5.1.1 在線社交網(wǎng)絡的含義與特征 119
5.1.2 在線社交網(wǎng)絡分析的基本內容 120
5.2 在線社交網(wǎng)絡結構特征分析與基礎 123
5.2.1 在線社交網(wǎng)絡的數(shù)學表達式 123
5.2.2 在線社交網(wǎng)絡的統(tǒng)計特性 125
5.2.3 在線社交網(wǎng)絡的網(wǎng)絡特性 129
5.3 中心性分析 132
5.3.1 度中心性 132
5.3.2 中介中心度 136
5.3.3 接近中心度 137
5.4 虛擬社區(qū)發(fā)現(xiàn) 139
5.4.1 在線社區(qū) 139
5.4.2 模塊度 140
5.5 個體影響力分析 141
5.5.1 基于網(wǎng)絡結構的個體影響力分析 141
5.5.2 基于行為的個體影響力分析 143
5.5.3 基于話題的個體影響力分析 144
5.6 SPSS在線社交網(wǎng)絡分析概述 145
5.6.1 GA算法 146
5.6.2 DA算法 147
實踐訓練 148
課后習題 148
第6章 新媒體數(shù)據(jù)可視化 151
【學習目標】 151
引導案例 151
6.1 新媒體數(shù)據(jù)可視化概述 152
6.1.1 新媒體數(shù)據(jù)可視化的定義 152
6.1.2 新媒體數(shù)據(jù)可視化的作用 153
6.2 新媒體數(shù)據(jù)可視化的設計原則 155
6.3 新媒體數(shù)據(jù)可視化的常用工具 158
6.4 新媒體數(shù)據(jù)可視化的常見方法 159
6.4.1 關于關系的可視化 159
6.4.2 關于差異的可視化 164
6.4.3 關于比例的可視化 171
6.4.4 關于分布的可視化 174
6.4.5 關于時間的可視化 176
6.4.6 關于地理空間的可視化 178
6.5 案例分析——拿破侖遠征圖 180
實踐訓練 180
課后習題 181
第7章 新媒體數(shù)據(jù)分析與應用實例 184
【學習目標】 184
引導案例 184
7.1 淘寶網(wǎng)購物數(shù)據(jù)分析 185
7.1.1 淘寶網(wǎng)購物數(shù)據(jù)分析內容 185
7.1.2 淘寶網(wǎng)購物數(shù)據(jù)分析過程 186
7.2 今日頭條數(shù)據(jù)分析 200
7.2.1 今日頭條數(shù)據(jù)分析內容 201
7.2.2 今日頭條數(shù)據(jù)分析過程 203
7.3 微博用戶社交數(shù)據(jù)分析 210
7.3.1 微博用戶社交數(shù)據(jù)分析內容 210
7.3.2 微博用戶社交數(shù)據(jù)分析過程 211
實踐訓練 217
課后習題 218
參考文獻 219