Excel+Python輕松掌握數(shù)據(jù)分析
定 價(jià):89.8 元
- 作者:曹化宇
- 出版時(shí)間:2023/12/1
- ISBN:9787115623812
- 出 版 社:人民郵電出版社
- 中圖法分類:TP391.13
- 頁(yè)碼:383
- 紙張:
- 版次:01
- 開(kāi)本:16開(kāi)
本書(shū)重點(diǎn)介紹了目前處理數(shù)據(jù)非常有效的工具——Excel、Python和數(shù)據(jù)庫(kù)的應(yīng)用知識(shí)。本書(shū)通過(guò)一則完整的故事討論了如何以Python編程為中心,結(jié)合Excel和數(shù)據(jù)庫(kù)的特點(diǎn),并以基礎(chǔ)統(tǒng)計(jì)學(xué)貫穿其中,幫助讀者深入地了解數(shù)據(jù)分析的相關(guān)知識(shí)。在本書(shū)中,首先,討論了如何使用Excel整理數(shù)據(jù),以及Excel中數(shù)學(xué)和統(tǒng)計(jì)函數(shù)的應(yīng)用;其次,探討了與Python編程相關(guān)的數(shù)據(jù)分析內(nèi)容,包括在Python中進(jìn)行數(shù)據(jù)統(tǒng)計(jì)工作,以及各種格式數(shù)據(jù)的轉(zhuǎn)換等;然后,討論SQLite和MySQL數(shù)據(jù)庫(kù)的應(yīng)用,并介紹了如何使用Python操作數(shù)據(jù)庫(kù);最后,介紹了如何綜合使用Excel、數(shù)據(jù)庫(kù)和Python編程等工具打造自動(dòng)化的數(shù)據(jù)處理中心。
本書(shū)架構(gòu)清晰,內(nèi)容深入淺出,案例豐富,適合需要進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析的職場(chǎng)人士、計(jì)算機(jī)愛(ài)好者等閱讀。
綜合性強(qiáng):本書(shū)將數(shù)據(jù)處理工具、統(tǒng)計(jì)學(xué)原理及其綜合應(yīng)用技巧進(jìn)行了巧妙結(jié)合,使讀者能夠在一個(gè)統(tǒng)一的框架下掌握多種工具的使用方法,提升數(shù)據(jù)分析能力。
內(nèi)容豐富:詳盡地比較了Excel、Python以及數(shù)據(jù)庫(kù)等三大主流數(shù)據(jù)分析工具的優(yōu)勢(shì)和局限,同時(shí)指導(dǎo)讀者如何根據(jù)具體需求靈活搭配這些工具。
循序漸進(jìn):內(nèi)容解析深入淺出,能夠加深讀者對(duì)每種工具在不同場(chǎng)景下應(yīng)用的理解,附贈(zèng)書(shū)中涉及到的源代碼及圖片文件,供讀者邊學(xué)邊連。
案例翔實(shí):本書(shū)采用了生動(dòng)的實(shí)際案例模擬方法,這些案例貼近職場(chǎng)實(shí)際,旨在幫助職場(chǎng)專業(yè)人士和自由職業(yè)者通過(guò)真實(shí)的業(yè)務(wù)場(chǎng)景來(lái)深化對(duì)數(shù)據(jù)處理的認(rèn)識(shí)。
使用 本書(shū)學(xué)習(xí),讀者可以更加靈活和高效地掌握數(shù)據(jù)分析技巧,在提高工作和學(xué)習(xí)效率的同時(shí)增強(qiáng)了自己的數(shù)據(jù)處理能力。
曹化宇,獨(dú)立軟件開(kāi)發(fā)人,擁有20余年軟件開(kāi)發(fā)經(jīng)驗(yàn),從事Windows、.NET Framework、Android等應(yīng)用開(kāi)發(fā),精通Web項(xiàng)目開(kāi)發(fā)。編寫(xiě)的圖書(shū)有《網(wǎng)站全棧開(kāi)發(fā)指南:HTML+CSS+JavaScript+PHP》《網(wǎng)站全棧開(kāi)發(fā)指南:HTML+CSS+JavaScript+ASP.NET》《Java與Android移動(dòng)應(yīng)用開(kāi)發(fā):技術(shù)、方法與實(shí)踐》《C#開(kāi)發(fā)實(shí)用指南:方法與實(shí)踐》《Objective-C和Sprite Kit游戲開(kāi)發(fā)從入門(mén)到精通》《構(gòu)建高質(zhì)量的C#代碼》等。
第 1章 網(wǎng)店開(kāi)業(yè)——初識(shí)數(shù)據(jù) 1
1.1 清點(diǎn)庫(kù)存——獲取原始數(shù)據(jù) 1
1.2 數(shù)據(jù)標(biāo)準(zhǔn)化——整理Excel 數(shù)據(jù) 2
1.2.1 二維表 3
1.2.2 數(shù)據(jù)完整性與正確性 5
1.2.3 拆分?jǐn)?shù)據(jù)——分列與 公式 7
1.2.4 數(shù)據(jù)類型和顯示格式 11
1.2.5 分而治之,按需組合 12
1.3 認(rèn)識(shí)數(shù)據(jù) 14
1.3.1 定量數(shù)據(jù)和定性數(shù)據(jù) 14
1.3.2 絕對(duì)量與相對(duì)量 14
1.4 尋找“大客戶”——排序 16
1.5 數(shù)據(jù)挑著看——篩選 17
1.6 數(shù)據(jù)交換——Excel和CSV 19
第 2章 銷量的起伏——數(shù)據(jù)背后的 故事 25
2.1 銷售數(shù)據(jù)如何——簡(jiǎn)單的統(tǒng)計(jì) 25
2.1.1 算術(shù)平均數(shù) 26
2.1.2 幾何平均數(shù) 27
2.1.3 眾數(shù) 30
2.1.4 最小值和最大值 32
2.1.5 中位數(shù)、四分位數(shù)和 百分位數(shù) 33
2.1.6 方差和標(biāo)準(zhǔn)差 35
2.1.7 標(biāo)準(zhǔn)分 36
2.1.8 分類匯總 38
2.1.9 數(shù)據(jù)透視表 41
2.2 學(xué)看統(tǒng)計(jì)圖 43
2.2.1 折線圖 43
2.2.2 餅圖 45
2.2.3 條形圖 46
2.3 銷量下降——是時(shí)候認(rèn)真 分析數(shù)據(jù)了 47
2.3.1 轉(zhuǎn)化率——訪問(wèn)量和 銷量 48
2.3.2 訪問(wèn)量-購(gòu)買量=? 50
第3章 凌晨3點(diǎn)——又加班了 51
3.1 多銷售渠道的煩惱 51
3.2 日?qǐng)?bào)表、月報(bào)表、 年度報(bào)表等 53
第4章 強(qiáng)大的信息處理工具—— Python編程 54
4.1 創(chuàng)建Python環(huán)境 54
4.1.1 Visual Studio 54
4.1.2 代碼文件的編碼問(wèn)題 56
4.1.3 使用指定版本的Python 58
4.1.4 設(shè)置Path環(huán)境變量 59
4.1.5 命令行窗口 61
4.1.6 Python命令行環(huán)境 62
4.2 編寫(xiě)Python代碼 64
4.3 功能實(shí)現(xiàn)者——函數(shù)和lambda 表達(dá)式 66
4.3.1 函數(shù) 66
4.3.2 可調(diào)用類型 71
4.3.3 lambda表達(dá)式 73
4.4 “對(duì)象”是主角——面向?qū)ο? 編程 74
4.4.1 類與對(duì)象 74
4.4.2 繼承 80
4.4.3 “魔術(shù)方法” 82
4.4.4 with語(yǔ)句 84
4.4.5 類成員和靜態(tài)方法 87
4.5 模塊化管理 91
4.6 向左還是向右——代碼流程 控制 96
4.6.1 條件判斷和if語(yǔ)句 96
4.6.2 循環(huán)語(yǔ)句 100
4.6.3 match語(yǔ)句 103
4.7 處理運(yùn)行錯(cuò)誤 104
第5章 更靈活的計(jì)算——在Python 中處理數(shù)據(jù) 108
5.1 不一樣的算術(shù)運(yùn)算 108
5.2 隨機(jī)數(shù) 110
5.3 序列 112
5.3.1 列表 113
5.3.2 元組 121
5.3.3 數(shù)列 123
5.4 字典 124
5.5 集合 128
5.6 更自由的排列—— sorted() 函數(shù) 129
5.7 數(shù)學(xué)計(jì)算—— math模塊 131
5.8 統(tǒng)計(jì)資源—— statistics模塊 132
5.8.1 使用Fraction類處理 分?jǐn)?shù) 132
5.8.2 算術(shù)平均數(shù) 133
5.8.3 幾何平均數(shù) 133
5.8.4 眾數(shù) 134
5.8.5 中位數(shù) 134
5.8.6 方差和標(biāo)準(zhǔn)差 135
5.9 計(jì)算百分位數(shù) 136
5.10 計(jì)算標(biāo)準(zhǔn)分?jǐn)?shù) 139
5.11 按中文拼音排序 139
5.12 日期和時(shí)間 142
5.12.1 datetime類 142
5.12.2 時(shí)間間隔 143
5.12.3 時(shí)區(qū) 144
5.12.4 時(shí)間戳 144
5.12.5 日期和時(shí)間的推算 145
5.12.6 格式轉(zhuǎn)換 146
第6章 “超能熊貓”來(lái)幫忙—— pandas應(yīng)用 149
6.1 Series對(duì)象 149
6.2 排序 152
6.3 統(tǒng)計(jì)方法 154
第7章 二維表模型—— DataFrame 158
7.1 DataFrame對(duì)象 158
7.2 讀取數(shù)據(jù) 160
7.2.1 iloc和loc屬性 160
7.2.2 讀取列 163
7.2.3 讀取行 164
7.3 排序 168
7.4 按條件查詢數(shù)據(jù) 170
7.5 處理空值數(shù)據(jù) 173
7.6 處理重復(fù)數(shù)據(jù) 174
7.7 數(shù)據(jù)旋轉(zhuǎn) 177
7.8 數(shù)據(jù)合并 178
7.9 數(shù)據(jù)連接 181
7.10 統(tǒng)計(jì)方法 182
7.11 分組 183
7.12 透視表 185
第8章 圖形更直觀——pandas 繪制統(tǒng)計(jì)圖 188
8.1 部分與整體的比例——餅圖 189
8.2 數(shù)據(jù)的關(guān)系與分布——散點(diǎn)圖與 氣泡圖 193
8.3 趨勢(shì)——折線圖 197
8.4 更直觀的對(duì)比——條形圖 202
8.5 數(shù)據(jù)的“距”——箱線圖 209
第9章 數(shù)據(jù)中轉(zhuǎn)站——數(shù)據(jù)格式 轉(zhuǎn)換 211
9.1 xlwt模塊寫(xiě)入Excel 211
9.2 xlrd模塊讀取Excel 215
9.3 openpyxl模塊讀寫(xiě)Excel 217
9.4 pandas模塊讀寫(xiě)Excel 220
9.5 csv模塊讀寫(xiě)CSV數(shù)據(jù) 223
9.6 pandas模塊讀寫(xiě)CSV數(shù)據(jù) 227
第 10章 強(qiáng)大的數(shù)據(jù)倉(cāng)庫(kù)—— SQLite數(shù)據(jù)庫(kù) 229
10.1 使用DB Browser for SQLite 229
10.2 數(shù)據(jù)類型 230
10.3 數(shù)據(jù)表 230
10.3.1 創(chuàng)建表 230
10.3.2 表的關(guān)聯(lián)——主鍵、唯一 約束和外鍵 232
10.3.3 添加字段 234
10.3.4 刪除表 235
10.3.5 sqlite_master系統(tǒng)表 235
10.3.6 索引 236
10.4 導(dǎo)入CSV數(shù)據(jù) 236
10.5 查詢與視圖 237
10.5.1 查詢條件 238
10.5.2 排序 240
10.5.3 分組與統(tǒng)計(jì) 242
10.5.4 連接 243
10.5.5 聯(lián)合 245
10.5.6 limit和offset關(guān)鍵字 247
10.5.7 exists語(yǔ)句 248
10.5.8 case語(yǔ)句 248
10.5.9 視圖 249
10.5.10 將查詢結(jié)果 保存到表 251
10.5.11 將數(shù)據(jù)保存到CSV 文件 252
10.6 添加數(shù)據(jù) 252
10.7 修改數(shù)據(jù) 254
10.8 刪除數(shù)據(jù) 255
10.9 日期和時(shí)間的處理方式 255
第 11章 Python操作SQLite 261
11.1 應(yīng)用基礎(chǔ) 261
11.1.1 執(zhí)行SQL語(yǔ)句 262
11.1.2 讀取查詢結(jié)果 263
11.1.3 創(chuàng)建tSqlite類 263
11.2 查詢單值 265
11.3 查詢單條記錄 266
11.4 查詢多條記錄 267
11.5 查詢單列數(shù)據(jù) 270
11.6 添加數(shù)據(jù) 271
11.7 修改數(shù)據(jù) 273
11.8 刪除數(shù)據(jù) 274
11.9 擴(kuò)展操作 275
11.9.1 自定義函數(shù) 275
11.9.2 聚合函數(shù) 277
11.9.3 排序規(guī)則 280
11.10 pandas讀取和寫(xiě)入SQLite數(shù)據(jù) 282
第 12章 更大、更快、更強(qiáng)——MySQL數(shù)據(jù)庫(kù) 285
12.1 MySQL安裝與配置 285
12.2 使用HeidiSQL 289
12.3 常用數(shù)據(jù)類型 291
12.4 數(shù)據(jù)表 292
12.4.1 創(chuàng)建表 292
12.4.2 主鍵、唯一值和外鍵約束 294
12.4.3 修改字段定義 295
12.4.4 復(fù)制表結(jié)構(gòu) 296
12.4.5 表的重命名(表的移動(dòng)) 297
12.4.6 刪除表 298
12.4.7 索引 298
12.5 導(dǎo)入CSV數(shù)據(jù) 298
12.6 查詢和視圖 302
12.6.1 查詢條件與排序 302
12.6.2 分組與統(tǒng)計(jì) 307
12.6.3 連接 307
12.6.4 聯(lián)合 308
12.6.5 limit和offset關(guān)鍵字 310
12.6.6 exists語(yǔ)句 311
12.6.7 case語(yǔ)句 311
12.6.8 視圖 312
12.6.9 查詢結(jié)果保存到表 312
12.6.10 查詢結(jié)果導(dǎo)出CSV 313
12.7 數(shù)據(jù)添加、修改和刪除 314
12.7.1 添加數(shù)據(jù) 314
12.7.2 修改數(shù)據(jù) 315
12.7.3 刪除數(shù)據(jù) 315
12.8 常用函數(shù)與功能 315
12.8.1 統(tǒng)計(jì)與數(shù)學(xué)計(jì)算 315
12.8.2 文本操作 316
12.8.3 日期和時(shí)間 317
12.8.4 if()和ifnull()函數(shù) 320
12.8.5 判斷對(duì)象是否存在 320
12.9 存儲(chǔ)過(guò)程 321
第 13章 Python操作MySQL 323
13.1 應(yīng)用基礎(chǔ) 323
13.1.1 連接數(shù)據(jù)庫(kù) 323
13.1.2 執(zhí)行SQL并讀取查詢結(jié)果 324
13.1.3 使用參數(shù)傳遞數(shù)據(jù) 325
13.2 創(chuàng)建tMySql類 325
13.3 查詢單值 327
13.4 查詢單條記錄 328
13.5 查詢多條記錄 329
13.6 查詢單列數(shù)據(jù) 331
13.7 添加記錄 332
13.8 修改數(shù)據(jù) 335
13.9 刪除記錄 336
13.10 pandas讀取和寫(xiě)入MySQL數(shù)據(jù) 337
第 14章 數(shù)據(jù)一籮筐——打造數(shù)據(jù)中心 339
14.1 創(chuàng)建數(shù)據(jù)中心 339
14.2 批量導(dǎo)入數(shù)據(jù) 341
14.2.1 標(biāo)準(zhǔn)化數(shù)據(jù) 341
14.2.2 導(dǎo)入Excel數(shù)據(jù) 342
14.3 定時(shí)導(dǎo)入 343
14.4 處理網(wǎng)絡(luò)數(shù)據(jù) 349
14.4.1 HTML表格 349
14.4.2 JSON 352
14.5 從圖像中識(shí)別數(shù)據(jù)OCR) 353
14.5.1 圖像識(shí)別——EasyOCR 354
14.5.2 裁剪圖片 356
14.5.3 保存到“數(shù)據(jù)中心” 359
第 15章 更深入的數(shù)據(jù)分析 365
15.1 客戶的抱怨——處理文本信息 365
15.1.1 字符串處理 366
15.1.2 正則表達(dá)式 368
15.2 關(guān)于服裝的信息 373
15.3 “購(gòu)買指數(shù)”——產(chǎn)品推薦算法 374
第 16章 早上八點(diǎn),一杯咖啡,一份報(bào)表 378
16.1 自動(dòng)生成報(bào)表 378
16.1.1 數(shù)據(jù)計(jì)算 378
16.1.2 生成Excel報(bào)表 379
16.2 繼續(xù)前進(jìn) 383