《Pandas數(shù)據(jù)處理》是Python數(shù)據(jù)分析入門書,每個概念都通過簡單實(shí)例來闡述,便于讀者理解與上手。具體內(nèi)容包括:Python及Pandas基礎(chǔ)知識,加載和查看數(shù)據(jù)集,Pandas的DataFrame對象和Series對象,使用matplotlib、seaborn和Pandas提供的繪圖方法為探索性數(shù)據(jù)分析作圖,連接與合并數(shù)據(jù)集,處理缺失數(shù)據(jù),清理數(shù)據(jù),轉(zhuǎn)換數(shù)據(jù)類型,處理字符串,應(yīng)用函數(shù),分組操作,擬合及評估模型,正則化方法與聚類技術(shù),等等。
項目一 處理單個數(shù)據(jù)框
任務(wù)一 統(tǒng)計數(shù)據(jù)框中的數(shù)據(jù)
活動一 創(chuàng)建學(xué)生成績表
活動二 統(tǒng)計各學(xué)科的得分信息
活動三 查價高的10個訂單
任務(wù)二 查詢和篩選數(shù)據(jù)框中的數(shù)據(jù)
活動一 篩選出計算機(jī)老師
活動二 查找聯(lián)考專業(yè)成績在350分以上的計算機(jī)專業(yè)男生
任務(wù)三 處理數(shù)據(jù)框中的字符串
活動一 找出姓張的同學(xué)
活動二 計算老師的上課時間
項目二 清洗數(shù)據(jù)
任務(wù)一 處理數(shù)據(jù)中的缺失值和重復(fù)值
活動一 處理訂單數(shù)據(jù)中的缺失值
活動二 處理銷售數(shù)據(jù)中的重復(fù)值
任務(wù)二 轉(zhuǎn)換數(shù)據(jù)
活動一 規(guī)范化學(xué)生考試成績
活動二 為學(xué)生評獎
活動三 規(guī)范化成績表標(biāo)題
項目三 分組統(tǒng)計數(shù)據(jù)
任務(wù)一 使用內(nèi)置函數(shù)對數(shù)行分組統(tǒng)計
活動一 為各類同學(xué)準(zhǔn)備獎金
活動二 找出銷量少的產(chǎn)品
活動三 統(tǒng)計各行業(yè)每年的上市公司數(shù)量
任務(wù)二 使用自定義函數(shù)對數(shù)行分組統(tǒng)計
活動一 統(tǒng)計職位信息
活動二 清洗網(wǎng)店銷售數(shù)據(jù)
活動三 統(tǒng)計各班的成績結(jié)構(gòu)
項目四 從多個數(shù)據(jù)框獲取信息
任務(wù)一 合并多個數(shù)據(jù)框
活動一 去掉停用詞
活動二 選取男喜歡的電影
任務(wù)二 拼接多個數(shù)據(jù)框
活動一 統(tǒng)計各競賽項目的人數(shù)
活動二 統(tǒng)計各年新生兒的男女比例
項目五 改變數(shù)據(jù)框結(jié)構(gòu)
任務(wù)一 展開和收折數(shù)據(jù)列
活動一 按年級統(tǒng)計各參賽項目的男女生人數(shù)
活動二 查詢學(xué)生成績
任務(wù)二 創(chuàng)建數(shù)據(jù)透視表和交叉表
活動一 按班級分析成績結(jié)構(gòu)
活動二 統(tǒng)計各地區(qū)不同風(fēng)格的電影數(shù)量
項目六 繪制圖表
任務(wù)一 繪制單個圖表
活動一 繪制各班專業(yè)均成績柱狀圖
活動二 繪制股票收益率折線圖
任務(wù)二 繪制多個圖表
活動一 在不同子圖繪制各班的成績統(tǒng)計圖
活動二 按分?jǐn)?shù)段繪制各班的人數(shù)占比
項目七 處理時間序列
任務(wù)一 對時間序列采樣
活動一 統(tǒng)計上證指數(shù)月度收益率
活動二 按季度統(tǒng)計股均交易量和交易額
任務(wù)二 處理移動窗口
活動一 制作股票的移均線
活動二 制作股票價格與上證指數(shù)間的收益相關(guān)圖
項目八 綜合應(yīng)用
任務(wù)一 使用數(shù)據(jù)透視表統(tǒng)計數(shù)據(jù)
活動一 統(tǒng)均錄取分?jǐn)?shù)高的前10所學(xué)校
活動二 統(tǒng)計文理科歷均錄取分?jǐn)?shù)和高錄取分?jǐn)?shù)
任務(wù)二 使用分組統(tǒng)計數(shù)據(jù)
活動一 統(tǒng)計各專業(yè)歷均錄取分?jǐn)?shù)
活動二 統(tǒng)計各地區(qū)高錄取分?jǐn)?shù)均值