數(shù)據(jù)科學(xué)理論與實(shí)踐--基于Python的實(shí)現(xiàn)
定 價(jià):68 元
當(dāng)前圖書(shū)已被 7 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:何曙光
- 出版時(shí)間:2024/5/1
- ISBN:9787030784063
- 出 版 社:科學(xué)出版社
- 中圖法分類(lèi):TP311.561
- 頁(yè)碼:326
- 紙張:
- 版次:1
- 開(kāi)本:16
本書(shū)內(nèi)容涵蓋數(shù)據(jù)科學(xué)基礎(chǔ)知識(shí),介紹了數(shù)據(jù)科學(xué)的工作流程,包括數(shù)據(jù)采集、數(shù)據(jù)整理和探索、數(shù)據(jù)可視化和數(shù)據(jù)建模預(yù)測(cè)等技術(shù),并通過(guò)文本、圖像、語(yǔ)音等前沿應(yīng)用,引入人工智能技術(shù)在數(shù)據(jù)科學(xué)領(lǐng)域應(yīng)用的新成果。全書(shū)設(shè)計(jì)收集了多個(gè)數(shù)據(jù)分析案例,采用Python及相關(guān)科學(xué)計(jì)算工具包介紹數(shù)據(jù)分析實(shí)現(xiàn)的方法,幫助讀者通過(guò)實(shí)際應(yīng)用理解數(shù)據(jù)科學(xué)知識(shí),掌握實(shí)踐技能,運(yùn)用統(tǒng)計(jì)學(xué)、人工智能等技術(shù)解決實(shí)際問(wèn)題。本書(shū)通俗易懂、實(shí)例豐富、技術(shù)先進(jìn),配備豐富的教學(xué)資源,可作為各類(lèi)大專(zhuān)院校數(shù)據(jù)科學(xué)、大數(shù)據(jù)技術(shù)的入門(mén)教材,計(jì)算機(jī)基礎(chǔ)教學(xué)較高層次課程的教材,也可以作為數(shù)據(jù)科學(xué)實(shí)踐的技術(shù)參考書(shū)。
更多科學(xué)出版社服務(wù),請(qǐng)掃碼獲取。
中國(guó)質(zhì)量協(xié)會(huì)學(xué)術(shù)教育工作委員會(huì)委員、天津市工業(yè)工程學(xué)會(huì)副理事長(zhǎng)、天津市現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)理事
目錄
前言
第1章 數(shù)據(jù)科學(xué)概論1
1.1 數(shù)據(jù)與大數(shù)據(jù)1
1.1.1 數(shù)據(jù)、信息和知識(shí)1
1.1.2 大數(shù)據(jù)3
1.2 數(shù)據(jù)科學(xué)及其工作流程概述4
1.2.1 數(shù)據(jù)科學(xué)概述4
1.2.2 數(shù)據(jù)科學(xué)工作流程4
習(xí)題6
第2章 Python基礎(chǔ)7
2.1 Python概述7
2.1.1 計(jì)算機(jī)語(yǔ)言概述7
2.1.2 Python語(yǔ)言簡(jiǎn)介8
2.1.3 Python解釋器及開(kāi)發(fā)環(huán)境的安裝9
2.2 Python基礎(chǔ)12
2.2.1 Python基礎(chǔ)語(yǔ)法12
2.2.2 Python復(fù)雜數(shù)據(jù)類(lèi)型13
2.2.3 Python運(yùn)算符19
2.2.4 Python控制語(yǔ)句20
2.3 函數(shù)和類(lèi)的定義27
2.3.1 Python函數(shù)的定義和調(diào)用27
2.3.2 Python與面向?qū)ο缶幊?0
2.4 Python包31
2.4.1 Python包的結(jié)構(gòu)和導(dǎo)入31
2.4.2 Python常用包簡(jiǎn)介33
習(xí)題33
第3章 Python常用模塊35
3.1 numpy與矩陣運(yùn)算35
3.1.1 numpy多維數(shù)組基礎(chǔ)35
3.1.2 數(shù)組索引39
3.1.3 數(shù)組運(yùn)算40
3.1.4 numpy簡(jiǎn)單統(tǒng)計(jì)函數(shù)41
3.2 基于pandas的數(shù)據(jù)操縱與管理42
3.2.1 pandas基礎(chǔ)43
3.2.2 DataFrame的切片和計(jì)算45
3.2.3 DataFrame數(shù)據(jù)運(yùn)算48
3.2.4 數(shù)據(jù)的合并54
3.3 基于matplotlib和seaborn的數(shù)據(jù)可視化57
3.3.1 matplotlib數(shù)據(jù)可視化概述57
3.3.2 matplotlib數(shù)據(jù)可視化示例60
3.3.3 seaborn數(shù)據(jù)可視化67
3.4 基于sympy的符號(hào)計(jì)算74
3.4.1 sympy基礎(chǔ)74
3.4.2 表達(dá)式操作75
3.4.3 積分與微分78
3.4.4 sympy方程求解81
3.4.5 sympy與函數(shù)可視化82
3.5 基于scipy的科學(xué)計(jì)算83
3.5.1 scipy線性代數(shù)84
3.5.2 數(shù)值積分86
3.5.3 插值87
習(xí)題91
第4章 基于Python的最優(yōu)化92
4.1 最優(yōu)化問(wèn)題的形式化定義與分類(lèi)92
4.2 基于scipy的函數(shù)優(yōu)化93
4.2.1 無(wú)約束最優(yōu)化93
4.2.2 約束最優(yōu)化98
4.2.3 其他最優(yōu)化算法101
4.3 基于cvxpy的凸優(yōu)化建模與求解103
4.3.1 凸優(yōu)化的基本概念104
4.3.2 cvxpy及凸優(yōu)化問(wèn)題求解106
4.3.3 凸優(yōu)化問(wèn)題實(shí)例116
4.4 基于gurobipy的數(shù)學(xué)規(guī)劃建模與求解134
4.4.1 Gurobi簡(jiǎn)介134
4.4.2 基于gurobipy求解數(shù)學(xué)規(guī)劃的步驟135
4.4.3 gurobipy建模與求解實(shí)例138
4.4.4 gurobipy中的常用問(wèn)題轉(zhuǎn)換技巧145
習(xí)題147
第5章 基于Python的統(tǒng)計(jì)分析148
5.1 scipy與統(tǒng)計(jì)分布148
5.1.1 基于scipy的基本統(tǒng)計(jì)分布148
5.1.2 主要離散分布簡(jiǎn)介149
5.1.3 主要連續(xù)分布簡(jiǎn)介153
5.1.4 抽樣分布158
5.1.5 基本統(tǒng)計(jì)分析160
5.2 基于Python的分布參數(shù)估計(jì)163
5.2.1 參數(shù)的點(diǎn)估計(jì)164
5.2.2 參數(shù)的區(qū)間估計(jì)165
5.2.3 存在截尾數(shù)據(jù)的韋布爾分布參數(shù)估計(jì)實(shí)例167
5.3 假設(shè)檢驗(yàn)169
5.3.1 假設(shè)檢驗(yàn)的基本概念169
5.3.2 scipy中的假設(shè)檢驗(yàn)170
5.4 基于Python的統(tǒng)計(jì)模型174
5.4.1 線性回歸174
5.4.2 廣義線性模型179
5.4.3 廣義估計(jì)方程181
5.4.4 廣義加性模型182
5.4.5 基于表達(dá)式的模型定義184
習(xí)題186
第6章 基于Python的機(jī)器學(xué)習(xí)187
6.1 機(jī)器學(xué)習(xí)概述187
6.1.1 機(jī)器學(xué)習(xí)及相關(guān)概念187
6.1.2 機(jī)器學(xué)習(xí)的結(jié)構(gòu)189
6.1.3 基于Python的機(jī)器學(xué)習(xí)192
6.1.4 sklearn基礎(chǔ)192
6.2 監(jiān)督學(xué)習(xí)模型199
6.2.1 分類(lèi)模型199
6.2.2 回歸模型217
6.2.3 集成方法223
6.3 非監(jiān)督學(xué)習(xí)算法229
6.3.1 聚類(lèi)229
6.3.2 高斯混合模型234
6.3.3 流形學(xué)習(xí)235
6.3.4 信號(hào)成分分解237
6.3.5 異常檢測(cè)239
6.4 機(jī)器學(xué)習(xí)模型選擇和評(píng)估242
6.4.1 模型選擇與評(píng)估242
6.4.2 超參數(shù)設(shè)置247
6.4.3 特征選擇250
6.4.4 模型的保存和讀取252
習(xí)題253
第7章 基于PyTorch的神經(jīng)網(wǎng)絡(luò)254
7.1 神經(jīng)網(wǎng)絡(luò)254
7.1.1 神經(jīng)網(wǎng)絡(luò)基本原理254
7.1.2 激活函數(shù)255
7.1.3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程256
7.2 基于PyTorch的神經(jīng)網(wǎng)絡(luò)建模257
7.2.1 Torch簡(jiǎn)介258
7.2.2 變量和自動(dòng)求導(dǎo)機(jī)制autograd259
7.3 PyTorch神經(jīng)網(wǎng)絡(luò)建模262
7.4 基于PyTorch的神經(jīng)網(wǎng)絡(luò)示例267
7.4.1 回歸問(wèn)題267
7.4.2 分類(lèi)問(wèn)題268
7.4.3 多項(xiàng)式擬合問(wèn)題269
習(xí)題271
第8章 網(wǎng)絡(luò)文本數(shù)據(jù)分析與實(shí)踐272
8.1 網(wǎng)絡(luò)文本數(shù)據(jù)分析概述272
8.1.1 網(wǎng)絡(luò)數(shù)據(jù)分析的基本流程272
8.1.2 網(wǎng)絡(luò)數(shù)據(jù)分析主要應(yīng)用場(chǎng)景273
8.1.3 網(wǎng)絡(luò)數(shù)據(jù)分析典型案例273
8.2 Web應(yīng)用構(gòu)成要素及工作流程275
8.2.1 網(wǎng)頁(yè)構(gòu)成要素276
8.2.2 Web訪問(wèn)請(qǐng)求和響應(yīng)過(guò)程277
8.2.3 靜態(tài)網(wǎng)頁(yè)和動(dòng)態(tài)網(wǎng)頁(yè)280
8.2.4 審查網(wǎng)頁(yè)元素282
8.3 基于Python的網(wǎng)絡(luò)數(shù)據(jù)獲取283
8.3.1 User-Agent283
8.3.2 基于urllib的網(wǎng)絡(luò)數(shù)據(jù)獲取284
8.3.3 基于requests包的網(wǎng)絡(luò)數(shù)據(jù)獲取287
8.4 網(wǎng)絡(luò)數(shù)據(jù)解析289
8.4.1 正則表達(dá)式289
8.4.2 基于lxml的信息提取291
8.4.3 Beautiful Soup293
8.5 文本處理298
8.5.1 數(shù)據(jù)預(yù)處理298
8.5.2 中文分詞300
8.5.3 去除停用詞301
8.5.4 關(guān)鍵詞分析302
8.6 文本數(shù)據(jù)建模與分析306
8.6.1 文本主題模型306
8.6.2 情感分析模型309
習(xí)題311
參考文獻(xiàn)312