亚洲国产一区国产亚洲,国产97公开成人免费视频,日本免费一区二区三区在线观看

數(shù)據(jù)科學(xué)（Data Science）是從數(shù)據(jù)中提取知識的技術(shù)，是一門有關(guān)機器學(xué)習(xí)、統(tǒng)計學(xué)與數(shù)據(jù)挖掘的交叉學(xué)科。數(shù)據(jù)科學(xué)包含了多種領(lǐng)域的不同元素，包括信號處理、數(shù)學(xué)、概率模型技術(shù)和理論、計算機編程、統(tǒng)計學(xué)等。本書講解了7種重要的數(shù)據(jù)分析方法，它們分別是k最近鄰算法、樸素貝葉斯算法、決策樹、隨機森林、k-means聚類、回歸分析以及時間序列分析。全書共7章，每一章都以一個簡單的例子開始，先講解算法的基本概念與知識，然后通過對案例進行擴展以講解一些特殊的分析算法。這種方式有益于讀者深刻理解算法。本書適合數(shù)據(jù)分析人員、機器學(xué)習(xí)領(lǐng)域的從業(yè)人員以及對算法感興趣的讀者閱讀。

第 1 章用k最近鄰算法解決分類問題 1.1　Mary對溫度的感覺 1.2　實現(xiàn)k最近鄰算法 1.3　意大利地區(qū)的示例——選擇k值 1.4　房屋所有權(quán)——數(shù)據(jù)轉(zhuǎn)換 1.5　文本分類——使用非歐幾里德距離 1.6　文本分類——更高維度的k-NN 1.7　小結(jié) 1.8　習(xí)題第　2 章樸素貝葉斯 2.1　醫(yī)療檢查——貝葉斯定理的基本應(yīng)用 2.2　貝葉斯定理的證明及其擴展 2.3　西洋棋游戲——獨立事件 2.4　樸素貝葉斯分類器的實現(xiàn) 2.5　西洋棋游戲——相關(guān)事件 2.6　性別分類——基于連續(xù)隨機變量的貝葉斯定理 2.7　小結(jié) 2.8　習(xí)題第　3 章決策樹 3.1　游泳偏好——用決策樹表示數(shù)據(jù) 3.2　信息論　044 3.3　ID3算法——構(gòu)造決策樹　047 3.4　用決策樹進行分類　054 3.5　小結(jié)　060 3.6　習(xí)題　060 第　4 章隨機森林　064 4.1　隨機森林算法概述　064 4.2　游泳偏好——隨機森林分析法　065 4.3　隨機森林算法的實現(xiàn)　071 4.4　下棋實例　075 4.5　購物分析——克服隨機數(shù)據(jù)的不一致性以及
度量置信水平　082 4.6　小結(jié)　084 4.7　習(xí)題　084 第　5 章 k-means聚類　089 5.1　家庭收入——聚類為k個簇　089 5.2　性別分類——聚類分類　092 5.3　k-means聚類算法的實現(xiàn)　095 5.4　房產(chǎn)所有權(quán)示例——選擇簇的數(shù)量　099 5.5　小結(jié)　105 5.6　習(xí)題　105 第　6 章回歸分析　114 6.1　華氏溫度和攝氏溫度的轉(zhuǎn)換——基于完整數(shù)據(jù)的線性回歸　114 6.2　根據(jù)身高預(yù)測體重——基于實際數(shù)據(jù)的線性回歸　117 6.3　梯度下降算法及實現(xiàn)　118 6.4　根據(jù)距離預(yù)測飛行時長　122 6.5　彈道飛行分析——非線性模型　123 6.6　小結(jié)　125 6.7　習(xí) 題　125 第　7 章時間序列分析　130 7.1　商業(yè)利潤——趨勢分析　130 7.2　電子商店的銷售額——季節(jié)性分析　132 7.3　小結(jié)　140 7.4　習(xí) 題　140 附錄　A 統(tǒng)計　145 A.1　基本概念　145 A.2　貝葉斯推理　146 A.3　分布　146 A.4　交叉驗證　147 A.5　A/B 測試　148 附錄　B R參考　149 B.1　介紹　149 B.2　數(shù)據(jù)類型　150 B.3　線性回歸　152 附錄　C Python參考　154 C.1　介紹　154 C.2　數(shù)據(jù)類型　155 C.3　控制流　159 附錄　D 數(shù)據(jù)科學(xué)中的算法和方法術(shù)語　163

你還可能感興趣

我要評論