隨著人工智能時代的到來,它對機器學習發(fā)展的影響日益劇增。從基于符號主義的機器學習發(fā)展到基于數(shù)據(jù)統(tǒng)計的機器學習,反映了機器學習從純粹的理論研究和模型研究發(fā)展到以解決現(xiàn)實生活中實際問題為目的的應用研究,這是科學研究的一種進步。目前市面上有機器學習的純理論書籍,也有具體操作實踐的書籍,然而理論與實踐相結(jié)合的書籍卻少之又少!稒C器學習從入門到精通/高等學校人工智能教育叢書》從理論入門到實際操練,全面而詳細地介紹了機器學習的各個分支以及其實現(xiàn),實現(xiàn)了機器學習從理論到實踐的完美結(jié)合。
《機器學習從入門到精通/高等學校人工智能教育叢書》共分三篇,分別為鑄刀篇、招式篇和實戰(zhàn)篇。其中,鑄刀篇主要介紹機器學習的基礎知識及前期準備工作,為后面的學習打下良好的基礎;招式篇以基礎應用為支撐,主要介紹相關機器學習的主要應用招式;實戰(zhàn)篇通過房價預測與人臉識別兩個實際案例,覆蓋了典型的回歸與分類、結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的機器學習,進行機器學習的再次升華。此外,附錄中簡要介紹了TensorFlow框架的主要函數(shù),便于讀者隨時查找。
《機器學習從入門到精通/高等學校人工智能教育叢書》可作為高校機器學習、數(shù)據(jù)挖掘及相關課程的教材或教學參考書,也可作為人工智能、大數(shù)據(jù)領域從業(yè)者的自學參考書。
陳怡然,女,高級工程師,研究生畢業(yè)于重慶,目前在大學擔任人工智能方向?qū)I(yè)教師,同時在重慶大學攻讀博士學位。具有多年的企業(yè)實踐開發(fā)經(jīng)驗和學校理論教學經(jīng)驗。主持了多項人工智能相關的縱向研究課題,參與管理了多個關于人工智能方面的實踐開發(fā)項目,發(fā)表了多篇高質(zhì)量的人工智能相關論文。
第一篇 鑄刀
第1章 初識機器學習
本章導讀
知識要點
1.1 什么是機器學習
1.2 機器學習的工作流程
1.2.1 準備數(shù)據(jù)集
1.2.2 進行模型訓練
1.2.3 模型評估
1.3 假設空間和歸納偏好
1.3.1 假設空間
1.3.2 歸納偏好
1.4 發(fā)展歷程
1.4.1 決策樹的命運變遷
1.4.2 神經(jīng)網(wǎng)絡的眾多名稱和命運變遷
1.5 應用現(xiàn)狀
新手問答
本章小結(jié)
第2章 機器學習之刃TensorFlow
本章導讀
知識要點
2.1 認識TensorFlow
2.2 TensorFlow的安裝與工作原理
2.2.1 TensorFlow安裝圖解
2.2.2 TensorFlow的工作原理
2.2.3 什么是計算圖
2.2.4 什么是會話
2.2.5 什么是張量
2.3 常量、變量和占位符
2.3.1 基本概念
2.3.2 基本運算
2.4 操作矩陣
2.4.1 矩陣的創(chuàng)建
2.4.2 矩陣的運算
2.4.3 矩陣的分解和特征值
2.5 使用激活函數(shù)
2.5.1 什么是激活函數(shù)
2.5.2 Sigmoid函數(shù)
2.5.3 Tanh函數(shù)
2.5.4 Relu函數(shù)
2.5.5 Softplus函數(shù)
2.6 讀取數(shù)據(jù)源
2.6.1 通過Excel表導入數(shù)據(jù)集
2.6.2 通過CSV文件導入數(shù)據(jù)集
2.6.3 通過庫中自帶的數(shù)據(jù)集導入數(shù)據(jù)集
2.6.4 導入圖片數(shù)據(jù)集
2.6.5 將數(shù)據(jù)集通過URL自動進行下載
新手問答
牛刀小試
本章小結(jié)
第3章 數(shù)據(jù)分析基礎
本章導讀
知識要點
3.1 認識Numpy和Pandas
3.2 Numpy的基本使用
3.2.1 創(chuàng)建ndarray數(shù)組
3.2.2 運用ndarray數(shù)組
3.3 Pandas的基本使用
3.3.1 Series數(shù)據(jù)結(jié)構(gòu)
3.3.2 DataFrame數(shù)據(jù)結(jié)構(gòu)
新手問答
牛刀小試
本章小結(jié)
第4章 模型的評價與評估
本章導讀
知識要點
4.1 損失函數(shù)
4.1.1 最小二乘
4.1.2 梯度下降
4.2 經(jīng)驗誤差與擬合
4.3 數(shù)據(jù)集劃分
4.3.1 留出法
4.3.2 交叉驗證法
4.3.3 自助法
4.4 調(diào)參與最終模型
4.5 模型性能度量
4.5.1 均方誤差
4.5.2 錯誤率與精確度
4.5.3 準確度、靈敏度與F1
4.5.4 受試者工作特征與AUC
4.5.5 代價敏感錯誤率與代價曲線
4.6 比較檢驗
4.6.1 假設檢驗
4.6.2 麥克尼馬爾變化顯著性檢驗
4.7 偏差與方差
4.8 不同學習模型下的模型評價與評估
4.8.1 不同學習模型下的數(shù)據(jù)集劃分
4.8.2 不同學習模型下的模型評價
新手問答
牛刀小試
本章小結(jié)
第5章 數(shù)據(jù)準備
本章導讀
知識要點
5.1 數(shù)據(jù)探索
5.1.1 數(shù)據(jù)質(zhì)量分析
5.1.2 數(shù)據(jù)特征分析
5.2 數(shù)據(jù)預處理
5.2.1 數(shù)據(jù)清洗
5.2.2 數(shù)據(jù)集成
5.2.3 數(shù)據(jù)變換
5.2.4 數(shù)據(jù)規(guī)約
新手問答
牛刀小試
本章小結(jié)
第二篇 招式
第6章 回歸
本章導讀
知識要點
6.1 回歸分析算法的基礎知識
6.1.1 回歸與擬合
6.1.2 汽車油耗數(shù)據(jù)集準備
6.1.3 在Excel中添加回歸趨勢線預測
6.2 線性回歸
6.2.1 線性回歸的基本原理
6.2.2 線性回歸模型實現(xiàn)之最小二乘法
6.2.3 線性回歸模型實現(xiàn)之梯度下降法
6.2.4 線性回歸模型在油耗預測中的應用
6.3 邏輯回歸
6.3.1 邏輯回歸的基本原理
6.3.2 邏輯回歸與線性回歸的區(qū)別
6.3.3 邏輯回歸模型實現(xiàn)
6.4 戴明回歸
6.4.1 戴明回歸的基本原理
6.4.2 戴明回歸的模型實現(xiàn)
6.5 回歸模型的評估
6.5.1 平均誤差
6.5.2 平均絕對誤差
6.5.3 解釋回歸模型的方差
6.5.4 R2確定系數(shù)
新手問答
牛刀小試
本章小結(jié)
第7章 分類
本章導讀
知識要點
7.1 分類算法的基礎知識
7.1.1 分類的基本思想
7.1.2 貸款違約風險評估數(shù)據(jù)準備
7.2 決策樹分類器
7.2.1 決策樹模型原理
7.2.2 信息增益
7.2.3 ID3決策樹原理
7.2.4 ID3決策樹模型的實現(xiàn)
7.2.5 決策樹模型的可視化
7.2.6 CART決策樹原理
7.2.7 CART決策樹模型的實現(xiàn)
7.3 樸素貝葉斯分類器
7.3.1 預測貸款違約數(shù)據(jù)準備
7.3.2 條件概率與貝葉斯公式
7.3.3 極大似然估計
7.3.4 高斯貝葉斯模型的實現(xiàn)
7.3.5 多項式貝葉斯模型的實現(xiàn)
7.3.6 伯努利貝葉斯模型的實現(xiàn)
7.4 分類模型的評估
7.4.1 混淆矩陣
7.4.2 精確度與敏感度
7.4.3 分類報告
新手問答
牛刀小試
本章小結(jié)
第8章 聚類
本章導讀
知識要點
8.1 聚類分析的基礎知識
8.1.1 聚類分析的基本思想
8.1.2 聚類分析的距離計算
8.1.3 基站商圈數(shù)據(jù)準備
8.2 K-means算法
8.2.1 K-means算法原理
8.2.2 K-means算法的應用
8.3 層次聚類
8.3.1 層次聚類的原理
8.3.2 層次聚類算法的應用
8.4 密度聚類
8.4.1 密度聚類原理
8.4.2 密度聚類算法的應用
8.5 聚類分析模型評估
8.5.1 外部度量
8.5.2 內(nèi)部評估
新手問答
牛刀小試
本章小結(jié)
第9章 支持向量機
本章導讀
知識要點
9.1 支持向量機的基礎知識
9.1.1 支持向量機概述
9.1.2 鳶尾花數(shù)據(jù)準備
9.2 支持向量機的分類
9.2.1 支持向量機分類基礎
9.2.2 SVM分類算法庫
9.2.3 線性可分問題下的支持向量機分類原理
9.2.4 廣義線性的支持向量機分類原理
9.2.5 非線性的支持向量機分類原理
9.3 支持向量機回歸機
9.3.1 支持向量機回歸機概述
9.3.2 SVM回歸算法庫
9.3.3 支持向量機回歸機的應用
9.4 支持向量機模型評估
9.4.1 R2系數(shù)
9.4.2 建立模型準確度評測
9.4.3 混淆矩陣
9.4.4 建立模型分類報告
新手問答
牛刀小試
本章小結(jié)
第10章 機器的大腦“神經(jīng)網(wǎng)絡”
本章導讀
知識要點
10.1 神經(jīng)網(wǎng)絡的相關知識
10.1.1 神經(jīng)網(wǎng)絡的歷史
10.1.2 神經(jīng)元模型
10.1.3 激活函數(shù)
10.2 神經(jīng)網(wǎng)絡
10.2.1 神經(jīng)網(wǎng)絡的基本概念
10.2.2 單層神經(jīng)網(wǎng)絡的原理
10.2.3 隱藏層
10.2.4 多層感知網(wǎng)絡的原理
10.3 BP神經(jīng)網(wǎng)絡
10.3.1 BP神經(jīng)網(wǎng)絡的基本原理
10.3.2 算法演繹推導
10.3.3 BP神經(jīng)網(wǎng)絡的實現(xiàn)
新手問答
牛刀小試
本章小結(jié)
第11章 卷積神經(jīng)網(wǎng)絡
本章導讀
知識要點
11.1 卷積神經(jīng)網(wǎng)絡的基本概念
11.1.1 卷積神經(jīng)網(wǎng)絡基本原理
11.1.2 卷積運算原理
11.1.3 激活層
11.1.4 池化
11.2 卷積神經(jīng)網(wǎng)絡的實現(xiàn)
11.2.1 需求背景介紹
11.2.2 數(shù)據(jù)準備
11.2.3 模型建立
11.2.4 模型的訓練和評估
11.2.5 模型優(yōu)化
新手問答
牛刀小試
本章小結(jié)
第三篇 實戰(zhàn)
第12章 讓機器預測房價
本章導讀
知識要點
12.1 目標與計劃
12.1.1 房價數(shù)據(jù)的特征和維度
12.1.2 制訂機器學習計劃
12.2 獲取數(shù)據(jù)
12.2.1 獲取原始數(shù)據(jù)
12.2.2 數(shù)據(jù)探索
12.2.3 數(shù)據(jù)清洗
12.2.4 訓練/測試集劃分
12.2.5 數(shù)據(jù)變換
12.3 建立線性回歸模型
12.4 模型評估
12.4.1 訓練集評估
12.4.2 測試集評估
12.5 項目結(jié)論
本章小結(jié)
第13章 人臉識別系統(tǒng)的設計與實現(xiàn)
本章導讀
知識要點
13.1 目標與計劃
13.1.1 目標圖像集的大小和類別
13.1.2 機器學習模型的選擇
13.1.3 制訂機器學習計劃
13.2 獲取數(shù)據(jù)集
13.2.1 下載數(shù)據(jù)集
13.2.2 數(shù)據(jù)的清洗和準備
13.2.3 劃分訓練集與測試集
13.3 建立圖像識別模型
13.3.1 確定損失函數(shù)
13.3.2 卷積層的設置
13.3.3 激活函數(shù)的選擇
13.3.4 池化的類型
13.3.5 模型的訓練
13.4 模型評估
13.4.1 中間結(jié)果的可視化
13.4.2 收斂的判定
13.4.3 交叉驗證
本章小結(jié)
附錄 TensorFlow常用函數(shù)
參考文獻