基于鯤鵬的大數(shù)據(jù)挖掘算法實(shí)戰(zhàn)
定 價(jià):89 元
叢書名:計(jì)算機(jī)企業(yè)核心技術(shù)叢書·鯤鵬計(jì)算應(yīng)用技術(shù)系列
- 作者:袁春 劉婧 王工藝 著
- 出版時(shí)間:2022/10/1
- ISBN:9787111713180
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP274
- 頁(yè)碼:231
- 紙張:
- 版次:
- 開本:16
結(jié)合主流分布式計(jì)算框架、國(guó)產(chǎn)芯片,介紹算法極致性能優(yōu)化實(shí)踐,開發(fā)面向企業(yè)級(jí)應(yīng)用的高性能數(shù)據(jù)挖掘算法;剖析數(shù)據(jù)挖掘算法的典型應(yīng)用案例,啟發(fā)讀者在面向科研問(wèn)題、企業(yè)應(yīng)用,基于數(shù)據(jù)挖掘算法快速構(gòu)建應(yīng)用。
叢書序
前言
第1章 大數(shù)據(jù)挖掘技術(shù)概述
1.1 大數(shù)據(jù)技術(shù)重要性
1.2 大數(shù)據(jù)概念和類型
1.3 大數(shù)據(jù)挖掘技術(shù)
1.3.1 大數(shù)據(jù)采集技術(shù)
1.3.2 大數(shù)據(jù)預(yù)處理技術(shù)
1.3.3 大數(shù)據(jù)分析和挖掘技術(shù)
1.3.4 大數(shù)據(jù)可視化技術(shù)
1.3.5 大數(shù)據(jù)應(yīng)用
1.4 大數(shù)據(jù)挖掘系統(tǒng)架構(gòu)
1.4.1 大數(shù)據(jù)存儲(chǔ)系統(tǒng)
1.4.2 大數(shù)據(jù)處理系統(tǒng)
1.4.3 大數(shù)據(jù)可視化和應(yīng)用系統(tǒng)
1.5 大數(shù)據(jù)挖掘技術(shù)的特性
1.6 新技術(shù)浪潮下的大數(shù)據(jù)挖掘技術(shù)
參考文獻(xiàn)
第2章 分布式開發(fā)框架
2.1 分布式并行策略
2.1.1 數(shù)據(jù)并行
2.1.2 模型并行
2.2 分布式協(xié)調(diào)
2.2.1 ZooKeeper簡(jiǎn)介
2.2.2 數(shù)據(jù)模型
2.2.3 ZooKeeper體系結(jié)構(gòu)
2.2.4 分布式鎖
2.3 分布式通信
2.3.1 分布式通信機(jī)制
2.3.2 分布式通信拓?fù)?br>2.4 分布式一致性算法
2.4.1 一致性哈希
2.4.2 Paxos算法
2.4.3 Raft算法
2.5 分布式計(jì)算框架
2.5.1 Hadoop
2.5.2 Spark
2.5.3 Flink
2.5.4 Ray
參考文獻(xiàn)
第3章 經(jīng)典挖掘算法
3.1 主成分分析
3.1.1 算法介紹
3.1.2 算法推導(dǎo)
3.2 線性回歸
3.2.1 線性回歸的損失函數(shù)
3.2.2 優(yōu)化求解方法
3.2.3 正則化
3.3 邏輯回歸
3.3.1 Logistic函數(shù)
3.3.2 邏輯回歸的損失函數(shù)
3.3.3 多分類問(wèn)題
3.4 線性支持向量機(jī)
3.4.1 支持向量機(jī)的基本概念
3.4.2 線性支持向量機(jī)的損失函數(shù)
3.5 決策樹
3.5.1 決策樹算法概述
3.5.2 ID3決策樹算法
3.5.3 C4.5算法
3.5.4 分類回歸樹(CART)
3.6 隨機(jī)森林
3.7 梯度提升決策樹
3.7.1 負(fù)梯度與殘差
3.7.2 GBDT的計(jì)算原理
3.7.3 GBDT常用的損失函數(shù)
3.8 XGBoost
3.8.1 XGBoost預(yù)測(cè)模型
3.8.2 目標(biāo)函數(shù)
3.8.3 XGBoost算法分析
3.9 交替小二乘法
3.9.1 顯式反饋
3.9.2 隱式反饋
參考文獻(xiàn)
第4章 鯤鵬BoostKit大數(shù)據(jù)挖掘
4.1 鯤鵬芯片
4.1.1 鯤鵬芯片的發(fā)展
4.1.2 鯤鵬920處理器
4.1.3 鯤鵬920處理器的特點(diǎn)
4.2 鯤鵬BoostKit使能大數(shù)據(jù)場(chǎng)景
4.2.1 鯤鵬應(yīng)用使能套件BoostKit
4.2.2 鯤鵬BoostKit大數(shù)據(jù)使能套件
4.3 鯤鵬BoostKit大數(shù)據(jù)機(jī)器學(xué)習(xí)算法庫(kù)
4.3.1 算法介紹
4.3.2 機(jī)器學(xué)習(xí)算法庫(kù)的使用方法
第5章 數(shù)據(jù)挖掘算法在鯤鵬的優(yōu)化實(shí)踐
5.1 主成分分析
5.1.1 Covariance方法實(shí)現(xiàn)
5.1.2 SVD方法實(shí)現(xiàn)
5.1.3 鯤鵬BoostKit算法API介紹
5.2 邏輯回歸
5.2.1 概念回顧
5.2.2 優(yōu)化求解
5.2.3 分布式實(shí)現(xiàn)
5.2.4 鯤鵬BoostKit算法API介紹
5.3 隨機(jī)森林
5.3.1 隨機(jī)森林基礎(chǔ)回顧
5.3.2 隨機(jī)森林分布式實(shí)現(xiàn)與優(yōu)化
5.3.3 鯤鵬BoostKit算法API介紹
5.4 XGBoost
5.4.1 XGBoost的基礎(chǔ)回顧
5.4.2 XGBoost4J-Spark實(shí)現(xiàn)詳解
5.4.3 XGBoost單輪分布式訓(xùn)練實(shí)現(xiàn)詳解
5.4.4 鯤鵬BoostKit算法API介紹
5.5 交替小二乘法
5.5.1 分布式實(shí)現(xiàn)流程
5.5.2 分布式實(shí)現(xiàn)詳解
5.5.3 鯤鵬BoostKit算法API介紹
參考文獻(xiàn)
第6章 數(shù)據(jù)挖掘算法應(yīng)用案例
6.1 商品推薦案例
6.1.1 場(chǎng)景介紹
6.1.2 整體方案
6.1.3 關(guān)鍵步驟
6.1.4 小結(jié)
6.2 房?jī)r(jià)預(yù)測(cè)案例
6.2.1 場(chǎng)景介紹
6.2.2 整體方案
6.2.3 關(guān)鍵步驟
6.2.4 小結(jié)
6.3 客戶細(xì)分案例
6.3.1 場(chǎng)景介紹
6.3.2 整體方案
6.3.3 關(guān)鍵步驟
6.3.4 小結(jié)