基于SAP的企業(yè)級實用數(shù)據(jù)分析
定 價:99 元
- 作者:[美] 格雷格·福斯(Greg Foss) 著,于俊偉 劉楠譯 譯
- 出版時間:2021/3/1
- ISBN:9787111674030
- 出 版 社:機械工業(yè)出版社
- 中圖法分類:F272.7
- 頁碼:272
- 紙張:膠版紙
- 版次:1
- 開本:16開
本書向SAP專業(yè)人員介紹了機器學習和神經網絡等數(shù)據(jù)科學基本原理,也向數(shù)據(jù)科學家介紹了SAP系統(tǒng)的數(shù)據(jù)結構和數(shù)據(jù)服務等概念和過程。接著介紹了數(shù)據(jù)探索性分析和異常檢測這兩個非常基礎又十分重要的數(shù)據(jù)準備階段,然后通過模擬Big Bonanza Warehouse的業(yè)務場景,進行基于時間序列的銷量預測分析、基于聚類的客戶細分、基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘和基于自然語言處理的情感分析等實際分析過程。
適讀人群 :SAP業(yè)務分析師、數(shù)據(jù)分析師,數(shù)據(jù)科學家
本書向SAP專業(yè)人員介紹了機器學習和神經網絡等數(shù)據(jù)科學基本原理,也向數(shù)據(jù)科學家介紹了SAP系統(tǒng)的數(shù)據(jù)結構和數(shù)據(jù)服務等概念和過程。接著介紹了數(shù)據(jù)探索性分析和異常檢測這兩個非;A又十分重要的數(shù)據(jù)準備階段,后通過模擬Big Bonanza Warehouse的業(yè)務場景,進行基于時間序列的銷量預測分析、基于聚類的客戶細分、基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘和基于自然語言處理的情感分析等實際分析過程。
數(shù)據(jù)科學和人工智能的未來從未像現(xiàn)在這樣光明,F(xiàn)在,人工智能(AI)在多種游戲中都能擊敗人類,從緊張的游戲Pong到需要深入思考的圍棋游戲等。深度學習模型識別物體的能力幾乎和人類不相上下。甚至有人說,自動駕駛汽車的表現(xiàn)比那些注意力不集中的人還要好。過去十年來,數(shù)據(jù)量、存儲容量和計算能力的大幅提升,使數(shù)據(jù)科學得以快速發(fā)展。.當然,現(xiàn)在技術已經滲透到業(yè)務的各個方面,從財務、銷售到生產和物流。然而,業(yè)務的每一部分都是由數(shù)據(jù)科學和人工智能驅動的嗎?很可能不是。盡管這些技術非常好,但如果你的工作不是設計自動駕駛汽車或預測客戶行為,你可能就不會用到它們。.許多組織可能會從SAP之類的企業(yè)資源計劃(ERP)系統(tǒng)訪問業(yè)務數(shù)據(jù),你所在的組織可能也不例外。來自SAP這樣的業(yè)務系統(tǒng)的數(shù)據(jù)在很大程度上是完美的,因為在允許將其保存到數(shù)據(jù)庫之前,通常會進行驗證和檢查(數(shù)據(jù)科學家最重要、回報率最少的一個任務就是數(shù)據(jù)清洗)。這意味著SAP中的ERP數(shù)據(jù)已經“成熟”,而數(shù)據(jù)科學就是來收獲果實的!.讓我們來看一個假設的場景。Big Bonanza Warehouse公司的SAP團隊一直在不斷地進行流程改進。他們知道如何配置SAP系統(tǒng)以完成用戶想要的任務,像拉小提琴一樣操作著這個系統(tǒng),盡職盡責地接受請求并提供解決方案。然而,在報告和分析方面存在一些問題。他們有一個數(shù)據(jù)倉庫和商業(yè)智能系統(tǒng),但開發(fā)報告是一個耗時幾個月的過程。該團隊經常使用標準的ALV(ABAP列表查看器)報告,因為需要開發(fā)人員來編寫代碼,所以功能相當有限。此外,利用可與SAP結合使用的公共數(shù)據(jù)也很困難。與許多其他企業(yè)一樣,Big Bonanza Warehouse公司的SAP數(shù)據(jù)就像一座孤島,孤立在自己的系統(tǒng)中。不使用SAP系統(tǒng)的團隊不了解這些數(shù)據(jù),而那些使用SAP的團隊要花費大量的時間維護系統(tǒng),以至于沒有機會查看系統(tǒng)外部的數(shù)據(jù)。.可是,SAP數(shù)據(jù)不應該是一個孤島。團隊人員了解他們的數(shù)據(jù),知道如何找到這些數(shù)據(jù),也知道用這些數(shù)據(jù)能做些什么。然而,要分析這些數(shù)據(jù)時,每個人都被長達數(shù)月的報告開發(fā)過程所束縛。.故事聽起來是不是很熟悉?幾乎所有我們工作過的SAP現(xiàn)場都是如此。在我們30多年的工作經歷中,這樣的事例比比皆是。.我們希望為SAP團隊(當然包括你的團隊)提供一些現(xiàn)代工具和技術,讓團隊人員無須定義數(shù)據(jù)立方、數(shù)據(jù)倉庫對象或學習復雜的前沿報告就能使用這些技術。在本書中,我們將介紹一些簡單的場景,比如直接將數(shù)據(jù)從SAP轉儲到平面文件,并導入報表工具中。這對于特別的報告和調查非常有用。我們也會考慮更復雜的場景,包括使用云中的數(shù)據(jù)抽取工具和神經網絡模型,以SAP或當前數(shù)據(jù)倉庫中不可能的方式來分析數(shù)據(jù)。.如何閱讀本書.你需要從概念的角度來理解本書。我們提出了分析業(yè)務數(shù)據(jù)的替代技術,要求讀者以全新的、有趣的方式來思考業(yè)務數(shù)據(jù)(尤其是SAP數(shù)據(jù))。本書旨在縮小你所擁有的特定業(yè)務數(shù)據(jù)分析技術和先進數(shù)據(jù)科學技術之間的差距,既不需要你是精于計算神經網絡中梯度下降這樣的復雜算法的專家,也不需要你是業(yè)務數(shù)據(jù)方面的專家。但是,你需要有跨越這兩個陣營的強烈愿望,并想在這個過程中獲得樂趣注。.從數(shù)據(jù)科學家的角度來看,本書中的數(shù)據(jù)科學原理只是一個入門介紹。如果你很熟悉sigmoid、tanh、relu等激活函數(shù),就可以跳過這些部分。我們將重點關注SAP,展示如何從系統(tǒng)中提取數(shù)據(jù),并演示如何使用真實的業(yè)務數(shù)據(jù)。.從SAP專業(yè)人員的角度來看,你將突破傳統(tǒng)的報表和分析模式,學會思考業(yè)務應用,并用機器學習和深度學習的術語來生成報告。這聽起來可能很神秘,但到本書結束時,你將擁有邁出這一步所需的工具。在此過程中,你將自動檢測銷售數(shù)據(jù)中的異常,根據(jù)歷史數(shù)據(jù)預測未來,將文本處理為自然語言,將客戶細分為智能群組,將所有這些東西出色地可視化,并教會機器使用業(yè)務數(shù)據(jù)。.在人工智能和數(shù)據(jù)科學的世界里,對數(shù)據(jù)提出同樣的老問題是陳腐和幼稚的,更坦率地說是無聊的。我們希望你對自己的數(shù)據(jù)提出這樣的問題,即連你自己都不知道能夠問出的問題。也許中國的茶葉價格真的會對你的銷售產生巨大的影響。.從開發(fā)者的角度來看,你會深受啟發(fā),去學習Python和R等美妙的編程語言。我們不教你這些語言,但鼓勵你學習這些語言。如果你已經是一個有經驗的R或Python開發(fā)人員,則可以很好地完成代碼部分的學習。如果你是R或Python語言的新手,我們將為你提供資源,幫助你入門。如果你傾向于使用Java等其他語言,也不要覺得自己被排除在外了,本書的根本目標是讓你以不同的方式來思考業(yè)務數(shù)據(jù),如果你想使用Java,請盡情使用吧。.數(shù)據(jù)科學的實施本身就可以寫成一本書。我們會經常涉及如何實現(xiàn)我們提出的想法,但是深入探討創(chuàng)建魯棒的數(shù)據(jù)科學流程超出了本書的討論范圍。.數(shù)據(jù)科學家可以跳過本書第2章,SAP專業(yè)人員可以跳過本書第3章。本書后面的內容融合了這兩個門類,所以,我們希望來自兩方的讀者都能夠有效地學習本書。.致謝.感謝本書的技術審校者Hau Ngo、Jesse Stiff、Franco Rizzo、Brad Barker和Christoph Wertz,他們寶貴的反饋意