本書由微信公眾號“狗熊會”(ID:CluBear)創(chuàng)始人王漢生教授(熊大)及其核心團隊聯(lián)合創(chuàng)作完成。本書可以被看作商業(yè)分析領域入門級通俗且有趣的讀物,深入淺出,雅俗共賞,適合數(shù)據(jù)分析師、工程師、產(chǎn)品經(jīng)理、銷售人員、商務拓展人員以及數(shù)據(jù)企業(yè)高管閱讀。本書主要由六章組成。第一章介紹了熊大樸素的數(shù)據(jù)價值觀,解讀數(shù)據(jù)與價值的邏輯關系;第二章介紹了最基本的數(shù)據(jù)可視化方法(統(tǒng)計圖表)的規(guī)范與有趣應用;第三章介紹了回歸分析,通過精彩案例展示了如何將一個業(yè)務問題定義成一個數(shù)據(jù)可分析問題;第四章介紹了機器學習,可
數(shù)字化轉(zhuǎn)型是企業(yè)在數(shù)字經(jīng)濟時代面對的重大戰(zhàn)略選擇,其本質(zhì)是通過有效地使用數(shù)據(jù)資源對業(yè)務進行全面的升級和優(yōu)化,提高企業(yè)的綜合產(chǎn)業(yè)競爭力。本書將數(shù)據(jù)科學作為出發(fā)點,結合大數(shù)據(jù)、人工智能技術,以數(shù)據(jù)分析的方法和理論為觀察視角,介紹了企業(yè)數(shù)字化轉(zhuǎn)型的核心知識概念及主要的應用實踐策略。本書共8章,分為數(shù)據(jù)科學原理、數(shù)據(jù)科學技術、數(shù)字化業(yè)務實踐,以及數(shù)字化產(chǎn)業(yè)目標四個主要部分。數(shù)據(jù)科學原理部分(第2章)主要討論數(shù)據(jù)要素的核心價值體系及數(shù)據(jù)科學的基本理論范疇;數(shù)據(jù)科學技術部分(第3~6章)主要介紹數(shù)據(jù)獲取及預
2022年12月19日,《中共中央國務院關于構建數(shù)據(jù)基礎制度更好發(fā)揮數(shù)據(jù)要素作用的意見》是黨的二十大之后推動數(shù)字經(jīng)濟開新局的基礎性政策文件,備受各方關注。本書是清華大學社會科學學院經(jīng)濟學研究所結合近年來在數(shù)字經(jīng)濟、數(shù)據(jù)要素方面所做的研究和取得的成果,從數(shù)據(jù)產(chǎn)權制度、數(shù)據(jù)要素流通和交易制度、數(shù)據(jù)要素收益分配制度、數(shù)據(jù)要素治理制度、數(shù)據(jù)的宏觀與生態(tài)價值等五個維度帶領大家解讀“數(shù)據(jù)二十條”中的經(jīng)濟與法律問題,了解數(shù)據(jù)基礎制度建設、數(shù)據(jù)要素賦能實體經(jīng)濟所面臨的機遇與挑戰(zhàn)。
隨著時代的發(fā)展和信息技術的進步,信息技術已經(jīng)是社會發(fā)展的動力之一,尤其是大數(shù)據(jù)技術對社會的發(fā)展起到促進作用。在人們的生活、生產(chǎn)中,大數(shù)據(jù)的應用能夠給人們帶來便利性,同時在大數(shù)據(jù)中也會存儲人們的個人信息。隨著科技的發(fā)展和進步,我們逐漸進入大數(shù)據(jù)時代。本書首先對大數(shù)據(jù)相關概念和應用問題進行了簡述,進而論述了大數(shù)據(jù)的異化分析;然后介紹了大數(shù)據(jù)的影響因素,以及云計算技術與算法分析;最后介紹了大數(shù)據(jù)在不同方面的應用。大數(shù)據(jù)具有規(guī)模大、種類多、生成速度快、價值巨大但密度低的特點。大數(shù)據(jù)應用就是利用數(shù)據(jù)分析的
Spark數(shù)據(jù)處理引擎是一個驚人的分析工廠:輸入原始數(shù)據(jù),輸出洞察。PySpark用基于Python的API封裝了Spark的核心引擎。它有助于簡化Spark陡峭的學習曲線,并使這個強大的工具可供任何在Python數(shù)據(jù)生態(tài)系統(tǒng)中工作的人使用!禤ython和PySpark數(shù)據(jù)分析》幫助你使用PySpark解決數(shù)據(jù)科學的日常挑戰(zhàn)。你將學習如何跨多臺機器擴展處理能力,同時從任何來源(無論是Hadoop集群、云數(shù)據(jù)存儲還是本地數(shù)據(jù)文件)獲取數(shù)據(jù)。一旦掌握了基礎知識,就可以通過構建機器學習管道,并配合P
從信息資源管理協(xié)同創(chuàng)新視角,分析了大數(shù)據(jù)治理面臨的挑戰(zhàn)、機遇和焦點議題,大數(shù)據(jù)治理研究的視角、立場及代表性觀點,大數(shù)據(jù)治理的框架類型及其構成要素。以公共價值理論、數(shù)字連續(xù)性理論、利益相關者理論和協(xié)同創(chuàng)新理論為主要理論支持,從大數(shù)據(jù)治理目標、主體、治理客體、治理活動、治理環(huán)境等多個維度,分析了大數(shù)據(jù)治理的政策、標準和技術的現(xiàn)狀及發(fā)展方向。提出了大數(shù)據(jù)治理發(fā)展應用的綜合治理模式、運行模型、評估體系和評估方法等理論,并基于案例研究提出了大數(shù)據(jù)治理發(fā)展與應用的實踐路徑。此外,本書從信息資源管理協(xié)同創(chuàng)新視
魯棒預測控制是在預測控制的基礎上考慮到實際系統(tǒng)存在著模型不精確或者參數(shù)時變、未知擾動等各種不確定性而發(fā)展起來的先進控制技術。如何在魯棒預測控制的基礎上有效處理時變時滯對系統(tǒng)的影響成為工業(yè)過程控制亟待解決的問題。本書針對具有時變時滯的工業(yè)過程可能存在參數(shù)時變、強干擾、執(zhí)行器故障、非線性、多階段切換、時變跟蹤軌跡等問題,重點介紹了基于魯棒預測控制思想以解決這些問題的先進技術和方法。其主要內(nèi)容為作者和所在團隊的項目經(jīng)驗及科研成果,包括線性控制、容錯控制、非線性控制和切換控制等相關內(nèi)容。
復雜性是大數(shù)據(jù)區(qū)別于小數(shù)據(jù)的本質(zhì)特性,也是當前大數(shù)據(jù)質(zhì)量控制與數(shù)據(jù)治理面臨的核心挑戰(zhàn)。本書圍繞大數(shù)據(jù)的復雜性開展研究,旨在探索當前數(shù)據(jù)資源建設與利用過程中面臨的挑戰(zhàn)和技術難題,促進數(shù)據(jù)價值的充分釋放。全書分為6部分,共24章。第1部分概述(第1、2章),綜述所研究數(shù)據(jù)控制技術的基本概念和任務定位,以及國內(nèi)外的研究進展;第2部分實體分辨技術(第3~13章),研究了高維數(shù)據(jù)實體分辨、名稱分辨、XML數(shù)據(jù)實體分辨和跨模態(tài)數(shù)據(jù)實體分辨等;第3部分真值發(fā)現(xiàn)技術(第14~18章),研究了單真值發(fā)現(xiàn)、多真值發(fā)
本書分為10章,其中第1~9章探討了排序、推薦系統(tǒng)、聚類、線性回歸等內(nèi)容,每章都以一個具體的實際問題開始,其主要目的是激發(fā)對某一特定大數(shù)據(jù)分析技術的研究。接下來探討其背后的數(shù)學原理——包括重要的定義、輔助陳述和得出的結論。案例研究有助于將所學知識應用于跨學科的環(huán)境中,包括對逐步任務的描述和有用的提示。每章之后都配有習題,作為自學中不可缺少的一部分,有助于提高對基礎理論的理解。第10章提供了前9章的習題答案,以及Python代碼中的算法描述作為補充材料。本書適合作為大數(shù)據(jù)分析、應用數(shù)學及相關專業(yè)的
大數(shù)據(jù)技術與應用發(fā)展不僅改變著網(wǎng)絡信息環(huán)境,而且決定數(shù)據(jù)的存在形態(tài)與數(shù)字信息資源的分布和利用結構,直接關系到用戶的認知需求表達與數(shù)字信息交互機制。在這一背景下,本書從大數(shù)據(jù)技術基礎、數(shù)據(jù)內(nèi)容管理和數(shù)字信息利用出發(fā),按照大數(shù)據(jù)應用與服務基礎構架進行理論和實踐的歸納;通過基本問題的分析和實證探索,圍繞大數(shù)據(jù)需求、數(shù)字資源形態(tài)和數(shù)據(jù)關聯(lián)關系,研究多模態(tài)大數(shù)據(jù)資源組織和面向應用的數(shù)字信息服務。本書在面向現(xiàn)實問題的研究中,對前沿性發(fā)展進行相應的展示,所涉及的問題因而具有拓展性。