本書(shū)通過(guò)大型旅游數(shù)據(jù)分析項(xiàng)目的開(kāi)發(fā)案例,全面展示了使用Python進(jìn)行旅游數(shù)據(jù)分析的過(guò)程和實(shí)踐。全書(shū)共9章。第1章介紹了大數(shù)據(jù)的概念、發(fā)展及主要技術(shù),第2章介紹了Python的基礎(chǔ)知識(shí),第3章介紹了網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)的采集方法,第4章介紹了數(shù)據(jù)解析方法,第5章介紹了數(shù)據(jù)存取方法,第6章介紹了數(shù)據(jù)處理與分析方法,第7章介紹了數(shù)據(jù)可視化方法,第8章設(shè)計(jì)了兩個(gè)旅游大數(shù)據(jù)綜合案例,第9章總結(jié)了本書(shū)的相關(guān)研究。 本書(shū)以Windows和PyCharm為平臺(tái),完整地對(duì)數(shù)據(jù)分析過(guò)程進(jìn)行系統(tǒng)論述,并介紹各個(gè)模塊所需要的基本技術(shù)及應(yīng)用。書(shū)中所有知識(shí)點(diǎn)均給出了實(shí)例代碼,并全部通過(guò)了程序驗(yàn)證。 本書(shū)可作為智慧旅游專(zhuān)業(yè)及相關(guān)專(zhuān)業(yè)的教學(xué)用書(shū),也可作為感興趣讀者的自學(xué)讀物,還可供使用Python進(jìn)行旅游大數(shù)據(jù)分析的旅游從業(yè)者參考。
以Windows和PyCharm為平臺(tái),介紹各個(gè)模塊所需要的基本技術(shù)及應(yīng)用,所有知識(shí)點(diǎn)均給出實(shí)例代碼并通過(guò)程序驗(yàn)證。
黨的二十大報(bào)告指出:教育、科技、人才是全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家的基礎(chǔ)性、戰(zhàn)略性支撐。必須堅(jiān)持科技是第一生產(chǎn)力、人才是第一資源、創(chuàng)新是第一動(dòng)力,深入實(shí)施科教興國(guó)戰(zhàn)略、人才強(qiáng)國(guó)戰(zhàn)略、創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略,這三大戰(zhàn)略共同服務(wù)于創(chuàng)新型國(guó)家的建設(shè)。高等教育與經(jīng)濟(jì)社會(huì)發(fā)展緊密相連,對(duì)促進(jìn)就業(yè)創(chuàng)業(yè)、助力經(jīng)濟(jì)社會(huì)發(fā)展、增進(jìn)人民福祉具有重要意義。
在當(dāng)今大數(shù)據(jù)時(shí)代,數(shù)字經(jīng)濟(jì)的快速發(fā)展使得各行各業(yè)處于數(shù)字化轉(zhuǎn)型的快速發(fā)展時(shí)期,數(shù)字信息更是以大量高速的狀態(tài)不斷增長(zhǎng)。旅游產(chǎn)業(yè)作為一個(gè)對(duì)社會(huì)信息變化高度敏感的行業(yè),對(duì)高質(zhì)量數(shù)據(jù)分析的需求也逐漸增多。
2023年,全國(guó)文化和旅游產(chǎn)業(yè)發(fā)展工作會(huì)議指出,當(dāng)前我國(guó)人民群眾對(duì)文化和旅游產(chǎn)品供給提出了更高的要求,要認(rèn)真研判產(chǎn)業(yè)發(fā)展面臨的新形勢(shì)、新變化,準(zhǔn)確把握產(chǎn)業(yè)發(fā)展重點(diǎn)工作方向,進(jìn)一步發(fā)揮文化和旅游消費(fèi)在穩(wěn)增長(zhǎng)、擴(kuò)內(nèi)需中的重要作用。
旅游大數(shù)據(jù)分析可以幫助旅游部門(mén)分析相關(guān)數(shù)據(jù),在此基礎(chǔ)上做好公共管理服務(wù),提升旅游業(yè)管理決策能力; 可以幫助旅游景區(qū)進(jìn)行游客分析、數(shù)據(jù)挖掘,有效指導(dǎo)景區(qū)的運(yùn)營(yíng)發(fā)展; 能幫助旅游企業(yè)查找不足,為游客定制個(gè)性化的旅游服務(wù),提高旅游服務(wù)質(zhì)量; 能幫助旅游企業(yè)進(jìn)行市場(chǎng)分析、客戶(hù)需求分析,更新?tīng)I(yíng)銷(xiāo)策略并做好旅游經(jīng)營(yíng)策略管理,提高旅游市場(chǎng)判斷力,從而推動(dòng)整個(gè)旅游產(chǎn)業(yè)的發(fā)展。由此可見(jiàn),旅游大數(shù)據(jù)分析對(duì)旅游業(yè)的發(fā)展至關(guān)重要。
Python是一門(mén)輕量級(jí)的數(shù)據(jù)分析語(yǔ)言,它靈活、輕便,可以與各行各業(yè)相結(jié)合,從而極大地提高人們的工作效率。將Python應(yīng)用在旅游大數(shù)據(jù)分析中,即對(duì)旅游數(shù)據(jù)進(jìn)行合法抓取并存儲(chǔ),結(jié)合實(shí)際需求對(duì)數(shù)據(jù)進(jìn)行分析,再以可視化的角度進(jìn)行呈現(xiàn)。 Python旅游大數(shù)據(jù)分析是一門(mén)新的交叉學(xué)科應(yīng)用領(lǐng)域,迫切需要對(duì)此進(jìn)行系統(tǒng)論述。
本書(shū)以Windows和PyCharm為平臺(tái),完整地對(duì)網(wǎng)絡(luò)數(shù)據(jù)采集數(shù)據(jù)解析數(shù)據(jù)存取數(shù)據(jù)處理分析數(shù)據(jù)可視化的數(shù)據(jù)分析過(guò)程進(jìn)行系統(tǒng)論述,并介紹各個(gè)板塊所需要的基本技術(shù); 以旅游數(shù)據(jù)分析為案例進(jìn)行實(shí)踐開(kāi)發(fā),以?xún)蓚(gè)大型旅游數(shù)據(jù)分析項(xiàng)目的開(kāi)發(fā)為例,完整展示了Python旅游數(shù)據(jù)分析的過(guò)程和實(shí)踐。
全書(shū)共9章。第1章介紹了大數(shù)據(jù)的概念、發(fā)展及主要技術(shù),第2章介紹了Python的基礎(chǔ)知識(shí),第3章介紹了網(wǎng)絡(luò)公開(kāi)數(shù)據(jù)的采集方法,第4章介紹了數(shù)據(jù)解析方法,第5章介紹了數(shù)據(jù)存取方法,第6章介紹了數(shù)據(jù)處理與分析方法,第7章介紹了數(shù)據(jù)可視化方法,第8章設(shè)計(jì)了兩個(gè)旅游大數(shù)據(jù)綜合案例,第9章總結(jié)了本書(shū)的相關(guān)研究。
本書(shū)對(duì)攜程網(wǎng)、12306、去哪兒網(wǎng)等進(jìn)行數(shù)據(jù)采集,僅用于學(xué)習(xí)交流,不作為商業(yè)用途,不宜頻繁采集,以免影響網(wǎng)站運(yùn)行。書(shū)中所有實(shí)驗(yàn)均通過(guò)測(cè)試,但仍然可能會(huì)出現(xiàn)網(wǎng)站結(jié)構(gòu)升級(jí)導(dǎo)致程序不能正常運(yùn)行的情況,請(qǐng)讀者知悉。
為便于學(xué)習(xí)和理解,本書(shū)提供軟件安裝包、程序源碼等資源,可在目錄上方的資源下載二維碼中獲取。
本書(shū)的出版基于以下項(xiàng)目的研究成果: 重慶旅游職業(yè)學(xué)院2022年校級(jí)課題(xj2223)、重慶旅游職業(yè)學(xué)院2023年教學(xué)質(zhì)量與教學(xué)改革工程建設(shè)項(xiàng)目(YJKG2023001)、重慶市2023年科學(xué)技術(shù)研究計(jì)劃項(xiàng)目(KJQN202304604)。
由于作者水平有限,書(shū)中錯(cuò)漏在所難免,敬請(qǐng)讀者批評(píng)指正。
作者2023年7月
第1章大數(shù)據(jù)
1.1什么是數(shù)據(jù)
1.2數(shù)據(jù)的管理
1.3大數(shù)據(jù)的概念
1.4大數(shù)據(jù)的發(fā)展
1.5大數(shù)據(jù)的特點(diǎn)
1.6大數(shù)據(jù)的主要技術(shù)
1.7大數(shù)據(jù)的應(yīng)用
第2章Python語(yǔ)言基礎(chǔ)
2.1程序設(shè)計(jì)語(yǔ)言
2.1.1程序設(shè)計(jì)語(yǔ)言的發(fā)展
2.1.2常用的程序設(shè)計(jì)語(yǔ)言
2.2Python開(kāi)發(fā)環(huán)境配置
2.2.1Python的安裝
2.2.2PyCharm的安裝
2.3基本語(yǔ)法
2.3.1編寫(xiě)風(fēng)格
2.3.2注釋方式
2.3.3數(shù)據(jù)類(lèi)型
2.3.4表達(dá)式
2.4程序結(jié)構(gòu)
2.4.1選擇結(jié)構(gòu)
2.4.2循環(huán)結(jié)構(gòu)
2.4.3異常處理
2.5函數(shù)與模塊
2.5.1函數(shù)
2.5.2模塊
2.6序列數(shù)據(jù)
2.6.1字符串
2.6.2列表
2.6.3元組
2.6.4字典
2.7面向?qū)ο?/p>
2.7.1面向?qū)ο蟮母拍?/p>
2.7.2Python面向?qū)ο缶幊?/p>
2.8文件操作
2.8.1打開(kāi)、讀取文件
2.8.2關(guān)閉文件
2.8.3寫(xiě)文件
2.8.4讀文件的N個(gè)字符
2.8.5讀文件的一行或多行字符
2.8.6不同編碼
2.8.7用指針改變讀寫(xiě)位置
第3章數(shù)據(jù)采集
3.1爬蟲(chóng)概述
3.1.1爬蟲(chóng)的基本概念
3.1.2爬蟲(chóng)的合法性
3.2網(wǎng)頁(yè)與爬蟲(chóng)
3.2.1URL
3.2.2認(rèn)識(shí)網(wǎng)頁(yè)結(jié)構(gòu)
3.2.3爬蟲(chóng)實(shí)現(xiàn)過(guò)程
3.3Requests庫(kù)
3.3.1Requests庫(kù)的安裝
3.3.2Requests庫(kù)的功能介紹
3.3.3用Requests爬取旅游網(wǎng)站數(shù)據(jù)
3.4Selenium抓取動(dòng)態(tài)頁(yè)面
3.4.1Selenium概述
3.4.2Selenium的安裝
3.4.3Selenium的基本用法
3.4.4用Selenium爬取旅游網(wǎng)站數(shù)據(jù)
第4章數(shù)據(jù)解析
4.1數(shù)據(jù)解析技術(shù)
4.2正則表達(dá)式
4.3XPath
4.3.1XPath概述
4.3.2lxml庫(kù)
4.3.3應(yīng)用案例
4.4Beautiful Soup
4.4.1Beautiful Soup概述
4.4.2構(gòu)建與輸出
4.4.3遍歷文檔樹(shù)
4.4.4搜索文檔樹(shù)
4.4.5應(yīng)用案例
4.5綜合爬取案例
第5章數(shù)據(jù)存取
5.1JSON
5.1.1JSON概述
5.1.2用JSON庫(kù)存取JSON文件
5.1.3用Pandas庫(kù)存取JSON文件
5.2CSV存取
5.2.1用CSV庫(kù)存取CSV文件
5.2.2用Pandas庫(kù)存取CSV文件
5.2.3應(yīng)用案例
5.3XLSX存取
5.3.1用xlrd庫(kù)存取XLSX文件
5.3.2用xlsxwriter庫(kù)寫(xiě)入XLSX文件
5.3.3用Openpyxl庫(kù)讀/寫(xiě)、修改XLSX文件
5.3.4用Pandas庫(kù)讀/寫(xiě)XLSX文件
5.3.5應(yīng)用案例
5.4數(shù)據(jù)庫(kù)存取
5.4.1數(shù)據(jù)模型
5.4.2關(guān)系數(shù)據(jù)庫(kù)的基本概念與運(yùn)算
5.4.3關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì)
5.4.4SQL語(yǔ)句
5.4.5在Python中操作MySQL
5.4.6應(yīng)用案例
第6章數(shù)據(jù)處理與分析
6.1NumPy庫(kù)
6.1.1創(chuàng)建數(shù)組
6.1.2數(shù)組的常用屬性
6.1.3數(shù)組計(jì)算
6.1.4索引與切片
6.1.5應(yīng)用案例
6.2Pandas庫(kù)
6.2.1Series類(lèi)型結(jié)構(gòu)
6.2.2DataFrame類(lèi)型結(jié)構(gòu)
6.2.3數(shù)據(jù)計(jì)算
6.2.4數(shù)據(jù)清洗
6.2.5應(yīng)用案例
6.3文本分析
6.3.1中文字符
6.3.2英文文本
6.3.3詞云圖
6.4游客點(diǎn)評(píng)數(shù)據(jù)分析
6.4.1景點(diǎn)點(diǎn)評(píng)數(shù)量與景點(diǎn)熱度之間的相關(guān)性分析
6.4.2繪制歡樂(lè)谷點(diǎn)評(píng)的詞云圖
第7章數(shù)據(jù)可視化
7.1數(shù)據(jù)可視化概述
7.2Matplotlib可視化
7.3Pandas繪圖
7.4Pyecharts可視化
7.5旅游數(shù)據(jù)分析結(jié)果可視化
第8章旅游大數(shù)據(jù)綜合案例
8.1景點(diǎn)熱度分析
8.1.1需求分析
8.1.2思路設(shè)計(jì)
8.1.3編寫(xiě)各模塊代碼
8.1.4編寫(xiě)主文檔
8.1.5結(jié)論
8.2團(tuán)購(gòu)產(chǎn)品分析
8.2.1需求分析
8.2.2編寫(xiě)代碼
8.2.3分析結(jié)果
第9章結(jié)論與展望
參考文獻(xiàn)