關于我們
書單推薦
新書推薦
|
Python大學教程:面向計算機科學和數據科學(英文版) 通過本書,你將學習: 平衡計算機科學基礎知識的教學和數據科學技術的實踐,在大量程序庫的支持下僅編寫少量代碼即可完成實際任務 前 言 “塔爾山上有黃金!1 在過去的幾十年中,很多發(fā)展趨勢一一顯現。計算機的硬件速度越來越快,價格越來越便宜,尺寸越來越小。網絡帶寬(攜帶信息的能力)越來越大,價格越來越便宜。同時軟件規(guī)模越來越龐大,而“開源”運動又將它們變成完全免費或者接近免費。短時間內,“物聯網”將數十億各種各樣的設備連接起來,并快速產生了大規(guī)模的數據。 幾年之前,如果有人讓我們寫一本主題為“大數據”和“云計算”的大學階段編程入門教材,并且在封面上繪制一只彩色的大象(象征“巨大”),我們可能會如此反應:“嗯?”如果他們繼續(xù)讓我們在書名中囊括AI(人工智能),我們可能會說:“真的嗎?這對于編程初學者會不會過于超前了?” 如果有人讓我們在書名中加上“數據科學”,我們可能會問:“計算機科學不是已經包含了數據嗎?為什么我們需要為此單獨分一個科目?”好吧,如今談及程序設計,最酷的說法就是“什么都是數據”—數據科學、數據分析、大數據、關系數據庫(SQL)以及NoSQL和NewSQL數據庫。 如今我們真的寫了這樣一本書!歡迎閱讀! 在本書中,你將會著手學習當今最引人入勝、最前沿的計算技術—你將會看到,它將計算機科學和數據科學輕松地結合在一起,是一門適用于這些學科和相關學科的入門課程。此外,你將使用Python進行編程—世界上發(fā)展速度最快、最流行的編程語言之一。在前言中,我們將展示這本書的“靈魂”。 專業(yè)程序員常常很快喜歡上Python。他們欣賞Python的表現力、易讀性、簡潔性和交互性。他們喜歡開源軟件世界,這個世界正在為廣泛的應用領域不斷生成可復用的軟件。 無論你是教師、初學者或者有經驗的專業(yè)人士,這本書都將對你有所幫助。Python對于初學者而言是優(yōu)秀的第一門編程語言,并且適用于開發(fā)工業(yè)級的應用。對于新人而言,本書前面的章節(jié)奠定了堅實的編程基礎。 我們希望你在這本書中學到知識,并且發(fā)現快樂與挑戰(zhàn)。徜徉其中,享受樂趣。 將Python用于計算機科學和數據科學教學 許多頂尖的美國大學使用Python作為介紹計算機科學的語言,“CS學科排名前10的有8個(80%)、排名前39的有27個(69%)使用Python”2。Python如今在教學和科學計算中尤其受到歡迎3,最近已超過R語言并成為最受歡迎的數據科學編程語言4,5,6。 模塊化體系結構 我們預計計算機科學的本科生課程將會包含數據科學部分—這本書為此而設計,并且在Python編程方面滿足數據科學入門課程的需求。 本書的模塊化體系結構幫助我們滿足計算機科學、數據科學和其他相關受眾的多樣化需求。教師能方便地進行調整,為不同專業(yè)的學生開設系列課程。 第1~11章介紹傳統的計算機科學編程主題。第1~10章每章都包含可選的、簡潔的“數據科學入門”一節(jié),介紹人工智能、基礎統計、趨中和離中度量、模擬、靜態(tài)/動態(tài)可視化、CSV文件的使用、數據探索和數據整理的pandas庫、時間序列和簡單的線性回歸。這會幫助你學習第12~17章中的數據科學、AI、大數據和云計算相關的案例研究,你能在真實世界數據集中完整地使用這些案例研究。 學完第1~5章中的Python相關知識以及第6~7章中的一些關鍵部分,你已經能夠在第12~17章中解決數據科學、AI和大數據案例研究中的關鍵用例,這對于所有的編程通識課都是實用的: 計算機科學方面的課程可以著重于第1~11章并略講第1~10章的“數據科學入門”部分。教師還可以介紹第12~17章中的部分或者全部案例研究。 數據科學方面的課程可以略講第1~11章,著重于大部分或者全部的第1~10章中的“數據科學入門”部分以及第12~17章中的案例研究。 前言中的“章節(jié)依賴關系”部分將展示本書的獨特架構并幫助教師規(guī)劃個性化的教學大綱。 第12~17章的內容很酷、很強大、很現代。其中包含能動手實現的案例研究,例如有監(jiān)督學習、無監(jiān)督學習、深度學習、強化學習(在習題中)、自然語言處理、Twitter數據挖掘、IBM Watson可視化計算、大數據以及其他內容。在這個過程中,你將會掌握數據科學的大量術語和概念,包括術語的定義以及在不同規(guī)模的程序中使用的概念。 本書讀者對象 模塊化的結構使得本書適用于以下讀者: 所有標準的Python計算機科學及相關專業(yè)。首先,我們的書是一本現代的、可靠的Python CS1入門教材。ACM/IEEE的計算課程建議列出了5個類別:計算機工程、計算機科學、信息系統、信息技術和軟件工程7。這本書對這些類別都適用。 數據科學專業(yè)的本科生課程。我們的書對許多數據科學課程都是有用的。對于入門級課程而言,它遵循課程建議,整合了所有課程的關鍵領域。在計算機科學或者數據科學課程計劃中,本書都可以作為第一本專業(yè)教材,也可用作高年級課程的Python參考書。 非計算機和數據科學專業(yè)學生的輔修課程。 數據科學的研究生課程。這本書可以作為入門級課程的主要教材,也可以作為高年級課程的Python參考書。 兩年制學院。這些學校會為準備進入四年制學院的數據科學專業(yè)的學生開設相關課程—這本書就是一個合適的選擇。 高中。就像出于強烈的興趣愛好而開設計算機課程一樣,很多高中已經開設了Python編程和數據科學課程8。最近在LinkedIn上發(fā)表的一篇文章寫道:“高中就應該教授數據科學,課程應該直面我們的學生將要選擇的職業(yè)類型,直接關注工作和技術的發(fā)展方向。”9我們相信數據科學很快就會成為一門受歡迎的大學先修課程并且最終會有數據科學的AP考試。 專業(yè)行業(yè)培訓課程。 本書主要特色 保持簡潔,保持短小,保持新穎 保持簡潔(KIS)。在書的各個方面以及教師和學生資源中,我們都力求簡單明了。例如,在寫自然語言處理的時候,我們使用了簡潔直觀的TextBlob庫而不是更為復雜的NLTK。一般情況下,當有多個庫都能完成相近的任務時,我們選擇最簡單的一個。 保持短。↘IS)。本書的538個案例研究中大多數都很短小—伴隨交互式IPython的即時反饋,通常只有幾行代碼。我們大約只在40個大型腳本和完整案例研究中使用了較長的代碼示例。 保持新穎(KIT)。我們查閱了大量最新的Python編程和數據科學教材以及專業(yè)書籍,瀏覽、閱讀或者觀看了大約15 000篇最新的文獻、研究論文、白皮書、視頻、博客文章、論壇文章和文檔。這讓我們能夠“把握”Python、計算機科學、數據科學、AI、大數據和云計算社區(qū)的脈搏,從而創(chuàng)建出1566個嶄新的案例研究、習題和項目(EEP)。 IPython的實時反饋、搜索、發(fā)現和實驗教學方法 學習這本書的理想方法是閱讀它并同時運行代碼示例。在整本書中,我們使用了IPython解釋器,它采用一種友好的、實時反饋的模式,能夠在Python及其擴展庫上快速進行搜索、發(fā)現和實驗。 大多數代碼都在小型的可交互的IPython會話中展示。你所寫的每一個代碼片段,IPython能夠立即讀取然后計算并給出結果。這種即時反饋使你保持注意力,并助力學習過程、支撐原型設計和加速軟件開發(fā)過程。 我們的書總是強調現場代碼的教學方法,通過樣例輸入和結果顯示,專注于程序的完整和可運行。IPython的“魔力”在于將代碼片段轉換為實時代碼,每當你輸入一行時,這些代碼就會“活起來”。這有助于學習并鼓勵動手實驗。 IPython是學習常見錯誤的報錯信息的好方法。我們有時故意犯錯來告知你將發(fā)生什么,因此,當我們說某件事是錯誤的時候,試試看會發(fā)生什么。 本書配有557道自檢習題(適合于“翻轉課堂”,稍后介紹)和471個章末習題和項目,它們中的大多數遵循了同樣的實時反饋理念。 Python編程基礎 首先,本書是一本Python入門教材。我們提供了豐富的Python編程知識和常規(guī)的編程基礎內容。 我們討論了Python的編程模型—過程式編程、函數式編程和面向對象編程。 我們強調解決問題和算法設計。 我們?yōu)闇蕚溥M入產業(yè)界的學生準備了最好的習題。 函數式編程貫穿全書。第4章中的一個圖表展示了Python中關鍵的函數式編程能力及其對應的章節(jié)。 538個案例研究以及471個習題和項目 學生通過動手實踐的方法,在廣泛選擇的真實世界案例研究、習題和項目(EEP)中開展學習,這些內容來自計算機科學、數據科學和其他很多領域。 538個案例研究的內容均圍繞計算機科學、數據科學、人工智能和大數據,從單個代碼片段到完整案例研究均有涉及。 471個習題和項目自然地拓展了章節(jié)中的示例。每章都以一系列涵蓋了各種主題的習題作為結尾,這有助于教師根據受眾的需求調整課程內容并且在每個學期布置不同的作業(yè)。 EEP向你提供了引人入勝的、富有挑戰(zhàn)性的、有趣的Python基礎知識,包括可以上手實驗的AI、計算機科學和數據科學項目。 學生將面對令人興奮且有趣的有關AI、大數據和云技術應用問題的挑戰(zhàn),比如自然語言處理、Twitter數據挖掘、機器學習、深度學習、Hadoop、MapReduce、Spark、IBM Watson、關鍵的數據科學庫(NumPy、pandas、SciPy、NLTK、TextBlob、spaCy、BeautifulSoup、Textatistic、Tweepy、Scikit-learn、Keras)、關鍵的可視化庫(Matplotlib、Seaborn、Folium)以及其他。 我們的EEP鼓勵你思考未來。下述案例研究雖然只出現在前言中,但本書包含了多個發(fā)人深省的類似項目:利用深度學習、物聯網以及電視攝像機(由體育賽事數據訓練出來的),我們可以自動進行數據分析、回顧比賽細節(jié)以及即時回放,因此球迷不再需要忍受直播體育賽事的誤判和延遲。既然如此,我們可能會產生這樣的想法:可以使用這些技術來取消裁判。為什么不呢?我們已經越來越多地把自己的生命托付給基于深度學習的技術,比如機器人外科醫(yī)生和自動駕駛汽車。 項目習題鼓勵你更加深入地了解所學的知識并研究本書沒有涉及的技術。真正的項目通常規(guī)模更大,需要更多的網絡搜索和實現代價。 在教師手冊中,我們提供了許多習題的答案,包括第1~11章中核心的Python代碼。答案僅對教師可見,詳見后文中關于Pearson教師資源的介紹。我們沒有提供項目和研究習題的答案。 我們鼓勵你仔細觀看示例和開源代碼案例研究(詳見GitHub網頁),包括課程級別項目、學期級別項目、專業(yè)方向級別項目、畢業(yè)設計項目和畢業(yè)論文。 557道自檢習題及其答案 平均每個小節(jié)后有三道自檢習題。 自檢習題的類型包括填空、判斷和討論,能幫你測試是否理解了所學的內容。 IPython交互式自檢習題可幫助你不斷嘗試并強化所學的編程技術。 為快速掌握所學知識,自檢習題后面都跟有答案。 避免煩瑣的數學語言,多用自然語言進行解釋 數據科學的主題與數學高度相關。這本書將用作計算機科學和數據科學第一門課的教科書,學生可能沒有深厚的數學知識背景,所以我們避免了煩瑣的數學語言,把數學內容留在高層次的課程中。 在案例研究、習題和項目中,我們關注數學的概念而不是細節(jié)。我們使用statistics、NumPy、SciPy、pandas等Python庫和其他的很多庫來解決問題,從而隱藏了數學復雜性。所以,學生能夠直接使用數學技術(如線性回歸),而不需要知道背后的數學知識。在機器學習和深度學習的案例研究中,我們專注于創(chuàng)建在“幕后”做數學運算的對象—這是基于對象編程的關鍵之一。這個做法等同于安全地駕駛一輛汽車前往目的地時不需要知道制造引擎、變速箱、動力轉向和防滑剎車系統背后的數學、工程和科學知識。 可視化 67張可視化結果圖幫助你理解概念,包含二維或三維的、靜態(tài)的、動態(tài)的、動畫的和交互式的圖表、圖形、圖片、動畫等。 我們關注由Matplotlib、Seaborn、pandas和Folium(用于交互式地圖)產生的高層可視化結果。 我們使用可視化作為教學工具。例如,我們使用動態(tài)滾壓模型和柱狀圖使大數定律“鮮活”起來。隨著滾動數量的增加,你將看到每個面在滾動總數中所占的百分比逐漸接近16.667%(1/6),代表百分比的柱條也趨于一致。 你需要了解自己的數據。一種簡單的辦法是直接看原始數據。即使是少量的數據,你也可能很快迷失在細節(jié)當中。對于大數據而言,可視化對于數據探索和傳遞可復制的研究結果尤為重要,數據規(guī)?赡苁前偃f級的、上億的甚至更為龐大。通常而言,一圖勝千言10—在大數據中,一個可視化結果能夠比得上數據庫中數億甚至更多的個體。 有時候,你需要“飛到離數據40 000英尺高”才能在“大范圍”看到它。描述性統計當然有幫助,但是也可能產生誤導。你將在習題中研究Anscombe四重奏,這個案例研究通過可視化直觀地表明:差異顯著的數據集可能產生幾乎相同的描述性統計。 我們展示了可視化結果和動畫代碼以便你能夠自己實現。我們也通過Jupyter Notebook的形式給出動畫的源代碼文件,便于你自定義代碼和動畫參數,進而重新執(zhí)行動畫,然后查看其帶來的影響。 許多習題都要求你創(chuàng)建自己的可視化結果。 數據經驗 “數據科學本科課程建議”中提出:“數據經驗需要在所有課程中扮演核心角色!11 在本書的案例研究、習題和項目中,你將使用許多真實世界數據集和數據源。網上有各種免費的開源數據集供你實驗。有些我們參考的網站列出很多數據集,我們鼓勵你探索這些數據集。 我們收集了上百份教學大綱,追蹤了教師的數據集偏好,并研究了最流行的監(jiān)督機器學習、無監(jiān)督機器學習和深度學習的數據集。你將會使用到的許多庫都附帶用于實驗的標準數據集。 你將學習如何進行數據獲取和分析準備,學習使用多種技術進行數據分析、模型調整并有效交流結果,特別是通過可視化。 像開發(fā)者一樣思考 你將以開發(fā)者為視角,使用像GitHub和StackOverflow一樣的流行網站并且進行大量互聯網搜索!皵祿茖W入門”部分和第12~17章中的案例研究提供了豐富的數據經驗。 GitHub為尋找開源代碼提供了一個優(yōu)秀的場所,你可以把代碼合并到自己的項目中(并將你的代碼貢獻到開源社區(qū)中)。它是軟件開發(fā)者版本控制工具庫中的重要組成部分,這些工具幫助開發(fā)團隊管理他們的開源(和私有)項目。 我們鼓勵你學習GitHub等網站上發(fā)布的代碼。 在為計算機科學和數據科學的職業(yè)生涯做準備的過程中,你將大量使用免費且開源的Python和數據科學庫,來自政府、工業(yè)界和學術界的真實世界數據集,以及免費、免費試用或免費增值的軟件和云服務。 動手實踐云計算 很多大數據分析發(fā)生在云端。在云端動態(tài)地度量你的應用程序需要的硬件和軟件規(guī)模是比較容易的。你將會使用各種各樣的云服務(某些是直接的,某些是間接的),包括Twitter、Google翻譯、IBM Watson、Microsoft Azure、OpenMapQuest、geopy、Dweet.io 和 PubNub。你將在習題和項目中了解更多。 我們鼓勵你使用各種云服務供應商提供的免費、免費試用或免費增值的服務。我們更喜歡那些不需要信用卡的,因為誰都不想冒意外地積攢巨額賬單的風險。如果你決定使用需要信用卡的服務,確保你使用的免費層不會自動跳轉到支付層。 數據庫、大數據和大數據基礎設施 根據IBM(2016年11月)的數據,全球90%的數據是在過去的兩年內產生的12。有證據表明,數據產生的速度正在加快。 根據2016年3月Analytics Week的一篇文章,五年內將有超過500億臺設備連接到互聯網,到2020年前,我們將每秒為地球上的每一個人產生1.7兆字節(jié)的新數據13! 本書包含了對關系數據庫和帶有SQLite的SQL的探討,感興趣的讀者可以選擇閱讀。 數據庫是存儲和操作你要處理的大量數據的關鍵性大數據基礎設施。關系數據庫處理結構化數據,它們不適用于大數據應用程序中的非結構化和半結構化數據。因此,隨著大數據的發(fā)展,為了有效處理這些數據,NoSQL和NewSQL數據庫應運而生。本書包含對NoSQL和NewSQL的概述,以及利用MongoDB JSON文件數據庫的動手實踐的案例研究。 第17章包含關于大數據硬件與軟件基礎設施的細致討論。 人工智能案例研究 為什么這本書沒有關于人工智能的章節(jié)呢?畢竟,“AI”是印在封面上的。在第12~16章的案例研究中,我們介紹的人工智能主題(計算機科學與數據科學的一個關鍵交集)包含自然語言處理、利用數據挖掘對Twitter進行情感分析、利用IBM Watson進行認知計算、監(jiān)督機器學習、無監(jiān)督機器學習、深度學習和強化學習(在習題中)。第17章介紹了大數據硬件和軟件基礎設施,這些基礎設施支撐了計算機科學家和數據科學家研究的前沿AI解決方案。 計算機科學 第1~10章的Python基礎知識會讓你像計算機科學家一樣思考。第11章提供了一個更高的視角,其中討論的都是經典的計算機科學話題。第11章強調性能問題。 內置集合:列表、元組、集合、字典 今天,大多數應用開發(fā)人員不再構建定制的數據結構。這是CS2課程的主題—嚴格來說,我們的范圍是CS1和相應的數據科學課程。書中用兩章的篇幅詳細介紹了Python的內置數據結構—列表、元組、字典和集合,大多數數據結構任務都可以通過這些數據結構來完成。 使用NumPy數組、pandas Series和DataFrame進行面向數組的編程 在這本書中我們專注于開源庫中的三個關鍵數據結構—NumPy數組、pandas Series和pandas DataFrame。這些庫被廣泛用于數據科學、計算機科學、人工智能和大數據。NumPy的性能比內置Python列表高出兩個數量級。 第7章中詳細介紹了NumPy數組。pandas等許多庫都是在NumPy的基礎上構建的。第7~9章的“數據科學入門”部分介紹了pandas Series和DataFrame,這兩個庫以及NumPy數組將在剩余的章節(jié)中頻繁使用。 文件處理和序列化 第9章介紹文本文件處理,然后演示了如何使用流行的JSON(JavaScript對象表示法)格式把對象序列化。JSON是一個普遍使用的數據交換格式,在后面的數據科學章節(jié)中你會經常見到它—通常為簡單起見把JSON的細節(jié)隱藏在庫中。 基于對象編程 在我們?yōu)楸緯M行調研期間研究的所有Python代碼中,很少遇到自定義類,而這在Python開發(fā)者使用的強大的庫中是很常見的。 我們強調大量使用Python開源社區(qū)打包到工業(yè)標準類庫中的類。你將專注于:了解有哪些庫,選擇你的應用程序需要的庫,從現有類(通常是一行或兩行代碼)創(chuàng)建對象以及讓它們“跳起來、舞起來、唱起來”。這叫作基于對象編程—它使你能夠簡潔地構建令人印象深刻的應用程序,這是體現Python吸引力的重要組成部分。 通過這種方法,你可以使用機器學習、深度學習、強化學習(在習題中)和其他AI技術來解決各種各樣有趣的問題,包括語音識別和計算機視覺等認知計算方面的挑戰(zhàn)。過去,如果僅僅學過入門級編程課程,是不可能完成這些任務的。 面向對象編程 對計算機科學專業(yè)的學生來說,開發(fā)自定義類是一個至關重要的面向對象編程技能,相關的繼承、多態(tài)和鴨子類型也同樣重要。我們將在第10章中討論這些內容。 面向對象編程的討論是模塊化的,所以教師可以分開介紹基礎或中級部分。 ………… 保羅·戴特爾(Paul Deitel) Deitel&Associates公司首席執(zhí)行官兼首席技術官,畢業(yè)于麻省理工學院,在計算機領域擁有38年的經驗。他自1992年以來就為軟件開發(fā)人員教授專業(yè)課程,為包括思科、IBM、西門子、戴爾、NASA、北電網絡在內的全球企業(yè)客戶提供了數百門編程課程。 目 錄 第1章 計算機和Python簡介 1 1.1 引言 2 1.2 硬件和軟件 3 1.3 數據層級 6 1.4 機器語言、匯編語言和高級語言 9 1.5 對象技術簡介 10 1.6 操作系統 13 1.7 Python簡介 16 1.8。ㄕZ言)庫 18 1.9 其他常見編程語言 20 1.10 試用:使用IPython和Jupyter Notebook 21 1.11 Internet和WWW 29 1.12 軟件技術 32 1.13 大數據 33 1.14 數據科學入門:大數據移動應用案例研究 40 第2章 Python程序設計簡介 49 2.1 引言 50 2.2 變量和賦值語句 50 2.3 算術操作 52 2.4 print函數、單引號字符串和雙引號字符串 56 2.5 三引號字符串 58 2.6 從用戶處獲得輸入 59 2.7 判斷:if語句與比較操作 61 2.8 對象和動態(tài)類型 66 2.9 數據科學入門:基本統計功能 68 2.10 小結 70 第3章 控制語句和程序設計 73 3.1 引言 74 3.2 算法 74 3.3 偽代碼 75 3.4 控制語句 75 3.5 if語句 78 3.6 if...else和if...elif...else語句 80 3.7 while語句 85 3.8 for語句 86 3.9 增量賦值 89 3.10 程序設計:通過序列控制重復 90 3.11 程序設計:通過哨兵控制重復 93 3.12 程序設計:嵌套控制結構 97 3.13 內置函數range:進一步討論 101 3.14 使用Decimal類型表達貨幣總量 102 3.15 break和continue語句 105 3.16 布爾操作and、or和not 106 3.17 數據科學入門:趨勢的度量—均值、中值、眾數 109 3.18 小結 111 第4章 函數 119 4.1 引言 120 4.2 函數的定義 120 4.3 多參數函數 123 4.4 隨機數生成器 125 4.5 案例研究:機會游戲 128 4.6 Python標準庫 131 4.7 math模塊函數 132 4.8 使用IPython的tab補全功能 133 4.9 缺省形參值 135 4.10 關鍵字實參 136 4.11 任意實參表 136 4.12 方法:歸屬于對象的函數 138 4.13 作用域規(guī)則 138 4.14 import:進一步討論 140 4.15 給函數傳遞實參:進一步討論 142 4.16 函數調用棧 145 4.17 函數式程序設計 146 4.18 數據科學入門:數據分布的度量 148 4.19 小結 150 第5章 序列:列表和元組 155 5.1 引言 156 5.2 列表 156 5.3 元組 161 5.4 序列拆包 163 5.5 序列切片 166 5.6 del語句 169 5.7 給函數傳遞列表 171 5.8 排序列表 172 5.9 搜索序列 174 5.10 其他列表方法 176 5.11 用列表模擬棧 178 5.12 列表解析 179 5.13 生成器表達式 181 5.14 過濾器、映射和約簡 182 5.15 其他序列處理函數 185 5.16 二維列表 187 5.17 數據科學入門:模擬和靜態(tài)可視化 191 5.18 小結 199 第6章 字典和集合 209 6.1 引言 210 6.2 字典 210 6.3 集合 221 6.4 數據科學入門:動態(tài)可視化 228 6.5 小結 234 第7章 使用NumPy進行面向數組的編程 239 7.1 引言 240 7.2 從已有數據中創(chuàng)建數組 241 7.3 數組屬性 242 7.4 用特定值填充數組 244 7.5 使用range創(chuàng)建數組 244 7.6 列表與數組的性能比較:%timeit簡介 246 7.7 數組操作 248 7.8 NumPy計算方法 250 7.9 全局函數 252 7.10 索引和切片 254 7.11 視圖:淺拷貝 256 7.12 深拷貝 258 7.13 轉換和轉置 259 7.14 數據科學入門:pandas Series和DataFrame 262 7.15 小結 275 第8章 字符串:進一步討論 283 8.1 引言 284 8.2 格式化字符串 285 8.3 字符串拼接和重復 289 8.4 字符串空白符剝離 290 8.5 改變字符的大小寫 291 8.6 字符串比較操作 292 8.7 子串搜索 292 8.8 子串替換 294 8.9 字符串切分和合并 294 8.10 字符和字符測試方法 297 8.11 原生字符串 298 8.12 正則表達式簡介 299 8.13 數據科學入門:pandas、正則表達式和數據治理 307 8.14 小結 312 第9章 文件和異常 319 9.1 引言 320 9.2 文件 321 9.3 文本文件處理 321 9.4 更新文本文件 325 9.5 JSON序列化 327 9.6 安全問題:pickle序列化和反序列化 330 9.7 關于文件的其他說明 330 9.8 異常處理 331 9.9 finally子句 336 9.10 顯式引發(fā)異常 339 9.11。ǹ蛇x)棧展開和回溯 339 9.12 數據科學入門:CSV文件的處理 342 9.13 小結 349 第10章 面向對象程序設計 355 10.1 引言 356 10.2 定制類Account 358 10.3 屬性的受控訪問 363 10.4 數據訪問的特性 364 10.5 私有屬性模擬 371 10.6 案例研究:洗牌和切牌 373 10.7 繼承:基類和子類 382 10.8 構建繼承層次和多態(tài)簡介 384 10.9 鴨子類型和多態(tài) 392 10.10 操作符重載 393 10.11 異常類層次和定制異常處理 397 10.12 有名元組 399 10.13 Python 3.7新數據類簡介 400 10.14 使用文檔字符串和doctest進行單元測試 406 10.15 命名空間和作用域 411 10.16 數據科學入門:時間序列和簡單線性回歸 414 10.17 小結 423 第11章 計算機科學思維:遞歸、搜索、排序和大O表示法 431 第12章 自然語言處理 477 第13章 Twitter數據挖掘 515 第14章 IBM Watson和認知計算 565 第15章 機器學習:分類、回歸和聚類 593 第16章 深度學習 665 第17章 大數據:Hadoop、Spark、NoSQL和IoT 723
你還可能感興趣
我要評論
|