本書為十四五高等職業(yè)教育新形態(tài)一體化教材。
高等職業(yè)教育人工智能技術應用專業(yè)的培養(yǎng)目標:培養(yǎng)德、智、體、美、勞全面發(fā)展,具
有良好職業(yè)道德和人文素養(yǎng),掌握人工智能基礎專業(yè)理論知識、應用技術,具備人工智能技術
應用開發(fā)、系統(tǒng)管理與維護等能力,從事人工智能相關的應用開發(fā)、系統(tǒng)集成與運維、產(chǎn)品銷
售與咨詢、售前售后技術支持等工作的高素質(zhì)技術技能人才。隨著人工智能技術應用專業(yè)在各
高職院校的開設,面向高職人工智能技術應用專業(yè)的教材較少,基于此,北京工業(yè)職業(yè)技術學
院組織教師和企業(yè)技術人員一起編寫了本教材《Python 爬蟲與數(shù)據(jù)采集》。該書以就業(yè)為導向,
以能力為本位,為培養(yǎng)高素質(zhì)技能型專業(yè)人才服務,反映產(chǎn)業(yè)升級、技術進步和職業(yè)崗位變化
的要求,努力體現(xiàn)新知識、新技術、新工藝和新方法。
為了便于學生更好地參加1 X職業(yè)技能等級考試,本書將《Python 程序開發(fā)職業(yè)技
能等級標準》融入其中,主要面向 IT 互聯(lián)網(wǎng)企業(yè)、各企事業(yè)單位、政府部門等的信息化、數(shù)
字化部門,從事 Python 程序開發(fā)、爬蟲系統(tǒng)開發(fā)與維護、數(shù)據(jù)采集清洗和存儲等工作崗位。
本書對接 Python 程序開發(fā)1 X職業(yè)技能等級標準。
本書是基于工作過程開發(fā)完成的活頁教材,依據(jù)任務導向目標先行興趣誘發(fā)
來組織教材內(nèi)容。主要設置靜態(tài)網(wǎng)頁數(shù)據(jù)的爬取并解析、爬取動態(tài)網(wǎng)頁的數(shù)據(jù)并解析、利用
Scrapy 框架進行爬取、代理爬蟲、模擬登錄、爬取 App 數(shù)據(jù)等項目,培養(yǎng)學生爬蟲系統(tǒng)開
發(fā)并運維、數(shù)據(jù)研究和加工處理、爬蟲系統(tǒng)的架構設計與開發(fā),構建爬蟲服務平臺、設計算法,
提升網(wǎng)頁爬取的效率和質(zhì)量等能力。每個任務分為任務分析、導學、學習資料、任務實施、任
務評價等模塊,使讀者通過由易到難的若干任務實施,完成整個項目的學習過程。這種模塊化
的教材組織體系,既覆蓋了技能等級標準的全部對應知識點,也便于教師在課堂中的教學實施。
本書由方水平任主編,劉業(yè)輝、趙元蘇、郭蕊、朱賀新、宋玉娥、楊洪濤、王笑洋參
加編寫,在此感謝中國鐵道出版社有限公司的傾力支持。
由于技術的發(fā)展日新月異,加之編者水平有限,書中不妥之處在所難免,懇請廣大讀
者批評指正。
編 者
2023 年 6 月