關(guān)于我們
書單推薦
新書推薦
|
自然語言處理方法——使用Python基于機器學習和深度學習發(fā)掘文本數(shù)據(jù) 本書系統(tǒng)介紹了基于機器學習和深度學習對文本數(shù)據(jù)進行挖掘和分析的方法,從文本分類、語音識別、主題建模、文本總結(jié)、文本生成、情感分析等多個自然語言處理的應用角度出發(fā),對自然語言處理進行了深入解讀,通過大量Python代碼幫助讀者快速學習并實現(xiàn)基本的甚至較高級的自然語言處理技術(shù)。 全書共六章。第1章介紹數(shù)據(jù)的收集和提取,包括從網(wǎng)頁、PDF、Word、HTML、JSON中收集數(shù)據(jù);第2章介紹文本數(shù)據(jù)的處理,包括形式轉(zhuǎn)換、刪除標點符號、拼寫校正、詞干提取、詞形還原等;第3章介紹文本特征工程,采用的技術(shù)包括One Hot編碼、統(tǒng)計向量化、N-grams、哈希向量化、共生矩陣等;第4章介紹高級自然語言處理,包括文本相似度計算、詞性標注、提取實體、提取主題、情感分析、語音和文本互轉(zhuǎn)等;第5章介紹自然語言處理的行業(yè)應用,如多類分類、文本數(shù)據(jù)總結(jié)、文檔聚類、自然語言處理在搜索引擎中的應用等;第6章介紹基于深度學習的自然語言處理,通過深度學習實現(xiàn)信息檢索、文本分類和單詞預測。 本書注重理論與實踐相結(jié)合,具有較好的實用性,可為自然語言處理或機器學習的相關(guān)從業(yè)人員以及愛好者提供業(yè)務學習指導,也可為Python程序員提供技術(shù)參考,還可為高等院校相關(guān)專業(yè)的本科生和研究生提供學習參考。
你還可能感興趣
我要評論
|