語言智能處理一直是人工智能領(lǐng)域的重要研究方向之一。本書按照研究歷程與現(xiàn)狀、關(guān)鍵技術(shù)與方法、發(fā)展趨勢與展望的基本脈絡(luò),重點(diǎn)介紹了語言智能處理中的語言模型與知識表示、語言分析技術(shù)、語言情感分類、自然語言生成技術(shù)、自動問答與人機(jī)對話、機(jī)器翻譯、信息檢索與信息推薦等主題。本書所描述的內(nèi)容涉及人們?nèi)粘I钪械恼鎸崙?yīng)用場景,理論與實踐相結(jié)合,所探討的技術(shù)具有代表性,便于讀者理解與融會貫通。本書既可作為高等院校相關(guān)專業(yè)師生的教學(xué)參考書,也可作為人工智能領(lǐng)域語言智能處理研究人員和廣大愛好者的技術(shù)參考書。
黃河燕:1963年10月生,籍貫湖南。1986年1月加入中國共產(chǎn)黨,1989年3月參加工作。1983年畢業(yè)于武漢測繪科技大學(xué)計算機(jī)系獲學(xué)士學(xué)位,1986年畢業(yè)于國防科技大學(xué)計算機(jī)系獲碩士學(xué)位,1989年畢業(yè)于中國科學(xué)院計算技術(shù)研究所獲博士學(xué)位,后留所工作,先后任助理研究員、副研究員、研究員;1997年至2009年在中科院計算機(jī)語言信息工程研究中心任副主任、研究員并先后兼任中科院華建集團(tuán)黨委委員、副書記,2009年至今任北京理工大學(xué)計算機(jī)學(xué)院院長、教授,兼北京市海量語言信息處理與云計算應(yīng)用工程技術(shù)研究中心主任及中-德語言信息處理聯(lián)合實驗室主任;現(xiàn)為國家"863計劃”主題專家組成員、中國人工智能學(xué)會及中國中文信息學(xué)會副理事長、教育部計算機(jī)教學(xué)指導(dǎo)委員會委員、北京市學(xué)位委員會委員。主持承擔(dān)了國家自科基金重點(diǎn)項目、"973計劃”課題、"863計劃”項目等20多項國家級科研攻關(guān)項目,獲得了國家科技進(jìn)步一等獎等8項國家級和省部級獎勵,1997年享受國務(wù)院政府特殊津貼,2014年當(dāng)選全國優(yōu)秀科技工作者。
第1章緒論
11語言智能處理簡介
12人工智能與語言智能處理
13基于神經(jīng)網(wǎng)絡(luò)的自然語言處理
14語言智能處理的應(yīng)用
15本書的組織結(jié)構(gòu)
第2章語言模型與知識表示
21語言模型
211概述
212n-gram語言模型
213估計
214評價指標(biāo)
215數(shù)據(jù)稀疏與齊夫定律
216計數(shù)平滑方法
217神經(jīng)網(wǎng)絡(luò)語言模型
218小結(jié)
22詞向量構(gòu)造方法
221詞向量(Word Embedding)構(gòu)造方法概述
222基于全局統(tǒng)計信息的Word Embedding構(gòu)造方法
223基于預(yù)測任務(wù)的Word Embedding構(gòu)造方法
224利用外部信息的Word Embedding構(gòu)造方法
225方法評價
226Word Embedding的應(yīng)用
227研究展望
23知識圖譜表示學(xué)習(xí)
231表示學(xué)習(xí)的基本概念
232表示學(xué)習(xí)的典型應(yīng)用
233表示學(xué)習(xí)的主要優(yōu)點(diǎn)
234表示學(xué)習(xí)的典型方法
參考文獻(xiàn)
第3章語言分析技術(shù)
31詞法分析
311概述
312自動分詞
313詞性標(biāo)注
314分詞和詞性標(biāo)注的聯(lián)合模型
32句法分析
321概述
322句法結(jié)構(gòu)分析
323依存關(guān)系分析
33篇章分析
331概述
332篇章分析相關(guān)理論及標(biāo)注語料庫
333篇章分析方法
34語義分析
341概述
342詞匯級語義分析
343句子級語義分析
344篇章級語義分析
345基于神經(jīng)網(wǎng)絡(luò)模型的語義分析
346語義分析評測任務(wù)
347未來發(fā)展趨勢
參考文獻(xiàn)
第4章語言情感分類
41情感描述的主要方法
411情感的類別表示法
412情感的維度表示法
42情感識別模型
421文本情感計算
422語音情感計算
43當(dāng)前語言情感識別的挑戰(zhàn)
431領(lǐng)域依賴
432語料庫的建設(shè)
433多模態(tài)融合
434細(xì)粒度情感計算
參考文獻(xiàn)
第5章自然語言生成技術(shù)
51概述
52序列到序列模型
521基本原理和算法框架
522模型實現(xiàn)與注意力機(jī)制
523小結(jié)
53變分自編碼器
531基本原理
532應(yīng)用場景
533高級話題
54生成式對抗網(wǎng)絡(luò)
541基本原理和算法框架
542生成式對抗網(wǎng)絡(luò)的特點(diǎn)
543相關(guān)模型
544小結(jié)
55基于預(yù)訓(xùn)練語言模型的生成方法
551預(yù)訓(xùn)練語言模型
552拓展話題
553小結(jié)
56本章小結(jié)
參考文獻(xiàn)
第6章自動問答與人機(jī)對話
61知識庫問答
611基于語義解析的知識庫問答
612基于神經(jīng)網(wǎng)絡(luò)的端到端知識庫問答
62機(jī)器閱讀理解
621任務(wù)介紹
622機(jī)器閱讀理解系統(tǒng)框架
623機(jī)器閱讀理解系統(tǒng)的核心組件
624代表性機(jī)器閱讀理解模型
625總結(jié)與展望
63人機(jī)對話系統(tǒng)
631面向任務(wù)型的對話系統(tǒng)
632面向非任務(wù)型的聊天系統(tǒng)
64總結(jié)與未來的挑戰(zhàn)
參考文獻(xiàn)
第7章機(jī)器翻譯
71概況
711任務(wù)的定義與研究的意義
712發(fā)展的歷史
72神經(jīng)機(jī)器翻譯
721核心模型
722關(guān)鍵技術(shù)
73數(shù)據(jù)與評測
731數(shù)據(jù)集
732技術(shù)評測
74開源工具
741統(tǒng)計機(jī)器翻譯開源工具
742神經(jīng)機(jī)器翻譯開源工具
75總結(jié)與展望
參考文獻(xiàn)
第8章信息檢索與信息推薦
81概述
811信息檢索的概念與發(fā)展
812信息推薦的概念與發(fā)展
813信息檢索和信息推薦的聯(lián)系和區(qū)別
82信息檢索與信息推薦的相關(guān)技術(shù)
821信息檢索部分前沿技術(shù)
822信息推薦部分前沿技術(shù)
823信息檢索與信息推薦領(lǐng)域的相關(guān)資源
83相關(guān)技術(shù)的產(chǎn)業(yè)應(yīng)用
831典型的應(yīng)用產(chǎn)品
832信息檢索技術(shù)的應(yīng)用情況
833信息推薦技術(shù)的應(yīng)用情況
84發(fā)展趨勢
參考文獻(xiàn)