知識(shí)圖譜已在多個(gè)領(lǐng)域深耕多年,然而,現(xiàn)有的典型知識(shí)圖譜主要是以實(shí)體及其屬性和關(guān)系為研究核心,缺乏對(duì)事理邏輯這一重要人類(lèi)知識(shí)的刻畫(huà)。為了彌補(bǔ)這一不足,事理圖譜應(yīng)運(yùn)而生,它能夠揭示事件的演化規(guī)律和發(fā)展邏輯,刻畫(huà)和記錄人類(lèi)行為活動(dòng)。事理圖譜是較為典型的多學(xué)科交叉領(lǐng)域,涉及知識(shí)工程、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、圖數(shù)據(jù)庫(kù)等多個(gè)領(lǐng)域。本書(shū)系統(tǒng)地介紹事理圖譜涉及的概念和關(guān)鍵技術(shù),如事理圖譜概述、事理知識(shí)表示、事件抽取、事件模式的自動(dòng)歸納、事件關(guān)系抽取、事件表示學(xué)習(xí)、事件泛化及事理歸納、事理知識(shí)存儲(chǔ)和檢索、基于事理圖譜的認(rèn)知推理與預(yù)測(cè)、基于事理圖譜的問(wèn)答與對(duì)話(huà)等。此外,本書(shū)還嘗試將學(xué)術(shù)前沿和實(shí)戰(zhàn)結(jié)合,讓讀者在掌握實(shí)際應(yīng)用能力的同時(shí)對(duì)前沿技術(shù)發(fā)展有所了解。本書(shū)主要面向高年級(jí)本科生和研究生,可以作為知識(shí)圖譜相關(guān)課程的教材,也可以作為對(duì)事理圖譜感興趣的讀者的入門(mén)讀物。
丁效,哈爾濱工業(yè)大學(xué)教授、博士生導(dǎo)師、社會(huì)計(jì)算與信息檢索研究中心副主任。主要研究方向?yàn)槿斯ぶ悄、自然語(yǔ)言處理、事理圖譜、因果推理。在TKDE、ACL、AAAI、IJCAI等人工智能領(lǐng)域的頂級(jí)國(guó)際期刊和會(huì)議上發(fā)表相關(guān)論文80余篇,承擔(dān)國(guó)家部委項(xiàng)目、科技部科技創(chuàng)新2030—“新一代人工智能”重大項(xiàng)目課題、國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目課題、面上項(xiàng)目、黑龍江省優(yōu)青項(xiàng)目等多項(xiàng)省部級(jí)以上項(xiàng)目。獲國(guó)家級(jí)教學(xué)成果二等獎(jiǎng),黑龍江省科學(xué)技術(shù)一等獎(jiǎng),黑龍江省科學(xué)技術(shù)二等獎(jiǎng),ACL 2024杰出論文獎(jiǎng),SemEval 2020國(guó)際語(yǔ)義評(píng)測(cè)“檢測(cè)反事實(shí)陳述”任務(wù)第一名,入選2022年AI 2000全球人工智能最具影響力學(xué)者、華為云AI名師獎(jiǎng)等,擔(dān)任中國(guó)中文信息學(xué)會(huì)社會(huì)媒體處理專(zhuān)委會(huì)秘書(shū)長(zhǎng)、黑龍江省中文信息處理重點(diǎn)實(shí)驗(yàn)室副主任等職務(wù)。劉挺,哈爾濱工業(yè)大學(xué)教授、博士生導(dǎo)師、副校長(zhǎng),國(guó)家高層次人才。工業(yè)和信息化部高新技術(shù)司“智能機(jī)器人”專(zhuān)家組專(zhuān)家、電子信息科學(xué)技術(shù)委員會(huì)信息服務(wù)組副組長(zhǎng),教育部人工智能科技創(chuàng)新專(zhuān)家組成員,國(guó)家人工智能產(chǎn)教融合創(chuàng)新平臺(tái)負(fù)責(zé)人,認(rèn)知智能與內(nèi)容安全教育部重點(diǎn)實(shí)驗(yàn)室主任,中文信息處理黑龍江省重點(diǎn)實(shí)驗(yàn)室主任,中國(guó)計(jì)算機(jī)學(xué)會(huì)會(huì)士,中國(guó)中文信息學(xué)會(huì)副理事長(zhǎng),黑龍江省“人工智能”頭雁團(tuán)隊(duì)帶頭人。曾主持國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目、國(guó)家973課題、基金重點(diǎn)項(xiàng)目。獲國(guó)家科技進(jìn)步二等獎(jiǎng)(排名第4)、黑龍江省科技進(jìn)步一等獎(jiǎng)(排名第1)。秦兵,哈爾濱工業(yè)大學(xué)教授、博士生導(dǎo)師、社會(huì)計(jì)算與信息檢索研究中心主任。國(guó)家重點(diǎn)研發(fā)課題、國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目負(fù)責(zé)人?萍疾靠萍紕(chuàng)新2030—“新一代人工智能”重大項(xiàng)目管理專(zhuān)家組專(zhuān)家,中國(guó)中文信息學(xué)會(huì)常務(wù)理事、語(yǔ)言與知識(shí)計(jì)算專(zhuān)委會(huì)副主任、情感計(jì)算專(zhuān)委會(huì)主任,黑龍江省計(jì)算機(jī)學(xué)會(huì)自然語(yǔ)言處理專(zhuān)委會(huì)主任。主持多項(xiàng)國(guó)家及省部級(jí)項(xiàng)目,獲中文信息學(xué)會(huì)錢(qián)偉長(zhǎng)中文信息處理科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)、黑龍江省科學(xué)技術(shù)一等獎(jiǎng)、黑龍江省科學(xué)技術(shù)二等獎(jiǎng)。入選“2020年度人工智能全球女性及AI 2000最具影響力學(xué)者榜單”和“福布斯中國(guó)2020科技女性榜”,連續(xù)四年(2020-2023)入選愛(ài)思唯爾高被引學(xué)者榜單。
第1章 事理圖譜概述 1
1.1 事理圖譜的基本概念 1
1.1.1 事理圖譜的定義 1
1.1.2 事理圖譜中事件的定義和表示 2
1.1.3 事理圖譜中的事件關(guān)系類(lèi)型 2
1.1.4 事理圖譜中的事件屬性 4
1.1.5 事理圖譜的形成過(guò)程 4
1.2 事理圖譜與知識(shí)圖譜的區(qū)別與聯(lián)系 5
1.3 事理圖譜的研究意義 7
1.4 國(guó)內(nèi)外典型的事件相關(guān)知識(shí)庫(kù)構(gòu)建項(xiàng)目 8
1.5 事理圖譜的相關(guān)技術(shù) 15
1.5.1 事理圖譜的構(gòu)建 15
1.5.2 事理圖譜的表示學(xué)習(xí) 16
1.6 事理圖譜的質(zhì)量評(píng)估 16
1.6.1 人工評(píng)估 16
1.6.2 自動(dòng)評(píng)估 17
1.7 事理圖譜的應(yīng)用價(jià)值 17
1.8 本章小結(jié) 19
參考文獻(xiàn) 19
第2章 事理知識(shí)表示 21
2.1 知識(shí)表示 21
2.2 經(jīng)典知識(shí)表示方法 23
2.2.1 一階謂詞邏輯 23
2.2.2 產(chǎn)生式規(guī)則 23
2.2.3 框架表示法 23
2.2.4 腳本 24
2.3 語(yǔ)義網(wǎng)中的知識(shí)表示方法 25
2.3.1 XML 26
2.3.2 RDF 28
2.3.3 RDFS 28
2.3.4 OWL 29
2.4 知識(shí)圖譜的知識(shí)表示方法 31
2.4.1 知識(shí)圖譜的圖表示 31
2.4.2 知識(shí)圖譜的分布式表示 32
2.5 事理圖譜的知識(shí)表示方法 36
2.5.1 事理圖譜的圖表示 36
2.5.2 事理圖譜的分布式表示 41
2.5.3 事理圖譜中的事理知識(shí)表示方法 43
2.6 本章小結(jié) 45
參考文獻(xiàn) 46
第3章 事件抽取 48
3.1 任務(wù)概述 48
3.1.1 任務(wù)定義 48
3.1.2 公開(kāi)評(píng)測(cè)和相關(guān)語(yǔ)料資源 50
3.1.3 評(píng)價(jià)方法 52
3.2 限定域事件抽取 53
3.2.1 基于模式匹配的方法 53
3.2.2 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法 57
3.2.3 基于深度學(xué)習(xí)的方法 61
3.3 開(kāi)放域事件抽取 66
3.4 文檔級(jí)事件抽取 69
3.5 自底向上的事件抽取系統(tǒng)介紹 72
3.6 本章小結(jié) 75
參考文獻(xiàn) 75
第4章 事件模式自動(dòng)歸納 79
4.1 任務(wù)概述 79
4.1.1 模板型事件模式自動(dòng)歸納任務(wù)概述 80
4.1.2 敘述型事件模式自動(dòng)歸納任務(wù)概述 84
4.2 事件模式自動(dòng)歸納方法 87
4.2.1 模板型事件模式自動(dòng)歸納方法 87
4.2.2 敘述型事件模式自動(dòng)歸納方法 89
4.3 相關(guān)任務(wù) 93
4.4 本章小結(jié) 96
參考文獻(xiàn) 96
第5章 事件關(guān)系抽取 100
5.1 事件因果關(guān)系抽取 100
5.1.1 任務(wù)語(yǔ)料與知識(shí)庫(kù) 101
5.1.2 顯式因果關(guān)系抽取 103
5.1.3 隱式因果關(guān)系抽取 106
5.2 事件時(shí)序關(guān)系抽取 107
5.2.1 任務(wù)概述 107
5.2.2 數(shù)據(jù)集簡(jiǎn)介 108
5.2.3 事件時(shí)序關(guān)系抽取方法 109
5.3 子事件關(guān)系抽取 113
5.3.1 任務(wù)概述 113
5.3.2 數(shù)據(jù)集簡(jiǎn)介 114
5.3.3 子事件關(guān)系抽取方法 114
5.4 事件共指關(guān)系抽取 117
5.4.1 任務(wù)概述 117
5.4.2 數(shù)據(jù)集簡(jiǎn)介 118
5.4.3 事件共指關(guān)系抽取方法 119
5.5 本章小結(jié) 121
參考文獻(xiàn) 121
第6章 事件表示學(xué)習(xí) 127
6.1 任務(wù)概述 127
6.1.1 任務(wù)難點(diǎn) 128
6.1.2 任務(wù)評(píng)價(jià) 129
6.2 事件的離散表示 130
6.3 結(jié)構(gòu)化事件的連續(xù)向量表示 132
6.3.1 事件元素的表示方法 133
6.3.2 組合事件元素獲取事件表示的方法 136
6.3.3 事件連續(xù)表示的學(xué)習(xí)方法 140
6.4 基于預(yù)訓(xùn)練語(yǔ)言模型的非結(jié)構(gòu)化事件向量表示方法 145
6.4.1 事件時(shí)間常識(shí)知識(shí)增強(qiáng)的預(yù)訓(xùn)練語(yǔ)言模型 146
6.4.2 動(dòng)詞語(yǔ)用知識(shí)增強(qiáng)的預(yù)訓(xùn)練語(yǔ)言模型 148
6.4.3 事件演化知識(shí)增強(qiáng)的預(yù)訓(xùn)練語(yǔ)言模型 149
6.5 本章小結(jié) 151
參考文獻(xiàn) 151
第7章 事件泛化及事理歸納 154
7.1 任務(wù)概述 154
7.2 主要方法 155
7.2.1 基于統(tǒng)計(jì)的事件泛化方法 155
7.2.2 基于規(guī)則的事件泛化方法 162
7.2.3 基于神經(jīng)網(wǎng)絡(luò)的事件泛化方法 170
7.2.4 自然邏輯與神經(jīng)網(wǎng)絡(luò)相結(jié)合的事件泛化方法 173
7.3 本章小結(jié) 175
參考文獻(xiàn) 175
第8章 事理知識(shí)存儲(chǔ)和檢索 177
8.1 事理圖譜的存儲(chǔ) 177
8.1.1 基于表結(jié)構(gòu)的存儲(chǔ) 177
8.1.2 基于圖結(jié)構(gòu)的存儲(chǔ) 180
8.2 事理圖譜的檢索 182
8.2.1 常見(jiàn)的形式化檢索語(yǔ)言 182
8.2.2 圖檢索技術(shù) 182
8.2.3 圖數(shù)據(jù)庫(kù)與關(guān)系數(shù)據(jù)庫(kù)的特點(diǎn) 183
8.2.4 Cypher查詢(xún)語(yǔ)言 185
8.3 Cypher語(yǔ)句實(shí)踐 185
8.3.1 Neo4j的安裝與使用 186
8.3.2 節(jié)點(diǎn)的創(chuàng)建與檢索 188
8.3.3 節(jié)點(diǎn)的刪除與更新 190
8.3.4 數(shù)據(jù)導(dǎo)入與圖譜導(dǎo)出 192
8.3.5 Neo4j的高級(jí)功能 194
8.4 其他圖數(shù)據(jù)庫(kù) 194
8.5 本章小結(jié) 195
參考文獻(xiàn) 196
第9章 基于事理圖譜的認(rèn)知推理 197
9.1 認(rèn)知系統(tǒng) 198
9.2 基于知識(shí)圖譜的認(rèn)知推理 199
9.3 基于事理圖譜的認(rèn)知推理 201
9.3.1 基于事理圖譜的If-Then類(lèi)型事件推理 202
9.3.2 基于事理圖譜的腳本類(lèi)事件預(yù)測(cè) 204
9.3.3 基于事理圖譜的因果事件推理 208
9.4 基于事理圖譜的文本預(yù)測(cè) 215
9.5 本章小結(jié) 216
參考文獻(xiàn) 217
第10章 基于事理圖譜的應(yīng)用 219
10.1 概述 220
10.2 基于事理知識(shí)的問(wèn)答 221
10.2.1 任務(wù)概述 221
10.2.2 基于事理知識(shí)的問(wèn)答方法 222
10.3 基于事理知識(shí)的對(duì)話(huà) 224
10.3.1 任務(wù)概述 224
10.3.2 基于事理知識(shí)的對(duì)話(huà)方法 227
10.4 基于事理知識(shí)的消費(fèi)意圖挖掘 235
10.4.1 任務(wù)概述 235
10.4.2 基于事理知識(shí)的消費(fèi)意圖挖掘方法 236
10.5 基于事理知識(shí)的股票市場(chǎng)預(yù)測(cè) 239
10.5.1 任務(wù)概述 239
10.5.2 基于事理知識(shí)的股票市場(chǎng)預(yù)測(cè)方法 240
10.6 大語(yǔ)言模型背景下的事理圖譜應(yīng)用 245
10.6.1 事理圖譜如何增強(qiáng)大語(yǔ)言模型應(yīng)用長(zhǎng)尾事理知識(shí)進(jìn)行推理 247
10.6.2 事理圖譜如何增強(qiáng)開(kāi)源大語(yǔ)言模型事理推理能力 248
10.7 本章小結(jié) 249
參考文獻(xiàn) 250