數(shù)據(jù)標(biāo)注工程——語言數(shù)據(jù)與結(jié)構(gòu)
定 價:68 元
- 作者:饒高琦
- 出版時間:2023/8/1
- ISBN:9787121459542
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP274
- 頁碼:216
- 紙張:
- 版次:01
- 開本:16開
本書是數(shù)據(jù)標(biāo)注領(lǐng)域領(lǐng)先的實訓(xùn)講義。本書著重對常見的文本、語音和圖像標(biāo)注任務(wù)類型進(jìn)行介紹,幫助從事標(biāo)注工作的學(xué)習(xí)者快速地完成系統(tǒng)化學(xué)習(xí),進(jìn)行標(biāo)注實戰(zhàn)。 本書對文本、語音及圖像標(biāo)注的多種任務(wù)類型逐一進(jìn)行講解和分析,每種標(biāo)注類型均配有對應(yīng)的規(guī)范、舉例分析、習(xí)題及解析。同時,本書還針對各類標(biāo)注配套多種子任務(wù)類型或多個領(lǐng)域的實操練習(xí)題,以幫助本書學(xué)習(xí)者增長見識,實現(xiàn)系統(tǒng)的、完整的學(xué)習(xí),培養(yǎng)實戰(zhàn)能力。
饒高琦,中國中文信息學(xué)會青年工作委員會委員、中國人工智能學(xué)會多語智能信息處理專委會宣傳委員、面向教育應(yīng)用的自然語言處理工作坊聯(lián)合主席。
目錄
第1章 語言和語言數(shù)據(jù) 001
1.1 自然語言 002
1.1.1 什么是自然語言 002
1.1.2 世界語言概況 005
1.2 語言智能 006
1.2.1 語言智能是什么 006
1.2.2 語言智能的常見任務(wù)和應(yīng)用 007
1.3 語言資源 013
1.3.1 什么是語言資源 013
1.3.2 為什么語言資源是語言智能的基礎(chǔ) 014
1.3.3 語言資源建設(shè)概況 015
第2章 語音和語音數(shù)據(jù) 017
2.1 語音和語音信息處理 018
2.1.1 語音合成 018
2.1.2 語音識別 019
2.2 語音的語言學(xué)結(jié)構(gòu) 019
2.2.1 語音的屬性 019
2.2.2 音節(jié)和音位 022
2.2.3 輔音和聲母 023
2.2.4 元音和韻母 024
2.3 語音的信息結(jié)構(gòu) 026
2.3.1 時域信息 027
2.3.2 頻域信息 028
第3章 漢字和文字?jǐn)?shù)據(jù) 030
3.1 漢字信息處理 031
3.2 漢字的結(jié)構(gòu) 032
3.2.1 漢字的演化 032
3.2.2 漢字的特點(diǎn) 034
3.3 漢字的信息化 036
3.3.1 字符編碼 036
3.3.2 漢字編碼 037
3.3.3 漢字的字符集 039
第4章 詞法和詞義 043
4.1 詞與詞處理 044
4.1.1 分詞 045
4.1.2 命名實體識別 046
4.1.3 詞性標(biāo)注 047
4.2 詞匯的結(jié)構(gòu) 048
4.2.1 詞匯的結(jié)構(gòu)單元 048
4.2.2 詞語的類型 052
4.2.3 特殊類型的詞 055
4.3 詞匯的語法功能:詞性 061
4.3.1 實詞 062
4.3.2 虛詞 070
4.4 詞匯的語義 075
4.4.1 詞義的構(gòu)成 075
4.4.2 詞義的聚合關(guān)系 080
4.4.3 詞典和詞語的釋義 084
4.5 詞語數(shù)據(jù)資源 087
4.5.1 漢語詞表資源 087
4.5.2 漢語詞典資源 091
4.5.3 其他重要漢語詞匯語義資源 105
第5章 句法和句義 109
5.1 句與句處理 110
5.1.1 句法分析 110
5.1.2 句義分析 111
5.2 句子的結(jié)構(gòu) 113
5.2.1 句法成分 113
5.2.2 句子的結(jié)構(gòu)類型 118
5.2.3 句子的特殊類型 123
5.2.4 句子的語氣類型 128
5.3 句法信息的表示形式 135
5.3.1 短語結(jié)構(gòu)文法 135
5.3.2 依存文法 139
5.4 句子的語義 141
5.4.1 句子的語義種類 141
5.4.2 句子的語義結(jié)構(gòu) 144
5.4.3 句子中的歧義 149
5.4.4 語義的表現(xiàn)形式:語義角色 153
5.4.5 語義的表現(xiàn)形式:語義依存 155
5.4.6 語義的表現(xiàn)形式:抽象語義表示 156
5.4.7 語義的表現(xiàn)形式:邏輯命題表示 160
5.5 句級數(shù)據(jù)資源 162
5.5.1 樹庫資源 162
5.5.2 句級語義資源 167
5.5.3 平行語料庫 167
第6章 篇章和篇章信息處理 169
6.1 對篇章的信息處理 169
6.1.1 文本分類 170
6.1.2 自動摘要 170
6.1.3 信息抽取 171
6.2 修辭和語體 171
6.2.1 修辭 171
6.2.2 語體和體裁 183
6.3 修辭結(jié)構(gòu)理論 190
6.3.1 修辭結(jié)構(gòu)理論起源 190
6.3.2 定義關(guān)系 191
6.3.3 認(rèn)知圖式 198
6.4 篇章的數(shù)據(jù)資源 200
6.4.1 修辭結(jié)構(gòu)篇章樹庫 200
6.4.2 文本分類 201
6.4.3 面向話題指稱結(jié)構(gòu)的語料庫資源 202
6.4.4 篇章意圖資源 203
6.4.5 漢語篇章廣義話題結(jié)構(gòu)資源 203
6.4.6 基于主述位理論的漢語微觀話題語料庫資源 204