本書共十二章。第一、二章回溯人類進化過程中交際方式的演變和語言通信設(shè)備的更替。第三章介紹搜索引擎技術(shù)。第四至七章首先概述自然語言處理的規(guī)則模型與統(tǒng)計模型,接著介紹語言知識庫,繼而探討語義計算的多層次建模。第八章講解語音識別與合成技術(shù)。第九章闡釋本體知識在語義網(wǎng)及知識圖譜中的應(yīng)用。第十、十一章介紹深度問答系統(tǒng)及文本分析技術(shù),聚焦?jié)h語文本內(nèi)容的深度計算。第十二章展望語言處理技術(shù)的未來發(fā)展。
大數(shù)據(jù)時代,網(wǎng)絡(luò)文本的爆炸式增長為自然語言處理帶來了巨大的應(yīng)用需求。運用深層次的語言學(xué)知識來處理自然語言的方法被稱為“語言的深度計算”。本書對語言深度計算的理論演進與技術(shù)發(fā)展進行了全面梳理,結(jié)合具體研究案例展示了這種涉及詞法、句法、語義等方面“由淺入深”的分析過程。
本書兼具學(xué)術(shù)性、前沿性和引領(lǐng)性,適合計算語言學(xué)、自然語言處理領(lǐng)域的研究者閱讀,也可供語言學(xué)、計算機科學(xué)技術(shù)和數(shù)據(jù)科學(xué)等領(lǐng)域的學(xué)者、教師和碩博研究生參考和借鑒。
隨著中國特色社會主義進入新時代,國家對外開放、信息技術(shù)發(fā)展、語言產(chǎn)業(yè)繁榮與教育領(lǐng)域改革等對我國外語教育發(fā)展和外語學(xué)科建設(shè)產(chǎn)生了深遠影響,也有力推動了我國外語學(xué)術(shù)出版事業(yè)的發(fā)展。為梳理學(xué)科發(fā)展脈絡(luò),展現(xiàn)前沿研究成果,外語教學(xué)與研究出版社匯聚國內(nèi)外語學(xué)界各相關(guān)領(lǐng)域?qū)<覍W(xué)者,精心策劃了“外語學(xué)科核心話題前沿研究文庫”(下文簡稱“文庫”)。
“文庫”精選語言學(xué)、應(yīng)用語言學(xué)、翻譯學(xué)、外國文學(xué)研究和跨文化研究五大方向共25個重要領(lǐng)域100余個核心話題,按一個話題一本書撰寫。每本書深入探討該話題在國內(nèi)外的研究脈絡(luò)、研究方法和前沿成果,精選經(jīng)典研究及原創(chuàng)研究案例,并對未來研究趨勢進行展望。“文庫”在整體上具有學(xué)術(shù)性、體系性、前沿性與引領(lǐng)性,力求做到點面結(jié)合、經(jīng)典與創(chuàng)新結(jié)合、國外與國內(nèi)結(jié)合,既有全面的宏觀視野,又有深入、細致的分析。
“文庫”項目邀請國內(nèi)外語學(xué)科各方向的眾多專家學(xué)者擔(dān)任總主編、子系列主編和作者,經(jīng)三年協(xié)力組織與精心寫作,自2018年底陸續(xù)推出!拔膸臁币勋@批“十三五”國家重點出版物出版規(guī)劃項目,作為一個開放性大型書系,將在未來數(shù)年內(nèi)持續(xù)出版。我們計劃對這套書目進行不定期修訂,使之成為外語學(xué)科的經(jīng)典著作。
袁毓林,1962年生,1990年獲北京大學(xué)博士學(xué)位。曾任北京大學(xué)中文系教授,博士生導(dǎo)師,現(xiàn)為澳門大學(xué)人文學(xué)院中國語言文學(xué)系講座教授。主要研究理論語言學(xué)和漢語語言學(xué),特別是句法學(xué)、語義學(xué)、語用學(xué)、計算語言學(xué)和中文信息處理。在《中國社會科學(xué)》、《中國語文》、《當代語言學(xué)》和《中文信息學(xué)報》等刊物發(fā)表論文100余篇,出版《語言的認知研究和計算分析》等10余部著作。多次獲得教育部“高?茖W(xué)研究優(yōu)秀成果獎”。
王璐璐,1983年生,2013年獲北京大學(xué)博士學(xué)位,F(xiàn)任中國傳媒大學(xué)人文學(xué)院副教授,碩士生導(dǎo)師。主要研究領(lǐng)域為漢語語法、形式句法、詞匯語義、計算語言學(xué)及中文信息處理。在《語言教學(xué)與研究》、《蘇州大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》、《計算機工程與應(yīng)用》等期刊和國際國內(nèi)會議論文集中發(fā)表論文近20篇,出版譯著《語法理論—從轉(zhuǎn)換語法到基于約束的理論》,主持國家社科基金項目“基于‘詞庫—構(gòu)式’互動理論的復(fù)雜述謂結(jié)構(gòu)自動分析研究”。
總序
前言
第一章 人類的進化和交際方式的演變
1.1 人類的進化
1.2 交際方式的演變
1.3 語言在人類發(fā)展中的作用
第二章 語言通信設(shè)備的更替和網(wǎng)絡(luò)的誕生
2.1 語言通信設(shè)備的更替
2.2 香農(nóng)的通信模型
2.3 網(wǎng)絡(luò)的誕生
2.4 社交網(wǎng)絡(luò)
第三章 網(wǎng)絡(luò)文本的信息爆炸和搜索引擎的發(fā)明
3.1 網(wǎng)絡(luò)文本的信息爆炸
3.2 信息檢索與搜索引擎
3.2.1 信息檢索的概念與類型
3.2.2 網(wǎng)絡(luò)搜索引擎的工作原理
3.3 搜索引擎技術(shù)
3.3.1 布爾檢索和倒排索引
3.3.2 超鏈接分析與網(wǎng)頁排序
3.4 基于關(guān)鍵詞匹配方法的局限性
3.5 基于語義和概念的搜索引擎技術(shù)
3.5.1 基于語義的擴充式關(guān)鍵詞搜索
3.5.2 基于本體知識推理的語義檢索
第四章 自然語言處理的規(guī)則模型和統(tǒng)計模型
4.1 自然語言處理技術(shù)概說
4.2 基于規(guī)則的自然語言處理
4.2.1 有限狀態(tài)自動機
4.2.2 上下文無關(guān)文法
4.2.3 基于上下文無關(guān)文法的剖析
4.3 基于統(tǒng)計的自然語言處理
4.3.1 基于概率的語言識別
4.3.2 基于統(tǒng)計的機器翻譯
第五章 語言信息處理和語言知識數(shù)據(jù)庫的建設(shè)
5.1 語料庫和語言知識庫概說
5.2 語言知識庫面面觀
5.2.1 詞匯網(wǎng)絡(luò)(WordNet)
5.2.2 句法樹庫(Treebank)
5.2.3 動詞網(wǎng)絡(luò)(verbNet)
5.2.4 命題庫(PropBank)
5.2.5 情境框架網(wǎng)絡(luò)(FrameNet)
5.3 相關(guān)資源的統(tǒng)一和整合
5.3.1 詞義消歧和義項歸組
5.3.2 義項與框架對接、框架與實例對勘
5.3.3 相關(guān)資源的義項映射和框架映射
5.3.4 實現(xiàn)相關(guān)資源的統(tǒng)一和整合
第六章 漢語句法語義知識庫的研究與建設(shè)
6.1 漢語詞類的模糊劃分與測試平臺
6.1.1 詞類的范疇性質(zhì)
6.1.2 詞類的模糊劃分和隸屬度分析
6.1.3 網(wǎng)絡(luò)版詞類測試平臺的設(shè)計及實現(xiàn)
6.2 北大實詞句法語義信息詞典與檢索系統(tǒng)
6.2.1 《形容詞信息詞典》的知識內(nèi)容
6.2.2 《動詞信息詞典》的知識內(nèi)容
6.2.3 《名詞信息詞典》的知識內(nèi)容
6.3 漢語動詞蘊涵關(guān)系和蘊涵型式庫建設(shè)
6.3.1 語言表達的多樣性與文本蘊涵
6.3.2 動詞蘊涵關(guān)系的理論背景與蘊涵型式庫建設(shè)的目標
6.3.3 蘊涵式的類聚規(guī)律與分類體系
6.3.4 漢語動詞蘊涵型式庫的體系結(jié)構(gòu)與功能模塊
第七章 語言信息處理和語義計算的多層次建模
7.1 理論背景:認知語言學(xué)研究的三種范式
7.2 基于認知的語義知識的描述和計算
……
第八章 語音的識別與合成和言語信息處理技術(shù)
第九章 語義網(wǎng)替代萬維網(wǎng)和本體知識與知識圖譜的建構(gòu)
第十章 深度問答系統(tǒng)和文本分析技術(shù)
第十一章 走向文本內(nèi)容的深度計算和自動理解
第十二章 語言處理技術(shù)的發(fā)展趨勢與未來議題
后記
參考文獻
推薦文獻
索引