基于軟集合理論的預(yù)測(cè)性文本挖掘方法
定 價(jià):88 元
- 作者:楊道理,肖智著
- 出版時(shí)間:2022/6/1
- ISBN:9787550453227
- 出 版 社:西南財(cái)經(jīng)大學(xué)出版社
- 中圖法分類:TP274
- 頁碼:228
- 紙張:膠版紙
- 版次:1
- 開本:16開
近年來軟集合理論發(fā)展迅速。學(xué)者從基本概念和運(yùn)算、軟分析理論、軟概率理論、軟代數(shù)理論及軟拓?fù)涞确矫鎸?duì)軟集合基本理論進(jìn)行了擴(kuò)展,將這些理論進(jìn)展應(yīng)用于預(yù)測(cè)、文本處理、參數(shù)約簡與選擇以及決策等,并取得了豐富的成果。這些成果為構(gòu)建基于軟集合理論的預(yù)測(cè)性文本挖掘方法提供了理論基礎(chǔ)和借鑒。其中軟集合參數(shù)化集族的表示方式和不同軟集合之間關(guān)系研究為刻畫文本特征之間的非精確關(guān)系提供了新的思路,軟概率、軟條件概率、軟序列概率以及軟條件序列概率則為刻畫預(yù)測(cè)過程中的非精確現(xiàn)象、構(gòu)建預(yù)測(cè)方法提供了新的途徑。盡管如此,基于軟集合理論的預(yù)測(cè)方法尚不完善。
《基于軟集合理論的預(yù)測(cè)性文本挖掘方法》主要從四個(gè)方面探討了如何使用軟集合理論構(gòu)建預(yù)測(cè)性文本挖掘方法:針對(duì)特征間非精確關(guān)系的描述問題,使用近似軟集合、依賴度軟集合和不可分辨關(guān)系軟集合來刻畫特征選擇方法;針對(duì)預(yù)測(cè)性文本挖掘中預(yù)測(cè)因素和預(yù)測(cè)結(jié)果之間關(guān)系的非精確性,使用軟概率、軟條件概率以及軟依賴構(gòu)建模型;考慮預(yù)測(cè)過程中滯后效應(yīng)的影響,使用軟序列概率、軟序列條件概率以及軟序列依賴構(gòu)建了預(yù)測(cè)模型;更進(jìn)一步,考慮文本數(shù)據(jù)的粗糙性,使用粗糙隸屬函數(shù)構(gòu)建了粗糙軟依賴模型,把對(duì)粗糙的表示融入預(yù)測(cè)過程中。這些方面為軟集合理論在預(yù)測(cè)領(lǐng)域的發(fā)展提供了思路。
大數(shù)據(jù)時(shí)代,文本數(shù)據(jù)數(shù)量眾多并富含價(jià)值,文本挖掘越來越重要。例如,金融機(jī)構(gòu)通過文本挖掘研究新聞事件對(duì)股價(jià)的影響,醫(yī)學(xué)工作者通過文本挖掘研究電子病歷以提升診療效果,等等。預(yù)測(cè)性文本挖掘使用文本挖掘的理論和工具識(shí)別蘊(yùn)含于文本數(shù)據(jù)中的模式及規(guī)律,并將這些模式應(yīng)用于預(yù)測(cè),以幫助人們推知和判斷事物在未來的發(fā)展?fàn)顩r。然而,預(yù)測(cè)性文本挖掘的自然語言特征和非精確性等不確定性特征增加了規(guī)律識(shí)別和推知未來的難度。軟集合理論是處理不確定性的數(shù)學(xué)理論之一,為處理文本數(shù)據(jù)以及表示預(yù)測(cè)的非精確性提供了新的思路。它源于對(duì)近似描述問題的研究,以尋找近似解為構(gòu)建理念,使用參數(shù)化集族的方式描述問題,著眼于建立非精確模型解決問題,并得到相應(yīng)的近似解。從理論構(gòu)建理念、問題描述方式和解決路徑來看,軟集合理論適于作為預(yù)測(cè)性文本挖掘的基本理論。
近年來軟集合理論發(fā)展迅速。學(xué)者從基本概念和運(yùn)算、軟分析理論、軟概率理論、軟代數(shù)理論及軟拓?fù)涞确矫鎸?duì)軟集合基本理論進(jìn)行了擴(kuò)展,將這些理論進(jìn)展應(yīng)用于預(yù)測(cè)、文本處理、參數(shù)約簡與選擇以及決策等,并取得了豐富的成果。這些成果為構(gòu)建基于軟集合理論的預(yù)測(cè)性文本挖掘方法提供了理論基礎(chǔ)和借鑒。其中軟集合參數(shù)化集族的表示方式和不同軟集合之間關(guān)系研究為刻畫文本特征之間的非精確關(guān)系提供了新的思路,軟概率、軟條件概率、軟序列概率以及軟條件序列概率則為刻畫預(yù)測(cè)過程中的非精確現(xiàn)象、構(gòu)建預(yù)測(cè)方法提供了新的途徑。盡管如此,基于軟集合理論的預(yù)測(cè)方法尚不完善。
本書主要從四個(gè)方面探討了如何使用軟集合理論構(gòu)建預(yù)測(cè)性文本挖掘方法:針對(duì)特征間非精確關(guān)系的描述問題,使用近似軟集合、依賴度軟集合和不可分辨關(guān)系軟集合來刻畫特征選擇方法;針對(duì)預(yù)測(cè)性文本挖掘中預(yù)測(cè)因素和預(yù)測(cè)結(jié)果之間關(guān)系的非精確性,使用軟概率、軟條件概率以及軟依賴構(gòu)建模型;考慮預(yù)測(cè)過程中滯后效應(yīng)的影響,使用軟序列概率、軟序列條件概率以及軟序列依賴構(gòu)建了預(yù)測(cè)模型;更進(jìn)一步,考慮文本數(shù)據(jù)的粗糙性,使用粗糙隸屬函數(shù)構(gòu)建了粗糙軟依賴模型,把對(duì)粗糙的表示融入預(yù)測(cè)過程中。這些方面為軟集合理論在預(yù)測(cè)領(lǐng)域的發(fā)展提供了思路。
楊道理,男,畢業(yè)院校為重慶大學(xué)經(jīng)濟(jì)與工商學(xué)院,博士學(xué)歷,任職院校為重慶工商大學(xué)管理科學(xué)與工程學(xué)院,職稱講師,專業(yè)管理科學(xué)與工程,研究方向?yàn)殡娮由虅?wù)、文本挖掘及軟集合理論等。肖智,男,畢業(yè)院校重慶大學(xué),博士學(xué)歷,任職院校重慶大學(xué)經(jīng)濟(jì)與工商管理學(xué)院信息管理系,職稱教授,專業(yè)管理科學(xué)與工程,研究方向?yàn)檫\(yùn)籌學(xué)、統(tǒng)計(jì)學(xué)、預(yù)測(cè)與決策、數(shù)據(jù)模型與決策、金融風(fēng)險(xiǎn)與監(jiān)測(cè)、商務(wù)智能與數(shù)據(jù)挖掘等。
1 緒論 / 1 1研究背景及意義 / 1 1研究思路、 研究內(nèi)容與技術(shù)路線 / 7 1創(chuàng)新之處 / 12 2 相關(guān)基礎(chǔ)理論及研究現(xiàn)狀 / 15 2預(yù)測(cè)性文本挖掘的研究現(xiàn)狀 / 15 2本書應(yīng)用的相關(guān)理論 / 26 2軟集合理論及應(yīng)用研究現(xiàn)狀 / 29 2小結(jié) / 35 3 面向文本數(shù)據(jù)的軟集合特征選擇 / 37 3引言 / 37 3成對(duì)關(guān)系軟集合及相關(guān)理論 / 39 3面向文本數(shù)據(jù)的軟集合特征選擇方法 / 49 3算例分析 / 53 3與其他方法的比較 / 57 3小結(jié) / 63 4 面向文本數(shù)據(jù)的軟依賴預(yù)測(cè) / 65 4引言 / 65 4軟依賴及相關(guān)理論 / 68 4面向文本數(shù)據(jù)的軟依賴預(yù)測(cè)方法 / 73 4算例分析 / 922 4應(yīng)用分析 / 100 4小結(jié) / 109 5 面向文本數(shù)據(jù)的軟序列依賴預(yù)測(cè) / 111 5引言 / 111 5軟序列依賴及相關(guān)理論 / 113 5面向文本數(shù)據(jù)的軟序列依賴預(yù)測(cè)方法 / 118 5算例分析 / 129 5應(yīng)用分析 / 134 5小結(jié) / 141 6 面向文本數(shù)據(jù)的粗糙軟依賴預(yù)測(cè) / 143 6引言 / 143 6粗糙軟依賴及相關(guān)理論 / 145 6面向文本數(shù)據(jù)的粗糙軟依賴預(yù)測(cè)方法 / 147 6算例分析 / 156 6與其他方法的比較 / 162 6小結(jié) / 163 7 主要結(jié)論及下一步的研究方向 / 164 7主要結(jié)論 / 164 7下一步的研究方向 / 167 參考文獻(xiàn) / 168 附錄 / 184