本書以語音情感為研究對象,以提高語音情感識別率為研究目標,針對在移動應用中語音的噪聲干擾問題、語音情感特征的相互干擾和冗余性問題、跨語種語音情感特征與情感識別網絡的局限性問題,分別提出將語音降噪與特征降維相結合、情感特征降維優(yōu)化、跨語種多模型融合框架等方法來提高計算機對語音情感的識別性能。
胡國華,男,1975年11月生,山西省五臺縣人,忻州師范學院計算機系副主任,碩士,副教授。近5年來,主持教育部產學合作協(xié)同育人項目3項,全國高等院校計算機基礎教育研究會計算機基礎教育教學研究項目1項,山西省高等學校教學改革創(chuàng)新項目1項,山西省藝術科學規(guī)劃課題1項,忻州市科技計劃項目1項,忻州師范學院教學改革創(chuàng)新項目1項;指導山西省高等學校大學生創(chuàng)新創(chuàng)業(yè)訓練項目2項;發(fā)表學術論文10余篇,其中El收錄4篇;榮獲忻州師范學院優(yōu)秀共產黨員、優(yōu)秀輔導員、師德師風先進個人等稱號。
第1章 緒論
1.1 研究背景與意義
1.2 國內外研究現(xiàn)狀
1.3 本書主要工作
1.4 本書內容組織結構
1.5 本章小結
第2章 語音情感識別的基本理論
2.1 語音的產生
2.2 情感描述模型
2.3 語音情感數據庫
2.4 語音情感識別系統(tǒng)組成
2.5 語音信號的預處理
2.6 語音情感特征提取
2.7 特征降維方法
2.8 語音情感識別網絡
2.9 本章小結
第3章 深度學習相關知識
3.1 深度學習的發(fā)展歷程
3.2 深度學習的基本理論
3.3 深度學習的常用神經網絡
3.4 本章小結
第4章 基于Chebyshev-PCA 優(yōu)化的移動應用語音情感識別
4.1 語音信號和噪聲信號的特征
4.2 傳統(tǒng)語音去噪方法概述
4.3 切比雪夫低通濾波器設計方法
4.4 主成分分析
4.5 Chebyshev-PCA優(yōu)化
4.6 實驗與分析
4.7 本章小結
第5章 基于PCA-GRA分析法的情感特征優(yōu)化
5.1 語音信號的特征分析
5.2 灰色關聯(lián)分析
5.3 PCA-GRA特征優(yōu)化
5.4 實驗與分析
5.5 本章小結
第6章 基于多輸入的跨語種語音情感識別的多模型融合框架
6.1 MobileNet
6.2 ResNet
6.3 語音情感識別的多模型融合框架
6.4 實驗與分析
6.5 本章小結
第7章 總結與展望
7.1 本書工作總結
7.2 研究展望
參考文獻