關于我們
書單推薦
新書推薦
|
基于雙耳線索的移動音頻編碼研究
飛速發(fā)展的移動市場對高品質(zhì)音頻業(yè)務的需求日 益迫切,移動 環(huán)境下音頻帶寬不足,終端資源有限,傳統(tǒng)音頻理論 和技術面臨新 的挑戰(zhàn)。近年來,MPEG、ITU和AVS等國內(nèi)外標準化組 織積極推 動移動音頻理論和技術研究;陔p耳線索的音頻編 碼因其在低碼 率下的音質(zhì)優(yōu)勢而備受關注,然而,為適應移動環(huán)境 苛刻的應用需 求,仍需克服空間參數(shù)模型的理論缺陷,突破實變換 域雙耳線索表 示的技術瓶頸,解決空間參數(shù)碼率難以下降、系統(tǒng)復 雜度偏高等問 題。陳水仙編著的這本《基于雙耳線索的移動音頻編 碼研究》開展基于雙耳線索的移動音頻編碼研究,在 雙耳線索感知 機理分析、空間感知信息度量、MDCT域雙耳線索表示 和空間音頻 編碼系統(tǒng)結構設計這四個方向上取得了創(chuàng)新性成果。
在雙耳線索感知機理分析方向,《基于雙耳線索 的移動音頻編碼研究》針對現(xiàn)有系統(tǒng)只能去除聲 道間數(shù)據(jù)客觀冗余的不足,以巴克頻帶為感知分析單 元,開展了對 雙耳線索臨界感知JND的分析研究,提出基于感知的 雙耳線索參 數(shù)表示模型,有效去除了聲道問數(shù)據(jù)的主觀冗余信息 ,下降 4.28%~11.78%的空間參數(shù)碼率,主觀測試MUSHRA 得分平均提 高2.6分,客觀測試ODG得分平均提高1.1分。 在空間感知信息度量方向,本書針對建立在單耳 聽音模型上的 感知熵理論無法度量雙耳空間感知信息量的問題,結 合雙耳線索的 感知機理,建立了基于雙耳線索生理感知的BCPPM模 型來模擬雙 耳對空間信息的感知過程,提出基于模型的空間感知 熵SPE的計 算方法,解決了雙耳空間感知信息量的度量問題,豐 富和發(fā)展了空 間音頻編碼技術的理論和實踐。 在MDCT域雙耳線索表示方向,本書針對MDCT實變 換的相 位信息缺失及能量抖動造成雙耳線索表示不準確的問 題,采用基函 數(shù)“和分離”技術,提出了基于共軛窗函數(shù)的MDCT頻 譜復數(shù)化擴 展方法,并針對新方法引入MDST帶來復雜度增加的問 題,提出了 基于轉(zhuǎn)換矩陣稀疏性的MDCT-MDST快速轉(zhuǎn)換算法,同 時利用轉(zhuǎn)換 矩陣的正交性和循環(huán)性,將復雜度從O(N*2)下降到O (N),主觀測 試MUSHRA得分平均提高2.07分,客觀ODG得分平均提 高 0.4281分。 在空間音頻編碼系統(tǒng)結構設計方向,本書針對空 間信息和下混 信息分離處理模式導致的系統(tǒng)復雜度高和延時長的問 題,采用濾波 復用和并行處理的技術,提出并行濾波共享的分析綜 合ABS編碼 結構,去除了空間參數(shù)編碼與下混聲道編碼中的冗余 操作,縮短了 5%的系統(tǒng)延時,減少了38%~86%的運算復雜度。 本書在基礎理論和關鍵技術方面的研究成果可望 成為國內(nèi)移動音頻標準的支撐技術,增強我國在高速 成長的全球移動音頻產(chǎn)業(yè)中 的核心競爭力,為全面參與移動音頻編解碼領域的國 際競爭和標準 化工作奠定堅實的研究基礎。
你還可能感興趣
我要評論
|