在金融領(lǐng)域中,時間序列是非常重要的一種數(shù)據(jù)類型,例如證券市場中的股票價格和交易量、外匯市場上的匯率、期貨和黃金的交易價格等,這些數(shù)據(jù)都形成了持續(xù)不斷的時間序列。金融市場中的時間序列主要使用基礎(chǔ)分析和技術(shù)分析方法進(jìn)行分析,這兩種方法使用簡單,但是無法對數(shù)據(jù)中隱含的更深層次的規(guī)律和特征進(jìn)行挖掘。數(shù)理統(tǒng)計分析方法是目前金融時間序列分析中比較常用的方法,隨著數(shù)據(jù)量的不斷增加,這種方法的分析能力存在一定的缺陷,各種數(shù)理統(tǒng)計分析方法都無法有效地處理較大規(guī)模的數(shù)據(jù)集,也不適合從大量數(shù)據(jù)中主動地發(fā)現(xiàn)各種潛在的規(guī)則。因此面對金融行業(yè)不斷涌現(xiàn)的海量數(shù)據(jù),需要尋找新的數(shù)據(jù)分析和挖掘的方法。
《金融時間序列的分析與挖掘》將數(shù)據(jù)挖掘技術(shù)運(yùn)用到金融時間序列研究中,使用關(guān)聯(lián)規(guī)則、聚類分析等數(shù)據(jù)挖掘方法對金融時間序列中的隱含模式進(jìn)行挖掘,本文的創(chuàng)新點(diǎn)主要基于以下幾個方面:
。1)針對金融時間序列需要保留形態(tài)特征與趨勢特征的特點(diǎn),提出了適合金融時間序列的多層次極值點(diǎn)分段表示法(MEPS),此方法能在多個層次上很大限度地保留關(guān)鍵特征點(diǎn)信息,從而能更好地捕捉和表示時間序列的形態(tài)和走勢。
。2)針對金融時間序列需要保留形態(tài)特征與趨勢特征的特點(diǎn),在MEPS算法的基礎(chǔ)上提出了分層的動態(tài)時間彎曲相似性度量方法(HDTW)及其改進(jìn)方法IHDTW,將時間序列在不同層次上進(jìn)行分段,然后計算對應(yīng)分段層次中子序列間的相似性,最后匯總得到序列間的相似度,在算法中對動態(tài)時間彎曲算法(DTW)進(jìn)行了改進(jìn),并且考慮到了分層的均勻因素及趨勢因素,實(shí)驗(yàn)結(jié)果證明能大大提高相似性度量的效果和效率。
(3)金融市場的運(yùn)行非常復(fù)雜,其中人的因素也非常重要,為了在金融時間序列挖掘的過程中更好地體現(xiàn)用戶的實(shí)際需求,提出了基于事件的時間序列相似性度量方法(SMBE),此算法通過對事件的定義引入用戶在相似性度量時的偏好與需求,并設(shè)計了基于SMBE的層次聚類算法,完全以事件的相似性為中心進(jìn)行聚類,定義了類間相似度和類間一般距離兩個參數(shù),并以它們之間的比較作為判斷類間距離的依據(jù),使得時間序列相似性度量及其聚類的結(jié)果更加符合實(shí)際金融市場的狀態(tài)與需求。
在金融領(lǐng)域中,時間序列是非常重要的一種數(shù)據(jù)類型,例如證券市場中的股票價格和交易量、外匯市場上的匯率、期貨和黃金的交易價格等,這些數(shù)據(jù)都形成了持續(xù)不斷的時間序列。金融市場中的時間序列主要使用基礎(chǔ)分析和技術(shù)分析方法進(jìn)行分析,這兩種方法使用簡單,但是無法對數(shù)據(jù)中隱含的更深層次的規(guī)律和特征進(jìn)行挖掘。數(shù)理統(tǒng)計分析方法是目前金融時間序列分析中比較常用的方法,隨著數(shù)據(jù)量的不斷增加,這種方法的分析能力存在一定的缺陷,各種數(shù)理統(tǒng)計分析方法都無法有效地處理較大規(guī)模的數(shù)據(jù)集,也不適合從大量數(shù)據(jù)中主動地發(fā)現(xiàn)各種潛在的規(guī)則。因此面對金融行業(yè)不斷涌現(xiàn)的海量數(shù)據(jù),需要尋找新的數(shù)據(jù)分析和挖掘的方法。本書將數(shù)據(jù)挖掘技術(shù)運(yùn)用到金融時間序列研究中,使用關(guān)聯(lián)規(guī)則、聚類分析等數(shù)據(jù)挖掘方法對金融時間序列中的隱含模式進(jìn)行挖掘,本文的創(chuàng)新點(diǎn)主要基于以下幾個方面:
。1)針對金融時間序列需要保留形態(tài)特征與趨勢特征的特點(diǎn),提出了適合金融時間序列的多層次極值點(diǎn)分段表示法(MEPS),此方法能在多個層次上最大限度地保留關(guān)鍵特征點(diǎn)信息,從而能更好地捕捉和表示時間序列的形態(tài)和走勢。
(2)針對金融時間序列需要保留形態(tài)特征與趨勢特征的特點(diǎn),在MEPS算法的基礎(chǔ)上提出了分層的動態(tài)時間彎曲相似性度量方法(HDTW)及其改進(jìn)方法IHDTW,將時間序列在不同層次上進(jìn)行分段,然后計算對應(yīng)分段層次中子序列間的相似性,最后匯總得到序列間的相似度,在算法中對動態(tài)時間彎曲算法(DTW)進(jìn)行了改進(jìn),并且考慮到了分層的均勻因素及趨勢因素,實(shí)驗(yàn)結(jié)果證明能大大提高相似性度量的效果和效率。
。3)金融市場的運(yùn)行非常復(fù)雜,其中人的因素也非常重要,為了在金融時間序列挖掘的過程中更好地體現(xiàn)用戶的實(shí)際需求,提出了基于事件的時間序列相似性度量方法(SMBE),此算法通過對事件的定義引入用戶在相似性度量時的偏好與需求,并設(shè)計了基于SMBE的層次聚類算法,完全以事件的相似性為中心進(jìn)行聚類,定義了類間相似度和類間一般距離兩個參數(shù),并以它們之間的比較作為判斷類間距離的依據(jù),使得時間序列相似性度量及其聚類的結(jié)果更加符合實(shí)際金融市場的狀態(tài)與需求。
第一章 引言
第一節(jié) 金融市場信息化的發(fā)展
第二節(jié) 金融市場的傳統(tǒng)分析方法
一、基礎(chǔ)分析與技術(shù)分析
二、數(shù)理統(tǒng)計分析
第三節(jié) 數(shù)據(jù)挖掘技術(shù)的興起與發(fā)展
第四節(jié) 本書的研究目的與內(nèi)容
一、本書的研究對象
二、本書的研究內(nèi)容
第二章 時間序列數(shù)據(jù)挖掘研究及其應(yīng)用
第一節(jié) 時間序列的分段與表示
一、基于時域的分段與表示
二、基于變換域的分段與表示
三、其他方法
第二節(jié) 時間序列的相似性度量
一、歐式距離
二、動態(tài)時間彎曲距離
三、其他方法
第三節(jié) 時間序列的關(guān)聯(lián)規(guī)則挖掘
一、關(guān)聯(lián)分析概述
二、時態(tài)關(guān)聯(lián)規(guī)則挖掘
三、動態(tài)關(guān)聯(lián)規(guī)則挖掘
第四節(jié) 時間序列的聚類分析
一、時間序列的模式發(fā)現(xiàn)與聚類
二、數(shù)據(jù)流聚類
第五節(jié) 時間序列挖掘在金融行業(yè)的應(yīng)用
第三章 金融時間序列的分段與表示
第一節(jié) 時間序列的分段與表示方法
第二節(jié) 金融時間序列的特性
第三節(jié) 基于重要極值點(diǎn)特征的分段表示法
一、絕對極值點(diǎn)分段表示法
二、均勻極值點(diǎn)分段表示法
三、多層次極值點(diǎn)分段表示法
四、距離的度量
第四節(jié) 三種極值點(diǎn)分段法的實(shí)驗(yàn)對比與分析
一、實(shí)驗(yàn)對比方案與框架
二、實(shí)驗(yàn)結(jié)果分析與評價
第五節(jié) 本章小結(jié)
第四章 金融時間序列的相似性度量
第一節(jié) 時間序列的相似性度量方法
一、歐式距離
二、動態(tài)時間彎曲距離
三、最長公共子串
第二節(jié) 分層的動態(tài)時間彎曲相似性度量方法
一、分層動態(tài)時間彎曲相似性度量(HDTW)算法的主要思想
二、分層動態(tài)時間彎曲相似性度量(HDTW)算法的具體描述
三、DTW算法與HDTW算法的實(shí)驗(yàn)對比與分析
第三節(jié) 改進(jìn)的分層動態(tài)時間彎曲相似性度量方法
一、對HDTW算法改進(jìn)的主要思想
二、對HTDW算法的具體改進(jìn)方法
三、改進(jìn)的HTDW算法(IHDTW)的具體描述
四、HTDW算法與IHDTW算法的實(shí)驗(yàn)對比與分析
第四節(jié) 基于事件的時間序列相似性度量方法
一、相關(guān)定義
二、基于事件的時間序列相似性度量(SMBE)算法的具體描述
三、DTW算法與SMBE算法的實(shí)驗(yàn)對比與分析
第五節(jié) 本章小結(jié)
第五章 金融時間序列的關(guān)聯(lián)規(guī)則分析
第一節(jié) 關(guān)聯(lián)規(guī)則的基本知識
一、關(guān)聯(lián)規(guī)則的基本概念
二、時間序列關(guān)聯(lián)規(guī)則分析
三、關(guān)聯(lián)規(guī)則的方法
第二節(jié) 基于0-Aproiri算法的多元時間序列跨事務(wù)關(guān)聯(lián)規(guī)則挖掘
一、0-Apriori算法的相關(guān)定義與具體描述
二、基于可變支持度的0-Apriori算法
三、0-Apriori算法在時間序列跨事務(wù)關(guān)聯(lián)分析中的應(yīng)用
四、0-Apriori算法與VSO-Apriori算法的實(shí)驗(yàn)對比與分析
第三節(jié) 基于滑動挖掘區(qū)間的動態(tài)關(guān)聯(lián)規(guī)則挖掘算法
一、算法的主要思想與具體描述
二、在多元時間序列關(guān)聯(lián)分析中的應(yīng)用
三、SI-DARM算法和DSAT算法的實(shí)驗(yàn)對比與分析
第四節(jié) 本章小結(jié)
第六章 金融時間序列的聚類分析
第一節(jié) 聚類方法介紹
一、K均值聚類算法
二、層次聚類算法
三、基于SNN密度的聚類
第二節(jié) 基于改進(jìn)的分層動態(tài)時間彎曲技術(shù)的聚類
一、基于IHDTW的聚類算法的主要思想
二、基于IHDTW的聚類算法的具體描述
三、基于IHDTW的聚類算法的實(shí)驗(yàn)分析與評價
第三節(jié) 基于事件相似性度量的層次聚類
一、基于SMBE的層次聚類算法的具體描述
二、基于SMBE的層次聚類算法的實(shí)驗(yàn)分析與評價
第四節(jié) 基于形態(tài)特征的數(shù)據(jù)流聚類
一、基于形態(tài)特征的數(shù)據(jù)流聚類算法的主要思想
二、初始化階段
三、在線更新階段
四、用戶觸發(fā)的聚類
五、實(shí)驗(yàn)分析與評價
第五節(jié) 本章小結(jié)
第七章 金融股票時間序列的預(yù)測
第一節(jié) 預(yù)測算法描述
一、股票時間序列的價格區(qū)間預(yù)測
二、股票時間序列的短期趨勢預(yù)測
第二節(jié) 股票時間序列的預(yù)測實(shí)例
一、股票數(shù)據(jù)集
二、股票時間序列價格的預(yù)測
三、股票時間序列短期趨勢的預(yù)測
第三節(jié) 股票時間序列的預(yù)測效果評價
第四節(jié) 本章小結(jié)
第八章 結(jié)論
參考文獻(xiàn)
附錄