Page 15 - MFB22JudyOK
P. 15
成長率 (或報酬率),而 Tone 及 PN 指數經單根檢定後均拒絕虛無
假設,均為定態序列,因此不再做任何轉換。
而在探討經濟變數對於情緒指標是否具解釋及預測能力後,我們
嘗試檢視此情緒指標對於房屋地產相關變數是否具解釋及預測能
力,模型如下:
m p
1
z i t j x , i t j q z , i t q t 1
,
, 1
j 0 q 0
其中 z 為第 i={全台,台北市,新北市,桃園市,台中市,台南市,高雄市}
i,t
個區域在 t 時間點房地產相關變數,z i,t+1 若為月頻率資料,則為下
一個月資料,若為季頻率資料,則為下一季資料;而在解釋變數中亦
包含落後期數的房地產相關變數 z i,t-q ,q={0,1,…p}, 主要是用於捕
捉可能產生的相關序列性質,自變數的落後期數之選取如前所述,選
取 0 至 3 期,且所有變數亦皆已轉換為定態的成長率 (或報酬率)
變數。
3.2.3 CART 與決策森林
迴歸樹 (classification and regression tree,以下簡稱 CART) 是決
策樹的一種,為常用的資料探勘技術。CART 與迴歸分析最大的不同
在於一個解釋變數可以在不同的切割階段被重複使用,並且可以應用
在間斷型的資料中以進行分類。在建立決策樹的過程中,CART 每次
都會利用 Gini 分類法來計算間斷型資料的不純度 (impurity),並依
此選擇分割條件。在每次的分割中會將資料分成兩個子集合,並再子
集合中尋找下一個分割條件。經由不斷將間斷型資料分割成兩個子集
合的方式來建構決策樹,直到無法再分割為止。而決策森林是集成學
習 (ensample learning) 的一種,主要是透過建立多個相互獨立的迴歸
樹,並將這些分類結果加以平均或以多數決準則為依據,來做為模型
最後的預測結果。也就是說,決策森林模型會依據隨機抽取出的樣本
13