Page 15 - MFB22JudyOK
P. 15

成長率  (或報酬率),而  Tone  及  PN  指數經單根檢定後均拒絕虛無

                   假設,均為定態序列,因此不再做任何轉換。

                        而在探討經濟變數對於情緒指標是否具解釋及預測能力後,我們


                   嘗試檢視此情緒指標對於房屋地產相關變數是否具解釋及預測能
                   力,模型如下:


                                                m             p
                                           1 
                                  z i t        j x , i t j        q z  , i t q    t 1
                                                                              ,
                                                                     
                                    , 1
                                               j  0         q  0
                   其中  z 為第 i={全台,台北市,新北市,桃園市,台中市,台南市,高雄市}
                           i,t
                   個區域在  t  時間點房地產相關變數,z                          i,t+1  若為月頻率資料,則為下

                   一個月資料,若為季頻率資料,則為下一季資料;而在解釋變數中亦

                   包含落後期數的房地產相關變數  z                         i,t-q ,q={0,1,…p}, 主要是用於捕

                   捉可能產生的相關序列性質,自變數的落後期數之選取如前所述,選

                   取  0  至  3 期,且所有變數亦皆已轉換為定態的成長率  (或報酬率)

                   變數。



                   3.2.3 CART 與決策森林


                        迴歸樹  (classification and regression tree,以下簡稱  CART)  是決

                   策樹的一種,為常用的資料探勘技術。CART  與迴歸分析最大的不同

                   在於一個解釋變數可以在不同的切割階段被重複使用,並且可以應用

                   在間斷型的資料中以進行分類。在建立決策樹的過程中,CART  每次

                   都會利用  Gini  分類法來計算間斷型資料的不純度  (impurity),並依

                   此選擇分割條件。在每次的分割中會將資料分成兩個子集合,並再子

                   集合中尋找下一個分割條件。經由不斷將間斷型資料分割成兩個子集

                   合的方式來建構決策樹,直到無法再分割為止。而決策森林是集成學


                   習  (ensample learning)  的一種,主要是透過建立多個相互獨立的迴歸

                   樹,並將這些分類結果加以平均或以多數決準則為依據,來做為模型

                   最後的預測結果。也就是說,決策森林模型會依據隨機抽取出的樣本


                                                            13
   10   11   12   13   14   15   16   17   18   19   20