Page 7 - 論文-黃毓婷V3 MFB
P. 7

2.2  文字探勘與財金字典於金融領域之應用



                        文字探勘是指從大量非結構化文字資料中,透過自然語言處理或

                   統計方法,萃取出有價值資訊的過程。其目的是發掘文字中隱含的模

                   式、關聯或趨勢,進而支持決策或知識發現。隨著財經資料來源  (如

                   新聞、財報、社群平台)  日益豐富,該技術已成為金融研究中不可或

                   缺的一環。情緒分析是文字探勘中應用最為廣泛的技術之一,旨在量

                   化文字內容中的情緒傾向,進而轉化為投資判斷的依據。Tetlock (2007)

                   運用《華爾街日報》文本建立情緒指標,發現負面語調能有效預測未

                   來股價報酬,開啟以新聞文字作為市場資訊來源的研究潮流。隨


                   後  ,  Loughran  and  McDonald  (2011)  指          出  通  用  英  語  情  緒  字  典    (如

                   Harvard  IV)  在財經文本中常出現誤判問題,因此建構財經專用字

                   典  (簡稱  LM Dictionary),排除如  “liability”  等易誤判字詞,顯著提

                   升情緒分析的準確度與實用性。

                        另一方面,網路與社群平台亦提供大量可用於分析市場情緒的即

                   時 資 料 。 Antweiler  and  Frank  (2004)  分              析    Yahoo!  Finance  與

                   RagingBull  等網路討論區中的投資者留言,透過文字分類與統計方法


                   建立情緒指標,並探討其與股票報酬與市場波動性的關係。研究發

                   現,儘管留言對預測短期報酬的能力有限,但與市場成交量與波動性

                   呈  顯  著  正  相  關  ,  突  顯  網  路   言  論  作  為  情  緒  代  理  變  數  的  潛  力  。  Da  et

                   al.  (2011)  提出「搜尋量指標」  (search  volume  index,  SVI),利用

                   Google  搜尋趨勢作為投資者注意力與市場情緒的代理變數。研究指

                   出 , SVI  可有效預測資產報酬與交易量的變動,顯示網路活動亦可成

                   為具前瞻性的市場預測工具。Bollen et al. (2011)  運用  Twitter  資料建

                   構市場情緒指標,發現整體情緒變化可預測主要股市指數的波動。此

                   類即時性資料為情緒指標提供領先市場的潛力,儘管在資料清理與雜


                   訊處理方面仍面臨挑戰。Kearney and Liu (2014)  綜合整理情緒分析在

                   金融領域的應用,指出情緒資料可廣泛應用於投資組合配置、風險管

                                                            5
   2   3   4   5   6   7   8   9   10   11   12