Page 7 - 論文-黃毓婷V3 MFB
P. 7
2.2 文字探勘與財金字典於金融領域之應用
文字探勘是指從大量非結構化文字資料中,透過自然語言處理或
統計方法,萃取出有價值資訊的過程。其目的是發掘文字中隱含的模
式、關聯或趨勢,進而支持決策或知識發現。隨著財經資料來源 (如
新聞、財報、社群平台) 日益豐富,該技術已成為金融研究中不可或
缺的一環。情緒分析是文字探勘中應用最為廣泛的技術之一,旨在量
化文字內容中的情緒傾向,進而轉化為投資判斷的依據。Tetlock (2007)
運用《華爾街日報》文本建立情緒指標,發現負面語調能有效預測未
來股價報酬,開啟以新聞文字作為市場資訊來源的研究潮流。隨
後 , Loughran and McDonald (2011) 指 出 通 用 英 語 情 緒 字 典 (如
Harvard IV) 在財經文本中常出現誤判問題,因此建構財經專用字
典 (簡稱 LM Dictionary),排除如 “liability” 等易誤判字詞,顯著提
升情緒分析的準確度與實用性。
另一方面,網路與社群平台亦提供大量可用於分析市場情緒的即
時 資 料 。 Antweiler and Frank (2004) 分 析 Yahoo! Finance 與
RagingBull 等網路討論區中的投資者留言,透過文字分類與統計方法
建立情緒指標,並探討其與股票報酬與市場波動性的關係。研究發
現,儘管留言對預測短期報酬的能力有限,但與市場成交量與波動性
呈 顯 著 正 相 關 , 突 顯 網 路 言 論 作 為 情 緒 代 理 變 數 的 潛 力 。 Da et
al. (2011) 提出「搜尋量指標」 (search volume index, SVI),利用
Google 搜尋趨勢作為投資者注意力與市場情緒的代理變數。研究指
出 , SVI 可有效預測資產報酬與交易量的變動,顯示網路活動亦可成
為具前瞻性的市場預測工具。Bollen et al. (2011) 運用 Twitter 資料建
構市場情緒指標,發現整體情緒變化可預測主要股市指數的波動。此
類即時性資料為情緒指標提供領先市場的潛力,儘管在資料清理與雜
訊處理方面仍面臨挑戰。Kearney and Liu (2014) 綜合整理情緒分析在
金融領域的應用,指出情緒資料可廣泛應用於投資組合配置、風險管
5