Page 70 - 高中生活AI大智慧-電子書_Neat
P. 70
第二步:儲存數據
由於資料量龐大,突破儲存技術限制是大數據應用領域的第一個
難關。處理大數據時人們多使用分散式處理系統,透過分割資料與備
份儲存,突破記憶體過小的障礙。
第三步:運算數據
為達成預測未來的目的,計算機器可以透過分類、迴歸分析、排
序、關聯分析等方式找出其中規律,並運用決策樹、遺傳演算法、人
工神經網路等模型進行計算。
第四步:視覺化數據分析
經過分析後的數據仍是數字與列表,不易閱讀,因此可搭配視覺
化工具,將數據轉化為較容易閱讀與理解的形式。
最後,引用業界大數據應用公司 (LargitData) 推薦常用的工具,
給有需要的學習者參考:
1. 推薦大數據取得工具:Google Form 與 SurveyCake
除了 Amazon( Amazon.com, Inc. )、Facebook 等擁有大量使用
者而能快速累積資料的大企業,一般企業可以用統計軟體取得資料,
或請目標客群填寫問卷,持續累積資料量,推薦工具包括:Google
Form、SurveyCake 等,可以讓使用者免費製作線上問卷並提供簡單
的問卷結果統計與分析。
2. 推薦大數據儲存工具:Apache
Hadoop
目前最常見的大數據轉體技術為
Hadoop,是由 Apache 軟體基金會
使用 Java 語言發展的軟體框架,並
開放原始碼供人免費使用。
68