Page 70 - 高中生活AI大智慧-電子書_Neat
P. 70

第二步:儲存數據
                  由於資料量龐大,突破儲存技術限制是大數據應用領域的第一個
             難關。處理大數據時人們多使用分散式處理系統,透過分割資料與備
             份儲存,突破記憶體過小的障礙。

             第三步:運算數據
                  為達成預測未來的目的,計算機器可以透過分類、迴歸分析、排
             序、關聯分析等方式找出其中規律,並運用決策樹、遺傳演算法、人
             工神經網路等模型進行計算。
             第四步:視覺化數據分析

                  經過分析後的數據仍是數字與列表,不易閱讀,因此可搭配視覺
             化工具,將數據轉化為較容易閱讀與理解的形式。


                  最後,引用業界大數據應用公司 (LargitData) 推薦常用的工具,
             給有需要的學習者參考:
             1. 推薦大數據取得工具:Google Form 與 SurveyCake
                  除了 Amazon( Amazon.com, Inc. )、Facebook 等擁有大量使用
             者而能快速累積資料的大企業,一般企業可以用統計軟體取得資料,
             或請目標客群填寫問卷,持續累積資料量,推薦工具包括:Google
             Form、SurveyCake 等,可以讓使用者免費製作線上問卷並提供簡單
             的問卷結果統計與分析。

             2. 推薦大數據儲存工具:Apache
             Hadoop
                  目前最常見的大數據轉體技術為
             Hadoop,是由 Apache 軟體基金會
             使用 Java 語言發展的軟體框架,並
             開放原始碼供人免費使用。






     68
   65   66   67   68   69   70   71   72   73   74   75