Page 66 - 高中生活AI大智慧-電子書_Neat
P. 66

3-2 大數據 4V ― Volume、Variety、
                       Velocity、Veracity



                  有人說這個世界的秩序是由「大數據」信息所構成的,這個觀點

             在未來應該會看到更多的論證,從工業革命開始到現今,許許多多的
             數據累積成現今的經驗,或者對於解決未知事務的預判;從教育、工
             商業到科學,這種影響無處不在,這個被科學家和計算機工程師創造
             的新名詞,究竟是什麼呢?


                  大數據又稱巨量資料,指的是所涉及的數據資料量規模巨大到
             無法通過人腦甚至主流軟體工具,在合理時間內達到擷取、管理、處
             理、並整理成為幫助決策目的的資訊;而大數據技術則是指從各種各
             樣類型的大數據中,快速獲得有價值信息的技術,這其中包括數據的

             採集、存儲、管理、分析挖掘、可視化等技術之集成,例如我們使用
             大規模資料庫、數據挖掘電網、分布式文件系統、分布式資料庫、雲
             計算平臺、網際網路和可擴展的存儲系統等。

                  以下我們會用四個 V 來具體說明大數據的四個特徵:





             1.Volume:數據量體巨大
                  大數據的數據集規模,一般約在 10TB 規模左右,但在實際應用

             中,多把多個數據集放在一起,已經形成了 PB(Petabyte)級的數據
             量【表 3-1】,不管是郵件發送、視頻上傳,還是人們每天線上搜尋
             結果,乃至自動駕駛汽車每天的數據收集,我們會發現,網際網路時
             代形成的數據量簡直多到不可思議,隨著物聯網基礎設施、智慧型手

             機及可穿戴設備等科技產物的普及,我們每個人時刻都在產生大量的






     64
   61   62   63   64   65   66   67   68   69   70   71