Page 66 - 高中生活AI大智慧-電子書_Neat
P. 66
3-2 大數據 4V ― Volume、Variety、
Velocity、Veracity
有人說這個世界的秩序是由「大數據」信息所構成的,這個觀點
在未來應該會看到更多的論證,從工業革命開始到現今,許許多多的
數據累積成現今的經驗,或者對於解決未知事務的預判;從教育、工
商業到科學,這種影響無處不在,這個被科學家和計算機工程師創造
的新名詞,究竟是什麼呢?
大數據又稱巨量資料,指的是所涉及的數據資料量規模巨大到
無法通過人腦甚至主流軟體工具,在合理時間內達到擷取、管理、處
理、並整理成為幫助決策目的的資訊;而大數據技術則是指從各種各
樣類型的大數據中,快速獲得有價值信息的技術,這其中包括數據的
採集、存儲、管理、分析挖掘、可視化等技術之集成,例如我們使用
大規模資料庫、數據挖掘電網、分布式文件系統、分布式資料庫、雲
計算平臺、網際網路和可擴展的存儲系統等。
以下我們會用四個 V 來具體說明大數據的四個特徵:
1.Volume:數據量體巨大
大數據的數據集規模,一般約在 10TB 規模左右,但在實際應用
中,多把多個數據集放在一起,已經形成了 PB(Petabyte)級的數據
量【表 3-1】,不管是郵件發送、視頻上傳,還是人們每天線上搜尋
結果,乃至自動駕駛汽車每天的數據收集,我們會發現,網際網路時
代形成的數據量簡直多到不可思議,隨著物聯網基礎設施、智慧型手
機及可穿戴設備等科技產物的普及,我們每個人時刻都在產生大量的
64