Page 68 - 高中生活AI大智慧-電子書_Neat
P. 68
3.Velocity:處理速度快
即使在數據量非常龐大的情況下,也能夠做到數據的即時處理,
這種數據處理遵循「1 秒定律」:即資料處理速度一般要在秒級時間
範圍內給出分析結果,時間太長就失去價值了。這個速度要求就是大
數據處理技術和傳統數據挖掘技術最大的區別。
以往數據處理一直受限於兩個方面:一個是以處理器為代表的硬
體限制,另一個是以數據庫為代表的軟體技術的限制。硬體限制就像
我們的高速公路出入站,從不同匝道蜂擁而來的車輛,卻只有一個出
入口通過,必然會帶來漫長的擁堵;而軟體限制涉及海量數據存儲技
術、即時數據處理、高性能存儲技術、檢索技術、挖掘與分析技術等,
數據經歷了若干階段才得以實現運算結果;不過由於軟、硬體以及演
算法的進步,即時處理已變得越來越容易。
4.Veracity:數據真實性存疑
當資料的來源變得更多元時,這些資料本身的可靠度及品質是
否經得起驗證?若資料本身就是有問題的,那分析後的結果也不會是
正確的,隨著社交數據、企業內容、交易與應用數據等新數據源的興
起,傳統數據源的局限被打破,確保數據真實性及安全性就顯得愈發
重要,如何確保這些資料數據真實性,和根據它們所做的分析是否可
信,成為大數據要面臨的一大挑戰。
66