Page 63 - 高中生活AI大智慧-電子書_Neat
P. 63
教材內容
3-1 巨量資料與數據挖掘
大數據科學被視為人工智慧發展為關鍵的核心,在瞭解什麼是大
數據之前,你更應該瞭解什麼是數據科學 (Data Science) ?
近年人工智慧研究興起,很多企業大學以及專業研究單位皆會
使用「數據科學」這個用語,來綜括說明他們從事的工作內容或研究
領域。例如使用已有或者開發新的數據挖掘技術 (Data Mining) ,以
統計、數值方法做數據分析 (Data
Analysis) 來鑽研數據的意涵等,根
據數據科學家康威 ( Drew Conway)
的論點, 數據科學需具備三個範
疇的知識 : 數學與統計 (Math and
Statistics Knowledge)、編程與電
腦科學 (Hacking Skills) 以及實務
知識 (Substantive Expertise)。
以往在沒有「 數據科學家 」
這個新興職位前, 當一間證券、
(圖 3-1:康威(Drew Conway)提出數
保險或者民調公司要招聘數據分 據科學需要融合三個範疇的知識圖)
析人員, 一般都會使用數據分析
師 ( Data Analyst )、商業分析師 ( Business Analyst )、統計學家 (
Statistician ) 或者電腦科學家 ( Computer Scientist ) 等職稱;傳統
的數據分析人員通常只具備數學統計或電腦科學知識,很少有兩者兼
備的人才,但這就造成了一個新問題:我們有學數學統計出身的分析
師,他們很擅長利用各種分析技巧及統計學模型去解釋、演繹數據,
但對如何有效整理大量多樣化數據卻毫無頭緒;另一方面,電腦科學
61