Page 63 - 高中生活AI大智慧-電子書_Neat
P. 63

教材內容



               3-1 巨量資料與數據挖掘


                    大數據科學被視為人工智慧發展為關鍵的核心,在瞭解什麼是大
               數據之前,你更應該瞭解什麼是數據科學 (Data Science) ?


                    近年人工智慧研究興起,很多企業大學以及專業研究單位皆會
               使用「數據科學」這個用語,來綜括說明他們從事的工作內容或研究
               領域。例如使用已有或者開發新的數據挖掘技術 (Data Mining) ,以
               統計、數值方法做數據分析 (Data

               Analysis) 來鑽研數據的意涵等,根
               據數據科學家康威 ( Drew Conway)
               的論點, 數據科學需具備三個範
               疇的知識 :  數學與統計 (Math and

               Statistics Knowledge)、編程與電
               腦科學 (Hacking Skills)  以及實務
               知識 (Substantive Expertise)。

                    以往在沒有「 數據科學家 」

               這個新興職位前, 當一間證券、
                                                       (圖 3-1:康威(Drew Conway)提出數
               保險或者民調公司要招聘數據分                          據科學需要融合三個範疇的知識圖)
               析人員, 一般都會使用數據分析
               師 ( Data Analyst )、商業分析師 ( Business Analyst )、統計學家 (

               Statistician ) 或者電腦科學家 ( Computer Scientist ) 等職稱;傳統
               的數據分析人員通常只具備數學統計或電腦科學知識,很少有兩者兼
               備的人才,但這就造成了一個新問題:我們有學數學統計出身的分析
               師,他們很擅長利用各種分析技巧及統計學模型去解釋、演繹數據,

               但對如何有效整理大量多樣化數據卻毫無頭緒;另一方面,電腦科學







                                                                                           61
   58   59   60   61   62   63   64   65   66   67   68