Page 10 - SPARK Xpress Q4
P. 10

SPARK Xpress 2021 N0.04







               AutoML 快速迭代                                                                                                             AutoML 打破傳統機器學習限制


               加速AI策略發展及部署應用                                                                                                           解決 AI 人才荒




               自動化機器學習 (AutoML) 全名為 Automated Machine Learning,                                                                            數位轉型浪潮下,AI 成為企業保持競爭力的重要關鍵,隨著新興


           自 2014 年以來,為機器學習和深度學習領域最炙手可熱的領域之一。                                                                                      技術的快速發展,企業面臨產學之間人才不足的鴻溝及大量資本投入

           2017 年 5 月,Google Brain 研究人員為 AutoML 奠定了基礎,為了實                                                                          與效益短期難以平衡的兩難。在典型的機器學習開發應用過程中,從

           現機器學習模型的設計自動化,採用了強化學習的方法讓 AI 系統學會自                                                                                      資料清理,特徵提取、到模型訓練,需高度仰賴大量資料科學家高度

           我提升能夠創造自己的 AI 系統,奠定基礎且創建 AutoML。                                                                                        專業的技能組合,加上作業流程繁複耗費大量的時間及人力成本,若


                                                                                                                                   專業領域人員若未具備足夠的經驗及分析能力,則難以在巨量數據中
                   自動化機器學習 AutoML 簡單來說,也就是將機器學習模型自動化,
                                                                                                                                   找出關鍵特徵,發揮實質效益;AutoML 的出現突破了機器學習廣泛
           縮短資料處理、開發部署等人工作業時程。AutoML 作為一個加速迭代
                                                                                                                                   應用的限制,結合超級自動化和數據公民化兩大特點,將模型訓練的
           的解決辦法,協助使用者 ( 如分析師、演算法開發人員或資料科學家等 ),
                                                                                                                                   過程自動化執行,改善重複性任務效率,協助資料科學家專注於業務
           快速提供初步的解決方案,並針對反饋結果重新收集數據、重製特徵因

                                                                                                                                   分析、關鍵問題的釐清與解決。
           子,更快進入下一輪的訓練或創建最佳模型進行金融場域的主題應用。





                                                                                                                                          AutoML 為機器學習的數據公民化邁出第一步,過去資料科學家
               機器學習模型的創建過程
                                                                                                                                   需花費數小時從程式碼撰寫的工作內容,改透過 AutoML 的簡易拖曳

                                                                                                                                   方式即可完成模型建置,平台視覺化設計,更大幅降低非 IT 人員學
           痛點 1:
                                                                                                                                   習門檻,也提升了跨團隊協作門檻與溝通效率;利用 AutoML 內建的
           演算法訓練需要

           時間和精力去來                                                                                                                 演算法,自動化執行模型建制流程,
           回嘗試,找到最
                                                   最終模型評估                                                                          大幅縮短 AI 模型開發時間,這項技
           佳的參數組合
                                                                      資料預處理                   業務客戶數據
                                                                                                                                   術的革新,讓資料科學家不再需要

                                                                                                                                   耗費大量時間摸索巨量資料,並且

                                           演算法選擇                                                                                   能快速試驗專案可行性,激發多元
                                                                                            痛點 2:
                                                             因子特徵工程                                                                創新的應用場景,提升企業營運效
                                                                                            最終模型生成和部
                                                                                            署往往斷開處理,                               率增加獲利動能。
                                                                                            需要開發人員開發
            模型上線部署                                                                          時間去做部署



                                圖 2:資料來源 數位數據暨科技發展部整理。
    10                                                                                                                                                                                                                                   11
   5   6   7   8   9   10   11   12   13   14   15