Page 11 - SPARK Xpress Q4
P. 11
SPARK Xpress 2021 N0.04
AutoML 快速迭代 AutoML 打破傳統機器學習限制
加速AI策略發展及部署應用 解決 AI 人才荒
自動化機器學習 (AutoML) 全名為 Automated Machine Learning, 數位轉型浪潮下,AI 成為企業保持競爭力的重要關鍵,隨著新興
自 2014 年以來,為機器學習和深度學習領域最炙手可熱的領域之一。 技術的快速發展,企業面臨產學之間人才不足的鴻溝及大量資本投入
2017 年 5 月,Google Brain 研究人員為 AutoML 奠定了基礎,為了實 與效益短期難以平衡的兩難。在典型的機器學習開發應用過程中,從
現機器學習模型的設計自動化,採用了強化學習的方法讓 AI 系統學會自 資料清理,特徵提取、到模型訓練,需高度仰賴大量資料科學家高度
我提升能夠創造自己的 AI 系統,奠定基礎且創建 AutoML。 專業的技能組合,加上作業流程繁複耗費大量的時間及人力成本,若
專業領域人員若未具備足夠的經驗及分析能力,則難以在巨量數據中
自動化機器學習 AutoML 簡單來說,也就是將機器學習模型自動化,
找出關鍵特徵,發揮實質效益;AutoML 的出現突破了機器學習廣泛
縮短資料處理、開發部署等人工作業時程。AutoML 作為一個加速迭代
應用的限制,結合超級自動化和數據公民化兩大特點,將模型訓練的
的解決辦法,協助使用者 ( 如分析師、演算法開發人員或資料科學家等 ),
過程自動化執行,改善重複性任務效率,協助資料科學家專注於業務
快速提供初步的解決方案,並針對反饋結果重新收集數據、重製特徵因
分析、關鍵問題的釐清與解決。
子,更快進入下一輪的訓練或創建最佳模型進行金融場域的主題應用。
AutoML 為機器學習的數據公民化邁出第一步,過去資料科學家
機器學習模型的創建過程
需花費數小時從程式碼撰寫的工作內容,改透過 AutoML 的簡易拖曳
方式即可完成模型建置,平台視覺化設計,更大幅降低非 IT 人員學
痛點 1:
習門檻,也提升了跨團隊協作門檻與溝通效率;利用 AutoML 內建的
演算法訓練需要
時間和精力去來 演算法,自動化執行模型建制流程,
回嘗試,找到最
最終模型評估 大幅縮短 AI 模型開發時間,這項技
佳的參數組合
資料預處理 業務客戶數據
術的革新,讓資料科學家不再需要
耗費大量時間摸索巨量資料,並且
演算法選擇 能快速試驗專案可行性,激發多元
痛點 2:
因子特徵工程 創新的應用場景,提升企業營運效
最終模型生成和部
署往往斷開處理, 率增加獲利動能。
需要開發人員開發
模型上線部署 時間去做部署
圖 2:資料來源 數位數據暨科技發展部整理。
10 11