Page 272 - 데이터과학 무엇을 하는가? 전자책
P. 272

분석에서는 새로운 주성분 변수를 찾고자 하였다면, 부분 최소 자승법에
                   서는 잠재 변수라고 부르는 설명 변수들의 조합을 통해 결과 변수에 영

                   향을 주는 요소를 찾을 수 있다.



                   부분    자 법 간단 예시

                           도



                          습도                                 수율




                      설명 변수  립 변수           재 변수           결과 변수 종속 변수



                     부분 최소 자승법을 사용하는 목적은 회  분석을 사용하는 목적과 비

                   슷하다. 그런데도 부분 최소 자승법이 제조업 데이터 분석에 유용하다고
                   이야기하는 이유는 다중 공선성(multicollinearity) 문제를 피할 수 있기 때

                   문이다. 제조업 데이터를 갖고 회  분석을 하면 변수 간의 상관성 문제

                   에 종종 부 히게 된다. 수십에서 수백 개에 이르는 변수를 사용할 때, 회

                     분석은 변수 간 상관성이 매우 높을 경우 제대로 계산을 못해 내는 문
                   제를 안고 있다. 따라서 알고리즘을 수행하기 전에 변수들 사이의 상관

                   성을 확인해야 하지만 변수가 아주 많을 경우 모든 변수를 완벽하게 확

                   인해 상관성을 제거하기란 쉽지 않다. 제조업 데이터의 경우 상관성을

                   가지고 있는 변수가 특히 많아서 더욱 어렵다. 그러나 부분 최소 자승법
                   을 사용하면 잠재 변수를 사용하기 때문에 상관성 문제를 피할 수가 있



               270
   267   268   269   270   271   272   273   274   275   276   277