Page 272 - 데이터과학 무엇을 하는가? 전자책
P. 272
분석에서는 새로운 주성분 변수를 찾고자 하였다면, 부분 최소 자승법에
서는 잠재 변수라고 부르는 설명 변수들의 조합을 통해 결과 변수에 영
향을 주는 요소를 찾을 수 있다.
부분 자 법 간단 예시
도
습도 수율
설명 변수 립 변수 재 변수 결과 변수 종속 변수
부분 최소 자승법을 사용하는 목적은 회 분석을 사용하는 목적과 비
슷하다. 그런데도 부분 최소 자승법이 제조업 데이터 분석에 유용하다고
이야기하는 이유는 다중 공선성(multicollinearity) 문제를 피할 수 있기 때
문이다. 제조업 데이터를 갖고 회 분석을 하면 변수 간의 상관성 문제
에 종종 부 히게 된다. 수십에서 수백 개에 이르는 변수를 사용할 때, 회
분석은 변수 간 상관성이 매우 높을 경우 제대로 계산을 못해 내는 문
제를 안고 있다. 따라서 알고리즘을 수행하기 전에 변수들 사이의 상관
성을 확인해야 하지만 변수가 아주 많을 경우 모든 변수를 완벽하게 확
인해 상관성을 제거하기란 쉽지 않다. 제조업 데이터의 경우 상관성을
가지고 있는 변수가 특히 많아서 더욱 어렵다. 그러나 부분 최소 자승법
을 사용하면 잠재 변수를 사용하기 때문에 상관성 문제를 피할 수가 있
270