Page 270 - 데이터과학 무엇을 하는가? 전자책
P. 270
Analysis)과 부분 최소 자승법(PLS, Partial Least Square)에 대해 이야기해 보
고자 한다.
주성분 분석
흔히 PCA(Principle Component Analysis)라고 명명되는 주성분 분석은
제조업 분야에서 변수들이 특히 많을 때 효과적으로 사용할 수 있는 방
법 중 하나이다. 여기서는 알고리즘을 공부하는 것이 주목적이 아니기
때문에 알고리즘에 대한 수식보다는 개념 위주로 설명하고자 한다.
주성분 분석은 원래 자료(데이터)가 가지고 있는 다수의 변수들로부터
그 변수들의 분산(변동)을 가장 잘 설명할 수 있는 소수의 새로운 변수를
찾아내는 분석 방법으로, 차원 축소를 통해 원래의 자료를 간단한 형태
로 축약하는 것이 목적이다. 쉽게 이야기하면 데이터에 있는 여러 개의
변수들을 가장 잘 설명할 수 있는 새로운 변수를 만드는 것이다.
다음 표는 4개의 변수를 가지고 있는 원래의 데이터를 주성분 분석을
통해 2개의 새로운 변수로 축약한 데이터 표이다.
주성분 분석 예시
본 데이터 주성분 데이터
정 정 시간 주성분1 주성분2
도 도 력 전
시간
268