Page 271 - 데이터과학 무엇을 하는가? 전자책
P. 271
물론 이 예시는 변수가 4개뿐이라 그 분석을 진행해도 큰 문제가 없
다. 하지만 원래의 데이터에 100개의 변수가 있다고 가정하면 얘기가 달
라진다. 이 100개의 변수를 주성분 분석 방법으로 축약할 수 있다면, 데
이터를 해석하거나 변수를 하나 선택해 각각을 분석했을 때는 찾기
들었던 의미나 이상치도 쉽게 찾을 수 있게 된다.
새롭게 생성되는 변수(주성분)들은 원본 데이터의 변수들로 만들어지
기 때문에, 주성분 분석을 통해 어 한 변수가 가장 큰 변동을 보이는지
도 확인할 수 있다. 따라서 주성분 분석은 제조업 분야에서 데이터 변수
가 무 많아 데이터 축약을 통한 해석이 필요할 때나 이상치 등을 제거
할 때 매우 유용한 분석 알고리즘이다. 또한 결과에 대한 변수(종속 변수)
없이 사용하기 때문에, 데이터 분석 초기에 데이터 현황 등을 파 할 때
사용하기에도 좋다.
본 데이터 형 주성분 분석 공간
주성분 분석
주성분 2 주성분 1
주성분 2
Z
주성분 1
Y X
부분 자 법
흔히 PLS(Partial Least Square)라고 불리는 부분 최소 자승법 역시 제조
업 데이터에 효과적으로 사용할 수 있는 알고리즘 중 하나이다. 주성분
269