Page 271 - 데이터과학 무엇을 하는가? 전자책
P. 271

물론 이 예시는 변수가 4개뿐이라 그  분석을 진행해도 큰 문제가 없
                     다. 하지만 원래의 데이터에 100개의 변수가 있다고 가정하면 얘기가 달

                     라진다. 이 100개의 변수를 주성분 분석 방법으로 축약할 수 있다면, 데

                     이터를 해석하거나 변수를 하나  선택해 각각을 분석했을 때는 찾기

                     들었던 의미나 이상치도 쉽게 찾을 수 있게 된다.
                       새롭게 생성되는 변수(주성분)들은 원본 데이터의 변수들로 만들어지

                     기 때문에, 주성분 분석을 통해 어 한 변수가 가장 큰 변동을 보이는지

                     도 확인할 수 있다. 따라서 주성분 분석은 제조업 분야에서 데이터 변수

                     가  무 많아 데이터 축약을 통한 해석이 필요할 때나 이상치 등을 제거
                     할 때 매우 유용한 분석 알고리즘이다. 또한 결과에 대한 변수(종속 변수)

                     없이 사용하기 때문에, 데이터 분석 초기에 데이터 현황 등을 파 할 때

                     사용하기에도 좋다.



                                 본 데이터 형                          주성분 분석 공간
                                                  주성분 분석
                           주성분 2           주성분 1
                                                           주성분 2
                      Z


                                                                    주성분 1

                         Y             X


                       부분    자 법

                       흔히 PLS(Partial Least Square)라고 불리는 부분 최소 자승법 역시 제조

                     업 데이터에 효과적으로 사용할 수 있는 알고리즘 중 하나이다. 주성분


                                                                                 269
   266   267   268   269   270   271   272   273   274   275   276