Page 273 - 데이터과학 무엇을 하는가? 전자책
P. 273

다. 물론 부분 최소 자승법이 상관성 문제를 해결하는 유일한 방법은 아
                     니다. 하지만 결과 예측을 위한 회 식을 산출할 수 있는 좋은 방법 중 하

                     나이다.

                       부분 최소 자승법을 이용하면 결과식을 통해 결과 변수에 가장 크게

                     영향을 주는 변수를 확인할 수 있으며, 가장 영향력이 큰 변수들만 따로
                     모아 각각의 특성을 확인할 수도 있다. 요컨대 변수의 개수가 많고 변수

                     들 간에 상관성이 높은 제조업 데이터의 특성상 부분 최소 자승법은 꼭

                     회 식을 산출하는 목적이 아니더라도 여러 방식으로 유용하게 사용할

                     수 있는 알고리즘이다.
                       지금부터 소개할 제조업 데이터 분석 사례에서도 주성분 분석과 부분

                     최소 자승법을 사용하였다.이 두 알고리즘 외에 K-평균(K-Means)과 같은

                      집 분석법, 로지스  회  분석 등도 사용되었지만 주성분 분석과 부

                     분 최소 자승법 중심으로 간략히 살펴보고자 한다.





                               사례 1   당 1개의 제 을  산하는    공정
                             제    내기


                              번 로 소개할 사례는 불량 제품 진단 사례로, 전자 부품 제

                     조 업체에서 데이터 분석을 통해 생산 과정의 특정 단계에서 발생하는
                     불량을 진단해 내기 위한 분석이었다.









                                                                                 271
   268   269   270   271   272   273   274   275   276   277   278