Page 283 - 데이터과학 무엇을 하는가? 전자책
P. 283

분석 과정
                       이번 사례에서도 분석은 파일 형태로 전달받아 진행되었다. 최초 분석

                     은 1시간 단위로 추출된 장비 데이터를 이용해 분석 작업을 했다. 하지만

                     고장 발생의 특이 사항이 한 시간 전에 나타날지 10분 전에 나타날지는

                     아무도 알 수 없는 일이기에  더 작은 간격의 데이터를 요청했고, 10분
                     간격의 장비 데이터를 받아 다시 분석을 진행했다. 분석 방향은 다음과

                     같았다.






                        1)    은 변수 이 존재하기에, 변수에 대한 전처리를 생산 엔지니어와 함  진행
                          한다.
                        2)  색적 데이터 분석을 통해 특이  에 대한 장비 연관성을 확인한다.
                        3)   우선적으로 사고 발생 전 특이 사항 발생 유무를 확인하기 위해, 사고 발생 시
                           을 기준으로 구간별 데이터    분석을 시행한다.
                        4) 데이터의 시간 간격을 변화시키며 데이터 변화 구간을 확인한다.




                       제조 현장에서 생성되는 대다수의 데이터들은 변수가 매우 많이 존재

                     하고, 각각의 변수에 대한 전문 지식이 있어야 이해되는 경우가 많다. 분

                     석 방향에서 가장 먼저 이야기한 것과 같이, 이 사례의 경우 변수에 대한
                     이해 과정과 정제(전처리) 과정을 생산 엔지니어와 함께 진행하였다. 이번

                     사례와 같은 제조업 데이터의 경우 문제의 원인을 파 하거나 예측할 때

                     변수 간 인과관계와 선후 문제를 이해하는 것이 아주 중요하다. 예를 들

                     어 A라는 변수가 변할 때마다 B라는 변수도 변한다면, 과연 B라는 변수


                                                                                 281
   278   279   280   281   282   283   284   285   286   287   288