Page 269 - 데이터과학 무엇을 하는가? 전자책
P. 269
가 은 정 성을 하는 제 데이터
빅데이터 기술 전문 기업인 데이터미어(Datameer) CEO 스테
판 그로슈프(Stefan Groschupf)에 따르면, 2014년 빅데이터의 새로운 세대
는 제조공정 또는 제품 생산을 향상시 생산 시간 또는 비용을 감소시
키는 기술이 될 것이라고 한다. 1
제조업 분야의 특징은, 데이터가 매우 다양해 수백에서 수천 개에 이
르는 변수를 가지고 있다는 것이다. 제조업 분야에서는 연속되는 의
데이터를 분석하는 경우가 많고, 데이터 자체가 정량적으로 측정된 인
경우가 많다. 다시 말해 제조업 데이터들은 인문 사회 분야와는 다르게
직관적으로 이해할 수 있는 변수가 적으며, 전문적인 지식을 필요로 할
때가 많다.
또 다른 중요한 특징은 분석 결과에 대한 정확성을 여타 분야에 비해
더욱 중시한다는 것이다. 아무리 의미 있는 결과라도 정확도가 어지면
제조업의 특성상 그 분석 방법을 적용하기는 어렵다.
제 이는 살펴보기
제조업 분석에도 다른 분야에서 사용하는 알고리즘들이 많이
사용된다. 다만 활용하는 관점이 다를 뿐이다. 여기에서는 제조업 분야
에서 주로 사용하는 알고리즘 중 주성분 분석(PCA, Principle Component
1 http://sandhill.com/article/2014-the-year-of-big-sensor-data/
267