Page 24 - Barbara Carbajal_Carlos Pacheco AP3
P. 24
METODOLOGÍA DE SOKOUP
Y DAVIDSON
Los pasos se pueden repetir
mientras se afinan y se obtiene
mayor conocimiento de los datos y
su significado
Soukup y Davidson (2002), en su libro ‘Visual Data
Mining: Techniques and Tools for Data Visualization
and Mining’, proponen y comprueban una
metodología de ocho pasos para la minería y
visualización de datos.
Planeación del proyecto: En esta sección se realiza
el análisis de los aspectos de negocio. Comprende
la justificación que existe detrás de una propuesta
de implementación de visualización de datos. Se
define en esta etapa el tipo de proyecto que se va a
llevar a cabo y las preguntas de negocio que van a
ser contestadas a través del análisis de datos. Se
logra identificar también la serie de beneficios que
el negocio espera a partir de la implementación.
Preparación de los datos: Esta sección comprende
el análisis de cómo es que se van a seleccionar los
conjuntos de datos relevantes para responder a las
preguntas de negocio que ya han sido planteadas.
Los datos provienen de las diferentes fuentes
operacionales de la empresa, los cuales serán
dispuestos en data marts y sometidos al proceso
ETL con el objetivo de crear repositorios listos para
el análisis con las diferentes herramientas de
visualización. Comprende también la verificación de
que los repositorios creados contienen los datos
esperados y que el proceso ETL fue realizado de
manera correcta.