Page 24 - Barbara Carbajal_Carlos Pacheco AP3
P. 24

METODOLOGÍA DE SOKOUP


                                                  Y DAVIDSON




                                                  Los pasos se pueden repetir


                                                  mientras se afinan  y se  obtiene

                                                  mayor conocimiento de los datos y


                                                  su significado




                                                 Soukup y Davidson (2002), en su libro ‘Visual Data
                                                 Mining: Techniques and Tools for Data Visualization
                                                 and Mining’, proponen y comprueban una
                                                 metodología de ocho pasos para la minería y
                                                 visualización de datos.

                                                 Planeación del proyecto: En esta sección se realiza
                                                 el análisis de los aspectos de negocio. Comprende
                                                 la justificación que existe detrás de una propuesta
                                                 de implementación de visualización de datos. Se
                                                 define en esta etapa el tipo de proyecto que se va a
                                                 llevar a cabo y las preguntas de negocio que van a
                                                 ser contestadas a través del análisis de datos. Se
                                                 logra identificar también la serie de beneficios que
                                                 el negocio espera a partir de la implementación.

                                                 Preparación de los datos: Esta sección comprende
                                                 el análisis de cómo es que se van a seleccionar los
                                                 conjuntos de datos relevantes para responder a las
                                                 preguntas de negocio que ya han sido planteadas.
                                                 Los datos provienen de las diferentes fuentes
                                                 operacionales de la empresa, los cuales serán
                                                 dispuestos en data marts y sometidos al proceso
                                                 ETL con el objetivo de crear repositorios listos para
                                                 el análisis con las diferentes herramientas de
                                                 visualización. Comprende también la verificación de
                                                 que los repositorios creados contienen los datos
                                                 esperados y que el proceso ETL fue realizado de
                                                 manera correcta.
   19   20   21   22   23   24   25   26   27   28   29