Page 11 - Interrupción del Embarazo en México
P. 11

En la tabla se muestran los atributos que tenían espacios en blanco y la decisión que se
                  tomó sobre ellos para su limpieza.


                   Tabla 2
                   Limpieza de datos en blanco

                                            Cantidad de
                   Pos.  Atributo           espacios en  Análisis/Decisiones
                                            blanco
                                                         No se encontró un patrón de relación con alguna
                   1     edocivil_descripcion  1076
                                                         otra variable. Se colocó el valor de la Moda
                   2     desc_derechohab    123          Se colocó el valor "No especificado"

                                                         Existe un patrón relacional con la variable 'Edad',
                   3     nivel_edu          5298         cada grupo de edad tiene un valor 'Nivel_edu' más
                                                         probable y ese fue el valor 'nivel_edu' colocado.
                                                         La ocupación tiene una ligera relación con
                                                         'nivel_edu' el cual a su vez tiene una 'ocupación'
                   4     ocupacion          10002
                                                         probable. Se reemplazaron los valores de acuerdo al
                                                         valor 'nivel_edu'
                                                         No existe relación con otras variables, así que se
                   5     religion           5562
                                                         remplazaron los valores en blanco con la Moda

                   6     entidad            12           Se colocó el valor "No especificado"
                   7     alc_o_municipio    5547         Se colocó el valor "No especificado"

                                                         La distribución de la muestra está ligeramente
                                                         distribuida normalmente (la mediana y la media son
                   8     fsexual           3764
                                                         aproximadamente iguales). Se reemplazaron los
                                                         valores nulos con el valor de la media.

                                                         Se observa un patron relacional cuando fsexual es
                                                         menor que 15 se tiene un valor de 1 y cuando es
                   9     nhijos            11538
                                                         mayor a 40 se tiene un valor de 0. Se reemplazó con
                                                         el valor 1 o 0 respecto a fsexual
                                                         La distribución es normal, así que se colocó el valor
                   10    gesta             2959
                                                         de la media
                                                         No hay relación con otras variables, se reemplazó el
                   11    naborto           5017
                                                         valor con la moda

                                                         Existe una correlación con la variable "nile", para
                   12    npartos           4502          cada valor de nile hay un valor de npartos, se tomó y
                                                         colocó la media de ese rango



                                                                                                             11
   6   7   8   9   10   11   12   13   14   15   16