Page 12 - Interrupción del Embarazo en México
P. 12

La variable es independiente, se reemplazó el valor
                   13    ncesarea          4941
                                                         con la moda
                                                         La variable es independiente, se reemplazó el valor
                   14    nile              13600
                                                         con la moda
                                                         La variable es independiente, se reemplazó el valor
                   15    consejeria        4788
                                                         con la moda
                                                         La variable es independiente, se reemplazó el valor
                   16    anticonceptivo    8473
                                                         con la moda
                   17    motiles           1139          Se colocó el valor "Otra"
                                                         La distribución es normal, así que se colocó el valor
                   18    p_semgest         29
                                                         de la media

                                                         Hay un cambio en la preferencia del método
                                                         anticonceptivo a través de los años. No hay relación
                   19    panticoncep       29875
                                                         con otras variables así que los valores nulos se
                                                         reemplazaron con el valor más probable de ese año.

                   20    procile_simplificada  9
                                                         Se colocó el valor moda
                   Nota: Los atributos que no se muestran en esta tabla no tenían espacios en blanco



                  Datos Inconsistentes

                         Columna <desc_derechohab>

                         Hay datos inconsistentes en esta columna, algunos datos han sido registrados con
                         valor "OTRA" y otros con valor "NO ESPECIFICADO". Estos se pueden combinar y
                         usar con un solo formato

                         Antes de la normalización:
                         Número de registros con valor "NO especificado" = 15145
                         Número de registros con valor "OTRA" = 1346


                         Solución para la normalización:

                         El método / código de python utilizado para lograr esto es:


                         •  df.loc[df['desc_derechohab'] == 'NO ESPECIFICADO' , 'desc_derechohab'] =
                             'OTRA'




                                                                                                             12
   7   8   9   10   11   12   13   14   15   16   17