Page 12 - Interrupción del Embarazo en México
P. 12
La variable es independiente, se reemplazó el valor
13 ncesarea 4941
con la moda
La variable es independiente, se reemplazó el valor
14 nile 13600
con la moda
La variable es independiente, se reemplazó el valor
15 consejeria 4788
con la moda
La variable es independiente, se reemplazó el valor
16 anticonceptivo 8473
con la moda
17 motiles 1139 Se colocó el valor "Otra"
La distribución es normal, así que se colocó el valor
18 p_semgest 29
de la media
Hay un cambio en la preferencia del método
anticonceptivo a través de los años. No hay relación
19 panticoncep 29875
con otras variables así que los valores nulos se
reemplazaron con el valor más probable de ese año.
20 procile_simplificada 9
Se colocó el valor moda
Nota: Los atributos que no se muestran en esta tabla no tenían espacios en blanco
Datos Inconsistentes
Columna <desc_derechohab>
Hay datos inconsistentes en esta columna, algunos datos han sido registrados con
valor "OTRA" y otros con valor "NO ESPECIFICADO". Estos se pueden combinar y
usar con un solo formato
Antes de la normalización:
Número de registros con valor "NO especificado" = 15145
Número de registros con valor "OTRA" = 1346
Solución para la normalización:
El método / código de python utilizado para lograr esto es:
• df.loc[df['desc_derechohab'] == 'NO ESPECIFICADO' , 'desc_derechohab'] =
'OTRA'
12