Page 11 - Interrupción del Embarazo en México
P. 11
En la tabla se muestran los atributos que tenían espacios en blanco y la decisión que se
tomó sobre ellos para su limpieza.
Tabla 2
Limpieza de datos en blanco
Cantidad de
Pos. Atributo espacios en Análisis/Decisiones
blanco
No se encontró un patrón de relación con alguna
1 edocivil_descripcion 1076
otra variable. Se colocó el valor de la Moda
2 desc_derechohab 123 Se colocó el valor "No especificado"
Existe un patrón relacional con la variable 'Edad',
3 nivel_edu 5298 cada grupo de edad tiene un valor 'Nivel_edu' más
probable y ese fue el valor 'nivel_edu' colocado.
La ocupación tiene una ligera relación con
'nivel_edu' el cual a su vez tiene una 'ocupación'
4 ocupacion 10002
probable. Se reemplazaron los valores de acuerdo al
valor 'nivel_edu'
No existe relación con otras variables, así que se
5 religion 5562
remplazaron los valores en blanco con la Moda
6 entidad 12 Se colocó el valor "No especificado"
7 alc_o_municipio 5547 Se colocó el valor "No especificado"
La distribución de la muestra está ligeramente
distribuida normalmente (la mediana y la media son
8 fsexual 3764
aproximadamente iguales). Se reemplazaron los
valores nulos con el valor de la media.
Se observa un patron relacional cuando fsexual es
menor que 15 se tiene un valor de 1 y cuando es
9 nhijos 11538
mayor a 40 se tiene un valor de 0. Se reemplazó con
el valor 1 o 0 respecto a fsexual
La distribución es normal, así que se colocó el valor
10 gesta 2959
de la media
No hay relación con otras variables, se reemplazó el
11 naborto 5017
valor con la moda
Existe una correlación con la variable "nile", para
12 npartos 4502 cada valor de nile hay un valor de npartos, se tomó y
colocó la media de ese rango
11