Page 8 - PFinal-BernardoCoyotécatl
P. 8
4. Metodología de la visualización de datos
En este proyecto se utilizará la metodología de Soukup and Davidson para contestar las preguntas del
negocio.
4.1 Población, muestra, recolección y análisis de datos entre otros
La Encuesta Nacional de Ocupación y Empleo (ENOE) es la principal fuente de información sobre el
mercado laboral mexicano al ofrecer datos mensuales y trimestrales de la fuerza de trabajo, la ocupación,
la informalidad laboral, la subocupación y la desocupación. Constituye también el proyecto estadístico
continuo más grande del país al proporcionar cifras nacionales y de cuatro tamaños de localidad, de cada
una de las 32 entidades federativas y para un total de 36 ciudades.
La ENOE es producto de una evaluación integral de varios años, durante los cuales el Instituto Nacional de
Estadística y Geografía (INEGI), realizó una serie de actividades de carácter conceptual, metodológico y de
mejora de procesos, con la finalidad de presentar una nueva encuesta que permita captar y conocer de
mejor manera las características del mercado laboral mexicano. Entre dichas actividades se encuentra la
realización de talleres de consulta con usuarios tanto del sector académico como de instituciones públicas
y un foro con personal de la Organización para la Cooperación y el Desarrollo Económico (OCDE); así como
la ejecución de diferentes pruebas de los instrumentos de captación y los procesos de trabajo, entre ellas,
una de significancia estadística con la idea de confrontar los resultados obtenidos con una prueba análoga
en dimensión y características extraída del levantamiento rutinario ENE-ENEU. Cabe destacar la sustitución
del marco de viviendas, para el cual se prevén etapas de mantenimiento y actualización, considerando para
ello la automatización de los procesos.
4.2 Descripción del conjunto de datos utilizados
La base de datos fue obtenida del portal del INEGI y de la “Encuesta Nacional de Ocupación y Empleo
(ENOE)” del periodo 2017 al 2019, de esta fuente se utilizaron dos conjuntos de datos, cuya cantidad de
registros se muestra en la Tabla 1.
Conjunto de Descripción Cantidad de registros por periodo
datos
2017: 307, 760
coe1 Cuestionario de ocupación y empleo parte I 2018: 309, 052
2019: 321, 254
2017: 391, 620
sdem Características socio demográficas
2018: 390, 612
2019: 402, 537
Tabla 1. Infomación de conjunto de datos
4.3 Sistema de visualización de taxonomías
A continuación, se describe la implementación de la taxonomía del proyecto en cada uno de los aspectos
mencionados. En la Tabla 2 se muestra la sintaxis orientada a los datos que incluyen: los atributos,
referentes y patrones involucrados en la ocupación laboral y carreras profesionales.
Página 8 de 24