Page 9 - PROYECTO TEXTO
P. 9





Esta visualización permite comprender cómo se En el contexto de la Ciencia de Datos, es fundamental
interrelacionan las etapas y facilita la comprensión del comprender los diferentes tipos de datos que se
enfoque estructurado utilizado para abordar problemas manejan. La Tabla 1 describe los tipos de datos más
complejos de datos. comunes, lo cual es clave para las aplicaciones que se
exploran en diversas industrias.
1.4 Ciclo de vida de la ciencia de datos Tabla 1: Tipos de datos según su estructura

Según [3], el ciclo de vida de la ciencia de datos
comprende una serie de etapas comunes en la mayoría N° Tipo de dato Descripción Ejemplo
de los proyectos, que abarcan desde la concepción del
problema y la recopilación de datos hasta el análisis y 1 Estructurados Datos Datos de
la comunicación de resultados. Este enfoque organizados ventas,
estructurado permite abordar datos complejos de en filas y registros de
manera sistemática para obtener conclusiones precisas columnas, clientes
y apoyar decisiones informadas. como bases de
datos
relacionales

2 No Datos no Imágenes,
estructurados organizados, correos
difíciles de electrónicos,
analizar sin publicaciones
Figura 2: Ciclo de vida de la Ciencia de Datos procesamiento en redes
previo sociales
La Fig. 2 ilustra el ciclo de vida de la ciencia de datos
(Data Science), destacando las etapas principales. Esta 3 Semi- Datos que no Archivos
representación ayuda a entender el flujo del proceso. estructurados tienen una JSON,
A continuación, se describen brevemente cada una de estructura fija, archivos
estas etapas. pero XML,
contienen archivos
Recopilación y almacenamiento de datos: etiquetas o YAML
se obtienen datos desde distintas fuentes (bases de delimitadores
datos, archivos, APIs, web scraping, etc.) y se
almacenan de forma segura y accesible para su
posterior análisis. 1.6 Aplicaciones de la ciencia de datos

Preparación de datos: consiste en limpiar, La Ciencia de Datos ha transformado diversas
transformar y organizar los datos para asegurar su industrias, desde la medicina hasta el comercio
calidad. Se eliminan errores, valores faltantes y electrónico. En salud, predice efectos secundarios, y
duplicados. en deportes redefine el "potencial atlético". También
se aplica en optimización del tráfico y rutas. A
Exploración y visualización: se analizan los datos continuación, algunos ejemplos de su aplicación en
con técnicas estadísticas y herramientas gráficas para diferentes sectores.
detectar patrones, tendencias y posibles anomalías.
A continuación, en la Tabla 2 se muestra una selección
Experimentación y predicción: se aplican modelos de las principales aplicaciones de la Ciencia de Datos
estadísticos o de aprendizaje automático (machine en distintos sectores, destacando cómo esta disciplina
learning) para extraer conocimiento, hacer impulsa mejoras en áreas como la salud, el transporte
predicciones o clasificar datos según los objetivos del y el comercio electrónico.
proyecto. Tabla 2: Aplicaciones de la Ciencia de Datos en Distintos Sectores
Narración y comunicación de datos: los resultados
se interpretan y comunican de forma clara y visual, N° Sector Aplicación Beneficio
principal
específica
para facilitar la toma de decisiones basada en datos.
1 Salud Predicción de Mejora en el
1.5 Tipos de datos en ciencia de datos efectos diagnóstico y
secundarios en tratamiento
Tanto en Data Science como en Big Data, se pacientes
encontrará con muchos tipos diferentes de datos, y
cada uno de ellos tiende a requerir diferentes
herramientas y técnicas [4]. Las principales categorías 2 Deportes Modelos de Optimizació
de tipos de datos son las siguientes: análisis del n del

5

   4   5   6   7   8   9   10   11   12   13   14