Page 7 - Boletín Informativo CIMAT_Marzo_2019
P. 7

 El Dr. Mario Alberto Díaz Torres (CIMAT), quien junto a los dres. Emilien Joly (CIMAT) y José Ulises Márquez Urbina (CONACYT/CIMAT MONTERREY) organiza la EPE2019, nos explica en qué consiste esta ciencia.
MD: La ciencia de datos estudia cómo se aprende de los datos, y para ello se terminan involucrando muchas disciplinas: matemáti- cas, probabilidad, estadística, computación, etcétera. Es multidisciplinaria en su natura- leza, precisamente por el objetivo tan general que tiene. Incluso en la vida cotidiana es lo que hacemos, vamos a ciertos datos y apren- demos de ellos. La ciencia de datos se carac- teriza porque busca aprender de los datos a través de su preparación, modelación, visua- lización, etcétera, más que por una temática.
¿Por qué surge este auge por el análisis de los datos?
MD: La ciencia de datos como tal tiene bas- tante tiempo. John Tukey, en sus años dora- dos en Bell Labs, ya reconocía esa necesidad de mezclar estadística con computación, que en ese entonces era algo relativamente nuevo y a lo cual pocos tenían acceso, pero él re- conocía esa necesidad que llamaba algo así como ciencia del análisis de los datos. En la es- tadística siempre hemos estado preocupados por los datos, por saber qué podemos decir de ellos. Siempre ha habido esta atención, pero esta sofisticación de los datos, y yo diría que la sofisticación de los fenómenos que estudia- mos, no solamente de los datos, es lo que ha ido incrementándose y hace más necesario aprender de los datos per se, más que querer buscar un modelo detrás.
John Tukey
En algunos contextos científicos necesitas relativamente pocos datos para entender el fenómeno subyacente que estudias. Pero, por ejemplo, en 2014 el CERN (European Organi- zation for Nuclear Research) generaba al día algo así como mil terabytes de datos; hacían experimentos físicos con mil terabytes al día qué procesar. Ahí ya no es tan fácil decir qué hay detrás, no es tan fácil querer hacer un mo- delo, no es tan fácil querer hacer el enfoque usual. Aquí lo que tienes que hacer es tomar los datos y empezar a aplicar estas técnicas de modelación, procesamiento y visualización que caracterizan a la ciencia de datos.
Entrevista Boletín Mensual 7 de Información
     



























































































   5   6   7   8   9