Page 26 - Revista 2018 ultima
P. 26
Revista de la Facultad de Ingeniería, Año 5, Número 1
Para comprender como evolucionó la definición de machine learning, nos gustaría
hacer referencia a dos definiciones, las mismas fueron planteadas con 40 años de
separación. La primera de ellas es una definición general que no ahonda en mucho
detalle; fue propuesta por Arthur Samuel en 1959 y dice: “Machine Learning: Field of
studythatgivescomputerstheability to learnwithoutbeingexplicitlyprogrammed.”
Por otro lado, en 1998, Tom Mitchell propone una nueva y moderna definición que
dice lo siguiente: “A computer program is said to learn from experience E with
respect to some task T and some performance measure P, if its performance on T,
as measured by P, improves with experience E.”. Se puede ver que la definición es
más precisa e incluye los elementos que se tienen en cuenta a la hora de hablar de
machine learning.(Ng, 2018)
Aplicando la definición de Mitchell para el ejemplo de los servidores de correo
electrónico podemos identificar T,P y E de la siguiente manera:
● T: Clasificar los emails.
● E: Observar cómo el usuario marca los emails como “spam”.
● P: El número de emails correctamente clasificados.
Los algoritmos (o modelos) de machine learning se clasifican según la taxonomía de
salida o en otras palabras la información que devuelven. Dicho esto, existen al
menos cuatro tipos de algoritmos:
● Supervisado
● No supervisado
● Semi supervisado
● Refuerzo
Nos centraremos exclusivamente en el modelo: Supervisado, también conocido
como aprendizaje automático Supervisado.
Es importante destacar que el aprendizaje automático requiere disponer de un
conjunto de datos amplio; en ocasiones miles de datos de información válida sobre
lo que se quiere que el sistema aprenda. Por este motivo la inteligencia artificial está
muy emparentada con el concepto de BigData al cual no entraremos.
Machine Learning Supervisado. El enfoque desde la Clasificación
En el modelo de machine learning supervisado se requiere que el algoritmo reciba el
conjunto de datos observado, del cual conocemos el resultado (denominado
“etiqueta”). Estos datos son introducidos al algoritmo con la finalidad de enseñarle
en base a datos conocidos lo que debe aprender.
Un conjunto de datos típico de entrada para el modelo supervisado es:
[x x x ] [y ]
1, 2,.., n 1
[x x x ] [y ]
1, 2,.., n 2
[x x x ] [y ]
1, 2,.., n 3
…. …
[x x x ] [y ]
1, 2,.., n n
26