Page 28 - Revista 2018 ultima
P. 28
Revista de la Facultad de Ingeniería, Año 5, Número 1
decidir si el valor que se predijo debe ser considerado como 0 o 1, el algoritmo
define un umbral numérico donde todo valor que supere dicho umbral será
considerado como 1; de lo contrario se lo considerara como 0 (Malclom, 2018).
Internamente el algoritmo se basa en conocer los elementos y su correlación con el
significado o en el caso de los datos, los valores y el resultado; de esa forma el
sistema es capaz de clasificar un nuevo elemento. Esta técnica nos permite
reconocer si en una imagen hay un perro (sí o no), pero no es capaz de decirnos
directamente si en la imagen hay un perro “O” un gato. Para lograr este
comportamiento, se debe preguntar primero si la imagen corresponde a un perro (sí
o no), una vez obtenida la respuesta y en caso que la respuesta sea no, se volverá a
preguntar si la imagen corresponde a un gato (sí o no).
Medidas de evaluación para las Clasificaciones
Una vez que el modelo se encuentra entrenado, se ejecuta contra el set de prueba
que se había dejado para estos efectos. Es sumamente importante validar el
resultado del modelo contra valores conocidos ya que de esta forma podemos
conocer la calidad de nuestro modelo de clasificación.
La principal ventaja de tener un conjunto de datos de prueba (conocidos) es que
podemos medir exactamente toda la casuística de los resultados posibles, aquellos
que fueron correctamente clasificados así como también los que no lo fueron.
Debido a la importancia de medir la calidad del resultado obtenido cuando se
aplican algoritmos de clasificación es que se presentan los indicadores básicos con
los que se construyen las teorías de validación o correctitud del modelo aplicado.
Existen cuatro variables básicas a considerar:
True Positive o TP (Verdadero Positivo o VP): Se llama True Positive al valor que se
predijo como Positivo y que efectivamente es positivo.
True Negative o TN (Verdadero Negativo o VN): Se llama True Negative al valor que
se predijo como Negativo y que efectivamente es negativo.
False Positive o FP (Falso Positivo): Se llama False Positive al valor que se predijo
como Positivo y que en realidad es negativo. También se le llama Falsa alarma o
Error tipo 1
False Negative o FN (Falso Negativo): Se llama False Negative al valor que se predijo
como Negativo que en realidad es positivo. También se le llama Error tipo 2
Real Esperado
True Positive 1 1
True Negative -1 -1
False Positive -1 1
False Negative 1 -1
28