Page 28 - Revista 2018 ultima
P. 28

Revista de la Facultad de Ingeniería, Año 5, Número 1

            decidir  si  el  valor  que  se  predijo  debe  ser  considerado  como  0  o  1,  el  algoritmo
            define  un  umbral  numérico  donde  todo  valor  que  supere  dicho  umbral  será
            considerado como 1; de lo contrario se lo considerara como 0 (Malclom, 2018).
            Internamente el algoritmo se basa en conocer los elementos y su correlación con el
            significado  o  en  el  caso  de  los  datos,  los  valores  y  el  resultado;  de  esa  forma  el
            sistema  es  capaz  de  clasificar  un  nuevo  elemento.  Esta  técnica  nos  permite
            reconocer si en una imagen hay  un perro (sí o no), pero no es capaz de decirnos
            directamente  si  en  la  imagen  hay  un  perro  “O”  un  gato.  Para  lograr  este
            comportamiento, se debe preguntar primero si la imagen corresponde a un perro (sí
            o no), una vez obtenida la respuesta y en caso que la respuesta sea no, se volverá a
            preguntar si la imagen corresponde a un gato (sí o no).


            Medidas de evaluación para las Clasificaciones
            Una vez que el modelo se encuentra entrenado, se ejecuta contra el set de prueba
            que  se  había  dejado  para  estos  efectos.  Es  sumamente  importante  validar  el
            resultado  del  modelo  contra  valores  conocidos  ya  que  de  esta  forma  podemos
            conocer la calidad de nuestro modelo de clasificación.

            La  principal  ventaja  de  tener  un  conjunto  de  datos  de  prueba  (conocidos)  es  que
            podemos medir exactamente toda la casuística de los resultados posibles, aquellos
            que fueron correctamente clasificados así como también los que no lo fueron.
            Debido  a  la  importancia  de  medir  la  calidad  del  resultado  obtenido  cuando  se
            aplican algoritmos de clasificación es que se presentan los indicadores básicos con
            los que se construyen las teorías de validación o correctitud del modelo aplicado.

            Existen cuatro variables básicas a considerar:
            True Positive o TP (Verdadero Positivo o VP): Se llama True Positive al valor que se
            predijo como Positivo y que efectivamente es positivo.
            True Negative o TN (Verdadero Negativo o VN): Se llama True Negative al valor que
            se predijo como Negativo y que efectivamente es negativo.
            False  Positive  o  FP  (Falso  Positivo):  Se  llama  False  Positive  al  valor  que  se  predijo
            como  Positivo  y  que  en  realidad  es  negativo.  También  se  le  llama  Falsa  alarma  o
            Error tipo 1

            False Negative o FN (Falso Negativo): Se llama False Negative al valor que se predijo
            como Negativo que en realidad es positivo. También se le llama Error tipo 2


                                                                        Real  Esperado


                              True Positive                              1       1



                              True Negative                              -1      -1



                              False Positive                             -1      1



                              False Negative                             1       -1




            28
   23   24   25   26   27   28   29   30   31   32   33