Page 33 - Revista 2018 ultima
P. 33
Revista de la Facultad de Ingeniería, Año 5, Número 1de Ingeniería, Año 5, Número 1
Gráfica 4: Curva comparativaráfica 4: Curva comparativa
Gráfica 3: Curva esperada Gráfica 3: Curva esperada G
.
Gráfico 5: Gráfico comparativo de dos algoritmos de clasificaciónráfico 5: Gráfico comparativo de dos algoritmos de clasificaciónráfico 5: Gráfico comparativo de dos algoritmos de clasificación
G G
(Rudin & Elston, 2018)
P P
Podemos comparar visualmente la performance de dos modelos (o algoritmos) de odemos comparar visualmente la performance de dos modelos (o algoritmos) de odemos comparar visualmente la performance de dos modelos (o algoritmos) de
c c
clasificación al superponer las dos curvas ROC obtenidas. A continuación se lasificación al superponer las dos curvas ROC obtenidas. A continuación se lasificación al superponer las dos curvas ROC obtenidas. A continuación se
p p
presenta una gráfica comparativa de dos tipos de algoritmos de clasificación. resenta una gráfica comparativa de dos tipos de algoritmos de clasificación. resenta una gráfica comparativa de dos tipos de algoritmos de clasificación.
Para evaluar los resultados se debe considerar que cuanto más alta ydos se debe considerar que cuanto más alta ydos se debe considerar que cuanto más alta y curva es la
l l
línea (tendiendo al resultado perfecto), mejor es el rendimiento del modelo; así ínea (tendiendo al resultado perfecto), mejor es el rendimiento del modelo; así ínea (tendiendo al resultado perfecto), mejor es el rendimiento del modelo; así
m m
mismo si la curva supera la diagonal; el modelo ya es mejor que el “elección al ismo si la curva supera la diagonal; el modelo ya es mejor que el “elección al ismo si la curva supera la diagonal; el modelo ya es mejor que el “elección al
azar”. En la gráfica que se presenta eEn la gráfica que se presenta en el gráfico 5; se puede visualizar fácilmente n el gráfico 5; se puede visualizar fácilmente
q q
que el modelo representado por la línea roja es de mejor performance que el ue el modelo representado por la línea roja es de mejor performance que el ue el modelo representado por la línea roja es de mejor performance que el
m
modelo representado por la línea azul.odelo representado por la línea azul.
P P
Por último, la curva ROC se puede utilizar para generar valores estadísticos que or último, la curva ROC se puede utilizar para generar valores estadísticos que or último, la curva ROC se puede utilizar para generar valores estadísticos que
resuman el rendimiento o la efectividad del clasificador.ndimiento o la efectividad del clasificador.
AUC o Area Under the CurveUC o Area Under the Curve
A
S S
Si se desea utilizar un valor numérico para comparar modelos, el índice más i se desea utilizar un valor numérico para comparar modelos, el índice más i se desea utilizar un valor numérico para comparar modelos, el índice más
u u
utilizado es el área bajo la curva ROC o AUC (AreaUnderthe Curve). Se interpreta tilizado es el área bajo la curva ROC o AUC (AreaUnderthe Curve). Se interpreta tilizado es el área bajo la curva ROC o AUC (AreaUnderthe Curve). Se interpreta
c
como la probabilidad que unomo la probabilidad que un clasificador puntuará un valor positivo (elegido clasificador puntuará un valor positivo (elegido
a
aleatoriamente) más alto que un negativo. leatoriamente) más alto que un negativo.
A modo de ejemplo práctico, para interpretar las curvas ROC se han establecido modo de ejemplo práctico, para interpretar las curvas ROC se han establecido modo de ejemplo práctico, para interpretar las curvas ROC se han establecido
A A
p
para los valores ROC los siguientes intervalos:ara los valores ROC los siguientes intervalos:
Intervalo Resultado
[0.5, 0.6) Malo
[0.6, 0.75) Regular
[0.75, 0.9) Bueno
[0.9, 0.97) Muy Bueno
[0.97, 1) Excelente
T T
Tabla 5: Matriz de clasificación de algoritmos según AUCabla 5: Matriz de clasificación de algoritmos según AUCabla 5: Matriz de clasificación de algoritmos según AUC
33