Saltar al contenido

Cómo leer la matriz de confusión del clasificador en WEKA

Este team de expertos despúes de ciertos días de investigación y de recopilar de datos, obtuvimos los datos necesarios, nuestro deseo es que te sea de utilidad para tu proyecto.

¿Has leído la página de wikipedia sobre matrices de confusión? El texto alrededor de la matriz está organizado de manera ligeramente diferente en su ejemplo (etiquetas de fila a la izquierda en lugar de a la derecha), pero se lee igual.

La fila indica el true clase, la columna indica la salida del clasificador. Cada entrada, entonces, da el número de instancias de que fueron clasificados como . En su ejemplo, 15 B se clasificaron (incorrectamente) como As, 150 B se clasificaron correctamente como B, etc.

Como resultado, todos correcto las clasificaciones están en la diagonal superior izquierda a la inferior derecha. Todo lo que está fuera de esa diagonal es una clasificación incorrecta de algún tipo.

Editar: Desde entonces, la página de Wikipedia ha cambiado las filas y las columnas. Esto pasa. Al estudiar una matriz de confusión, siempre asegúrese de revisar las etiquetas para ver si es true clases en filas, clase predicha en columnas o al revés.

Yo lo pondría de esta manera:

La matriz de confusión es que Weka informa sobre lo bueno que es este modelo J48 en términos de lo que hace bien y lo que hace mal.

En sus datos, la variable objetivo era “funcional” o “no funcional”; el lado derecho de la matriz le dice que la columna “a” es funcional y “b” no es funcional.

Las columnas le indican cómo su modelo clasificó sus muestras: es lo que predijo el modelo:

  • La primera columna contiene todas las muestras que su modelo cree que son “a”: 145 de ellas, en total
  • La segunda columna contiene todas las muestras que su modelo cree que son “b”: 158 de ellas

Las filas, por otro lado, representan la realidad:

  • La primera fila contiene todas las muestras que realmente son “a” – 138 de ellas, en total
  • La segunda fila contiene todas las muestras que realmente son “b” – 165 de ellas

Conociendo las columnas y filas, puede profundizar en los detalles:

  • Arriba a la izquierda, 130, son cosas que su modelo cree que son “a” que en realidad son “a” <- estas eran correctas
  • Abajo a la izquierda, 15, son cosas que su modelo cree que son “a” pero que en realidad son “b” <- un tipo de error
  • Arriba a la derecha, 8, son cosas que su modelo cree que son “b” pero que en realidad son “a” <- otro tipo de error
  • Abajo a la derecha, 150 son cosas que tu modelo cree que son “b” y que en realidad son “b”.

Entonces, la parte superior izquierda y la parte inferior derecha de la matriz muestran cosas que su modelo hace bien.

Las esquinas inferior izquierda y superior derecha de la matriz muestran dónde se confunde su modelo.

Nos encantaría que puedieras dar visibilidad a este enunciado si te ayudó.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)


Tags :

Utiliza Nuestro Buscador

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *