Este team de expertos despúes de ciertos días de investigación y de recopilar de datos, obtuvimos los datos necesarios, nuestro deseo es que te sea de utilidad para tu proyecto.
¿Has leído la página de wikipedia sobre matrices de confusión? El texto alrededor de la matriz está organizado de manera ligeramente diferente en su ejemplo (etiquetas de fila a la izquierda en lugar de a la derecha), pero se lee igual.
La fila indica el true clase, la columna indica la salida del clasificador. Cada entrada, entonces, da el número de instancias de
que fueron clasificados como
. En su ejemplo, 15 B se clasificaron (incorrectamente) como As, 150 B se clasificaron correctamente como B, etc.
Como resultado, todos correcto las clasificaciones están en la diagonal superior izquierda a la inferior derecha. Todo lo que está fuera de esa diagonal es una clasificación incorrecta de algún tipo.
Editar: Desde entonces, la página de Wikipedia ha cambiado las filas y las columnas. Esto pasa. Al estudiar una matriz de confusión, siempre asegúrese de revisar las etiquetas para ver si es true clases en filas, clase predicha en columnas o al revés.
Yo lo pondría de esta manera:
La matriz de confusión es que Weka informa sobre lo bueno que es este modelo J48 en términos de lo que hace bien y lo que hace mal.
En sus datos, la variable objetivo era “funcional” o “no funcional”; el lado derecho de la matriz le dice que la columna “a” es funcional y “b” no es funcional.
Las columnas le indican cómo su modelo clasificó sus muestras: es lo que predijo el modelo:
- La primera columna contiene todas las muestras que su modelo cree que son “a”: 145 de ellas, en total
- La segunda columna contiene todas las muestras que su modelo cree que son “b”: 158 de ellas
Las filas, por otro lado, representan la realidad:
- La primera fila contiene todas las muestras que realmente son “a” – 138 de ellas, en total
- La segunda fila contiene todas las muestras que realmente son “b” – 165 de ellas
Conociendo las columnas y filas, puede profundizar en los detalles:
- Arriba a la izquierda, 130, son cosas que su modelo cree que son “a” que en realidad son “a” <- estas eran correctas
- Abajo a la izquierda, 15, son cosas que su modelo cree que son “a” pero que en realidad son “b” <- un tipo de error
- Arriba a la derecha, 8, son cosas que su modelo cree que son “b” pero que en realidad son “a” <- otro tipo de error
- Abajo a la derecha, 150 son cosas que tu modelo cree que son “b” y que en realidad son “b”.
Entonces, la parte superior izquierda y la parte inferior derecha de la matriz muestran cosas que su modelo hace bien.
Las esquinas inferior izquierda y superior derecha de la matriz muestran dónde se confunde su modelo.
Nos encantaría que puedieras dar visibilidad a este enunciado si te ayudó.