Ya no busques más por todo internet porque estás al lugar indicado, contamos con la solución que necesitas encontrar sin liarte.
Solución:
Asignar calificaciones para que se ajusten a una “distribución óptima” es un error. Nosotros no querer para maximizar la entropía de las calificaciones en un curso en particular. No es una medida muy útil de un “buen” conjunto de calificaciones. Para citar una respuesta de un matemático anónimo:
Estrictamente hablando, la entropía de Shannon no presta atención a la distancia entre las puntuaciones, solo a si son exactamente iguales. Es decir, puede tener una entropía alta si cada estudiante obtiene una puntuación ligeramente diferente, incluso si las puntuaciones están muy cerca entre sí y, por lo tanto, no son útiles para distinguir a los estudiantes.
(Tenga en cuenta que esto fue en respuesta a una pregunta sobre el uso de la entropía de los puntajes de los exámenes como una indicación de qué tan bueno es un examen para distinguir entre diferentes niveles de dominio. No estaba sugiriendo que las calificaciones deban ser curvas posteriormente para maximizar la entropía.)
Lo que Realmente Lo que queremos es que las calificaciones indiquen lo más fielmente posible el dominio del material del curso por parte de los estudiantes. Si todos los estudiantes del curso han alcanzado un dominio verdaderamente excelente del material del curso, todos deberían obtener puntuaciones altas. Este grado entonces parece para llevar muy poca información. Pero en realidad, es mucho más útil decir que todos los estudiantes de esta clase en particular lograron la excelencia y merecen un 10/10, que maximizar la “información” que lleva la calificación y dar a algunos estudiantes un 1/10 porque su desempeño fue levemente menos excelente que el nivel más alto de excelencia alcanzado por un estudiante ese año. Este escenario (donde todos los estudiantes obtienen calificaciones excelentes o muy buenas) ni siquiera es tan inusual, como señala Michael Covington:
En los cursos avanzados, puede ser bastante apropiado que todos los estudiantes obtengan A y B, porque los estudiantes débiles no tomarían el curso en primer lugar.
Para un estudiante individual, la calificación debe depender del dominio demostrado por ese estudiante del material del curso y, con suerte, no en absoluto (o lo menos posible) en los otros estudiantes de la clase.
Si insiste en pensarlo desde una perspectiva teórica de la información, lo que De Verdad Lo que queremos es minimizar la divergencia de Kullback-Leibler entre la distribución de los logros de los estudiantes y la distribución de las calificaciones de los estudiantes.
Si no tiene información sobre el examen y lo que mide, no puede asignar calificaciones significativas en función de la puntuación del examen. Si sabe sobre el examen, pueden asignar calificaciones significativas basadas en los puntajes de los exámenes, pero no de acuerdo con una distribución óptima; asignaría puntajes en función de la cantidad de exámenes que se espera que los estudiantes sepan para demostrar varios niveles de dominio, no dando forma matemática a las calificaciones en algunos valores “óptimos predeterminados”. distribución.”
Editar: Suponga que los puntajes de estas pruebas solo tienen un significado ordinal. Se puede decir que un estudiante con un puntaje más alto ha logrado un mejor dominio del curso, pero tener el doble de puntaje no significa que uno haya logrado el doble que otro estudiante.
Tus ediciones no van a cambiar la respuesta; todavía no va a haber una distribución óptima. Si tengo muchos estudiantes excelentes en la clase y hago un trabajo excepcionalmente bueno enseñándolos, daré muchas calificaciones excelentes, sin importar cómo se clasifiquen entre sí. Si todos mis estudiantes son terribles y lo hacen mal, todos obtendrán calificaciones bajas incluso si uno logra obtener algunos puntos más que otro (aunque en ese caso, también echaré un vistazo más de cerca a la clase para ver por qué los estudiantes lo están haciendo tan mal). Si la mitad de mi clase sobresale y la otra mitad no cumple con los estándares mínimos, daré el 50% de las mejores calificaciones y el 50% de las calificaciones reprobatorias. Si sus habilidades se distribuyen normalmente, sus calificaciones también lo estarán. Entiendes la idea.
La distribución de las calificaciones de los estudiantes debe seguir la distribución de los logros demostrados. Cualquier distribución de grado que no es definitivamente no óptimo.
La idea de calificar a los estudiantes según una distribución predeterminada (de cualquier forma) se conoce como “calificación con referencia a normas”. Para obtener más información sobre alternativas a la calificación con referencia a normas, consulte:
- Sadler, D. Royce. “Interpretaciones de evaluación y calificación basadas en criterios en la educación superior”. Assessment & Evaluation in Higher Education 30.2 (2005): 175-194.
- Avilés, Christopher B. “Calificar con medidas con referencia a normas o con referencia a criterios: curvar o no curvar, esa es la cuestión”. Educación en trabajo social 20.5 (2001): 603-608.
- Rose, Leslie. “Calificación con referencias a normas en la era de carnegie: por qué la calificación con referencias a criterios es más consistente con las tendencias actuales en la educación jurídica y cómo la redacción jurídica puede marcar el camino”. Revista del Instituto de Redacción Jurídica 17 (2011): 123.
- Guskey, Thomas R. “Políticas de calificación que funcionan contra los estándares … y cómo solucionarlos”. Boletín NASSP 84.620 (2000): 20-29.
Estos entran en más detalles sobre los problemas con la calificación con referencia a normas. Solicitó una distribución de calificaciones que sea “informativa sobre la comprensión del material por parte del estudiante”. La literatura que he citado explica que la calificación puramente referida a normas no es informativa sobre eso; solo puede informar sobre el estudiante relativo comprensión del material, en comparación con otros del mismo grupo que han realizado el mismo examen. En otras palabras (énfasis mío):
Puede ser útil para fines selectivos (por ejemplo, para la distribución de una beca a los 5 mejores estudiantes, o matrícula adicional a los 5 que tienen más dificultades), pero da poca información sobre las habilidades reales de los candidatos.
Fuente: McAlpine, Mhairi. Principios de evaluación. Centro CAA, Universidad de Luton, 2002.
A mediados de la década de 1990, el sistema sueco de calificaciones de la escuela secundaria pasó de ser un sistema de referencia a normas a un sistema de referencia a criterios. Por lo tanto, fue posible comparar (para la misma población) la capacidad de un sistema de calificación con referencia a normas y un sistema de calificación con referencia a criterios para predecir el éxito académico.
El primer artículo que analiza este conjunto de datos suecos no está escrito en inglés. (Cliffordson, C. (2004). De målrelaterade gymnasiebetygens prognosförmåga. [The Predictive Validity of Goal-Related Grades from Upper Secondary School]. Pedagogisk Forskning i Sverige, 9 (2), 129-140.) Sin embargo, en un artículo posterior, el autor describe esos resultados de la siguiente manera:
Cliffordson (2004b) mostró en un estudio de logros de primer año en los programas de Maestría en Ciencias en Ingeniería que la validez predictiva de CRIT-GPA era algo más alta que la de NORM-GPA.
En ese estudio posterior, Cliffordson encontró (de acuerdo con el estudio anterior)
una validez pronóstica algo mayor para CRIT-GPA que para NORM-GPA.
y que en una variedad de disciplinas,
A pesar de las diferencias tanto en el diseño como en el propósito, la eficacia predictiva de las calificaciones con referencias a criterios es al menos tan buena, o de hecho algo mejor, que la de las calificaciones con referencias a normas.
Para obtener más detalles, consulte:
Cliffordson, Christina. “Predicción diferencial del éxito del estudio en los programas académicos en el contexto sueco: la validez de las calificaciones y las pruebas como instrumentos de selección para la educación superior”. Evaluación educativa 13.1 (2008): 56-75.
Sin intentar eludir su pregunta, es extremadamente difícil cuantificar el impacto de diferentes distribuciones de calificaciones. Esto hace que no sea posible encontrar una solución óptima. Indica 2 objetivos que dificultan la optimización. Además, sus objetivos no están bien definidos.
En la superficie, el objetivo de motivar a los estudiantes parece loable, pero debemos tener cuidado con lo que estamos motivando. No queremos motivar a los estudiantes para que se esfuercen por obtener calificaciones más altas (es decir, quitar calificaciones). Tampoco queremos promover un ambiente despiadado en el que los estudiantes intenten aumentar su calificación saboteando a sus compañeros. Queremos motivar a los estudiantes, tanto a nivel individual como grupal, para aumentar su comprensión. La investigación sobre educación es bastante clara en cuanto a que los motivadores externos, como las calificaciones, no promueven el tipo de aprendizaje por el que se esfuerzan los maestros.
Su segundo objetivo es que las calificaciones sean informativas. Pero no define a quién está tratando de informar. ¿Queremos que las calificaciones informen a los estudiantes sobre su nivel de comprensión o queremos que las calificaciones informen a los posibles empleadores? Desde mi comprensión de la teoría de la educación, las evaluaciones sumativas no son parte del proceso de aprendizaje, mientras que las evaluaciones formativas sí lo son. Además, no está claro si las calificaciones numéricas o de letras son útiles para las evaluaciones formativas.
La distribución de calificación óptima se ve exactamente como la distribución de capacidad en el campo que tienen los miembros de su clase.
Ahora, eso no es realmente algo que pueda medir fácil o perfectamente, pero ese es su objetivo.
Si pudiera seguir a sus estudiantes y calificar su desempeño en la vida posterior en algunos hitos, posiblemente podría estimar la información snr en su calificación. Ahí es donde aplicarías esos conceptos de manera significativa.
Eso no tiene nada que ver con la forma de la distribución de Los grados, sin embargo.
Realmente no puede asumir ninguna forma específica como válida o no a menos que conozca la distribución de la población.