Análisis de ítems

CRITERIOS PARA EVALUACION DE ITEMS
Los documentos 1-6 tienen información general sobre los criterios para evaluar ítems y exámenes. Se incluye información de tres instituciones en EEUU (como referencia de lo que se hace en otros lugares).
Los documentos 7, 9-11 tienen información de aproximaciones más sofisticadas en caso de que haya interés. No son exactamente pertinentes al análisis que se propone aquí.
El documento 12 explica de dónde viene el “27%” que se usa para el cálculo de IDI.

RESUMEN IDI
Para cada item se ordenan l@s estudiantes de mayor a menor por nota global. Se usan dos subgrupos:

NA = 27% de estudiantes con mayor rendimiento (notas) en el examen = grupo alto rendimiento

NB = 27% de estudiantes con menor rendimiento (notas) en el examen = grupo bajo rendimiento

N = 27% del grupo de personas “examinadas”

nAi = número de estudiantes en grupo alto rendimiento que tuvo la pregunta i correcta

nBi = número de estudiantes en grupo bajo rendimiento que tuvo la pregunta i correcta

 IDI = (nAi – nBi)/N

Un mayor valor de IDI se asocia con mayor poder de discriminación. Cuando IDI se aproxima a cero, el número de estudiantes del grupo bajo rendimiento que contestaron correcto el ítem se aproxima al número de estudiantes del grupo alto rendimiento que lo contestaron correcto. El conocimiento y la comprensión no determinan quien lo tenga correcto.

Cuando el IDI se aproxima a uno, se dice que pesan más el conocimiento y la comprensión que la pura probabilidad para tener el ítem correcto: más estudiantes del grupo alto rendimiento que del grupo bajo rendimiento tienen el ítem correcto.

Cuando el IDI es negativo, más estudiantes del grupo bajo que del grupo alto tienen el ítem correcto: no entender y no saber ayuda a tener el ítem correcto…


RESUMEN PBC
El IDI es generalmente más amigable para explicar el principio de discriminación en evaluación. Sin embargo, solo usa el 54% de los datos (un documento adjunto explica de dónde viene ese porcentaje). Por eso se prefiere el PBC: la correlación punto-biserial. Esta es simplemente una correlación entre una variable dicotómica (bueno o malo, 1 o 0) y una continua (la nota global). El PBC usa el mismo principio del IDI solo que con el 100% de los datos, aunque generalmente los datos son consistentes, el PBC es más robusto. Los valores de PBC van de 0 a 1, a mayor PBC, mayor correlación entre el ítem y las notas globales, y se dice que el ítem es mejor (discrimina de manera más efectiva).