Estamos a dos días de un juego más de fútbol entre Costa Rica y México. El partido se jugará en el Estadio Azteca donde México es prácticamente invencible en eliminatorias de CONCACAF (Confederación Norte, Centroamérica y Caribe de Fútbol). Pero el 16 de junio de 2001, en el camino al Mundial de Japón – Corea 2002, Costa Rica venció a México en el juego conocido como “El Aztecazo“.
Hoy vamos a explicar los conceptos de Hipótesis Nula e Hipótesis Alternativa utilizando la metáfora de “El Aztecazo”. Al igual que la semana pasada (el Príncipe Azul y el Error Tipo I), la intención no es sustituir la teoría estadística formal sobre el tema, sino tener una forma sencilla de relacionar los conceptos con un hecho más mundano.
En “idioma estadístico” todo estudio que implique la validación de una decisión crea el siguiente juego de hipótesis:
Hipótesis Nula: se deriva directamente de la declaración del problema y es denotada como H0. Es equivalente a decir “aquí no ha cambiado nada”, “todo sigue igual”. O más estadísticamente “cualquier diferencia se debe a oscilaciones o variaciones aleatorias”. A veces uno quiere probar que nada ha cambiado.
Hipótesis Alternativa: La hipótesis opuesta a la hipótesis nula. Tiene el peso de justificar, validad, verificar, probar que se dio un cambio. Es la hipótesis que indica que las observaciones de la muestra han quebrado el patrón aleatorio y existe una explicación alternativa para el resultado.
Aquí es donde es útil el Estadio Azteca. La Hipótesis Nula es exactamente como explicar qué le pasará a México si juega en el “Coloso de Santa Úrsula”. El estado natural es que México NO pierda (puede ganar, puede empatar, pero no es normal que pierda). La Hipótesis Nula tiene a su favor el “Nivel de Confianza”.
El Nivel de Confianza se define como: el porcentaje de todas las posibles muestras que se espera que incluyan al verdadero parámetro poblacional. Un Nivel de Confianza de 95% significa que 95% de todos los intervalos de confianza incluyen el parámetro poblacional verdadero. Este es exactamente el caso si tomamos una muestra de todos los juegos de México en su casa. El resultado ACOSTUMBRADO es gane o empate, pero no derrota.
A la Hipótesis Alternativa le dejamos el restante 5% (que no es otro que nuestro α de la semana pasada, nuestro Error Tipo I, también llamado Nivel de Significancia). Y aquí es donde entra Costa Rica y el “Aztecazo” del 2001.
Comparación entre el “Aztecazo” y la determinación de las hipótesis estadísticas:
En resumen, cada vez que hacemos un estudio estadístico le dejamos a la Hipótesis Nula TODO el Nivel de Significancia para que “gane”, y a la Hipótesis Alternativa le damos lo que sobra, el Nivel de Significancia (o más directamente el valor de α).
Para terminar, la forma más rápida y sencilla de saber “quién gano” es leer directamente de su software estadístico el valor de p, o “p value”.
El “p value” es la probabilidad de obtener un valor del estadístico de prueba muestral que es al menos tan extremo como el encontrado en los datos de muestra (suponiendo que el valor hipotético es correcto). En lenguaje más cotidiano un “p value” más pequeño que α indica que la hipótesis nula es falsa. En inglés existe un mnemónico muy popular con la siguiente rima “when p is low the null must go”, una aproximación vernácula al idioma español es “cuando p es bajo la nula al carajo”… Todo se vale cuando se trata de entender estadística…
La siguiente tablita resume las decisiones que se toman con el “p value”
NOTA FINAL: Les recomiendo esta explicación para después que hayan asistido a su primera clase formal de pruebas de hipótesis, y también después de leer su texto de Análisis Estadístico. Si aún después de alimentarse con toda la teoría posible no han entendido completamente entonces prueben con la historia del “Aztecazo”. Verán como se les aclara de inmediato y posiblemente de por vida.
!Y este 11 de junio, pues que gane el que se lo merezca y que sea un gran partido!