Muchos nos preguntamos, principalmente durante estas fechas, ¿qué tan válido es pensar que los números favorecidos realmente responden a un criterio de igualdad a la hora de salir favorecidos? Sí nuestra suerte aumenta con motivo de nuestros actos, algunos algo racionales pero sin lugar a duda muchos influenciados por nuestra intuición o simplemente por una buena “cávala” que nos haga sentir más ganadores de lo normal.
En general jugar lotería es un tema interesante, particularmente en nuestro país tiene además de una connotación tradicional navideña también un componente social muy importante, dado que las ganancias son para fines sociales. Sin embargo, en este artículo queremos abordar el tema de la lotería, desde una perspectiva más “estadística” pues así podremos ver, si seguimos enfocándonos en nuestra suerte o por el contrario, hay una forma de acercar algo más de suerte a nuestra probabilidad de pegarnos un buen dinero para estas fiestas.
Muchos hemos escuchado diferentes estrategias para jugar la lotería, no es por nada que lo jugoso del premio navideño seduce a cualquiera, desde estratos sociales muy humildes hasta otros que pareciera ya no les hace falta ese dinero, sin embargo jugar es jugar y vale la pena repasar algunas de estas estrategias; yo en lo particular quiero proponer 3 de esas estrategias, que año a año uno escucha, veamos:
1-La más básica, que todos los números tengan la misma probabilidad de salir favorecidos
2-La típica, más jugado que el 00.
3-La famosa, los números bajos son los que más salen
Para poder determinar si la Junta de Protección Social es justa en sus sorteos, vamos a proceder a analizar primero descriptivamente los datos, a fin de ver cómo se comportan. A este punto queremos agradecer a nuestros buenos amigos de la Junta de Protección Social, el Sr. Milton Vargas, gerente general y su esposa Connie Chacón, por facilitarnos la información.
Contamos para nuestro estudio con los números ganadores de los sorteos de los domingos, desde el 2 de enero del año 2000 hasta el 3 de marzo de 2013, incluidos los “gordos navideños”.
Tenemos factores que podemos inicialmente considerar afectan las probabilidades de que uno u otro número tengan más chance de salir, algunos de ellos podrían ser:
1-Forma en que se revuelven las bolitas por el tombolero.
2-Dimensiones esféricas de las bolitas, digamos que algunas bolitas por sus “aspectos aerodinámicos” pueden irse más fácilmente al “huequito” de la tómbola (no es cierto pero todo vale…).
3-Peso de cada bolita, pues obviamente las bolitas son manufacturadas y por ende responden a comportamientos influenciados por tipos de materiales, maquinados, etc.
Parece ser que tenemos bastante información, empecemos por hacer algo bastante inofensivo, realicemos un histograma de los números favorecidos, como les dije, tenemos más de 10 años de numeritos favorecidos, veamos que nos dice el histograma; recordemos que lo que andamos buscando es comprobar que los números favorecidos, en teoría deberían todos salir en la misma frecuencia, y esto claro está, seria señal para poder decir que los números y los sorteos, no tienen “truco”.
Bueno, como observamos empezamos con problemas, si estamos partiendo del hecho de que el histograma lo que debería mostrar es que todas las barras, tienen la misma frecuencia pues parece que el histograma no es tan concluyente. Si vemos, pues parece ser que la clase o intervalo entre los números 64 y 76 revelan una frecuencia de 62 ocasiones favorecidos, y si hablamos de los números del 97 hacia arriba todavía menos favoridos (¿será acaso esa la razón del porque los números altos se venden poco?).
Como sabemos, el hecho que debemos comprobar, es que todos los números salen con la misma probabilidad, y entonces, deberíamos estar ante un histograma que debiera ser muy parecido a un “rectángulo”. Los histogramas que son así, son los que nos refieren a un tipo de distribución de probabilidad discreta llamada “la distribución uniforme”, y sí, es correcto lo que piensa, es la misma que gobierna a los dados, a los naipes, y a otros juegos de azar clásicos, no por nada es “lotería”.
Entonces, la pregunta es, a la luz de nuestro histograma, ¿podemos empezar a creer que la Junta nos juega trampa? Para determinar ésto, vamos a echar mano a los muy conocidos “test de bondad de ajuste”. Los test de bondad de ajuste permiten determinar el ajuste que tiene un conjunto de datos a un comportamiento determinado y conocido, que es como usted supone el de una distribución uniforme de probabilidad. Al fin y al cabo queremos ver si buscamos abogado para poner en aprietos a la Junta por jugar con nuestros sentimientos de millonarios en potencia, o por el contrario, estamos ante una situación de pura mala o buena suerte.
Uno de los test más conocidos para comprobar comportamientos de conjuntos de datos a distribuciones de probabilidad, es el test “Chi cuadrado”. Este test nos permite comparar los valores observados que obtenemos en nuestra muestra o población contra los valores “esperados” que deberían darse, según el tipo de distribución que espero encontrar, algo así como que usted se imagine, que vamos a ir a comprar una camiseta para nosotros, y usted va a una tienda y pide diferentes camisetas de diferentes tallas (recuerde que para estas fechas usted ya inicio con los tamalitos de diciembre y puede que haya empezado a aumentar sus tallas). La bondad de ajuste entonces, según nuestra analogía se dará si logra encontrar una camiseta que le “ajuste” a su cuerpo perfectamente. Si por el contrario, la camisa le queda “floja” o le queda como modelo de ropa interior (muy ajustada) pues nuestra bondad de ajuste no será buena y por ende, tendremos que descartar que nuestros datos se comportan según nuestra hipotética “distribución de probabilidad uniforme”.
Para ponerle un poco más de emoción estadística, empecemos por plantear una prueba de hipótesis, que va a ser:
H0 = Nuestros datos se comportan según una distribución uniforme.
H1 = Nuestros datos se comportan de otra manera.
Nuestros datos los hemos agrupado mediante Excel, y hemos obtenido las frecuencias “observadas” (los datos los dividí en cuatro grupos solo a efectos visuales, nada en especial).
Vamos a aplicar el test Chi cuadrado, que se calcula mediante la siguiente ecuación:
Donde “o” representa la frecuencia observada para cada número favorecido en nuestros 680 sorteos dominicales, y “e” será la frecuencia esperada, algo así como si antes de tirar un dado que esté hipotéticamente balanceado, 60 veces, deberíamos esperar que cada número del 1 al 6 salga unas 10 veces por parejo. Esto entonces lo representamos mediante la siguiente tabla de frecuencias esperadas, que la calculamos mediante la división de 680 sorteos entre 100 números (sí, 100 números, acuérdese que el 00 juega y el 100 no). Eso da 6,8 por lo que tenemos la siguiente tabla de frecuencias esperadas:
Necesitamos comparar nuestro valor de chi cuadrado obtenido de los datos “prácticos” contra un valor critico teórico que nos permita determinar si los datos ajustan o no ajustan, o lo que es lo mismo, si la camiseta le queda bien (distribución uniforme) o no; y para no ponernos muy sofisticados hagámoslo con un típico nivel de confianza de 95%, por ser test chi cuadrado acuérdese que este valor lo extraeremos de la tabla de valores de la distribución chi cuadrada, por lo tanto tendríamos:
Nivel de confianza (1-α): 95%
Grados de libertad: k-1: 100 números – 1 = 99
Por lo tanto tendríamos, a través de STATSOLVER:
Chi cuadrado Distribution Calculator |
|
Degress of Freedom |
99,0000 |
Significance Level |
5,00% |
Chi Square Value |
123,2252 |
Para que podamos determinar si los datos ajustan entonces nuestro valor calculado de chi deberá ser menor a 123.2 que es el valor critico de prueba, de lo contrario si nuestro valor de chi cuadrado es mayor pues concluiremos que los datos no ajustan, y tendremos armas suficientes para demandar a nuestros buenos amigos de la Junta de Protección Social (es broma, simplemente véalo como una encomiable labor social de ayuda que usted pierda). Bueno, vamos a los números, el valor de Chi práctico que obtenemos lo calculamos así:
Como usted sabe, son 100 números, entonces calculamos cada “ajuste” como la resta del valor observado menos el esperado elevado al cuadrado y dividido entre el valor esperado, por ejemplo para el numero 00 tenemos que en los 680 sorteos salió 4 ocasiones y esperábamos según nuestra suposición de “distribución uniforme” que saliera 6,8 veces (680 sorteos entre 100 números) por ende, ese primer “ajuste” nos dá 1,15. Lo mismo realizamos con cada uno de los 99 números restantes, obteniendo la siguiente tabla:
Si tomamos todos estos datos y los sumamos, obtenemos el valor de estadístico práctico chi cuadrado que es 83,26, gráficamente se verá así:
Ya para terminar, en el mundo de la estadística y la probabilidad como todo en la vida, hay siempre otras formas de comprobar nuestras conclusiones, eventualmente sería recomendable calcular con algún paquete estadístico un “valor p” para estar más seguro de la conclusión de ajuste, sin embargo nuestros valores de chi difieren significativamente entre ellos, uno es 83,26 y otro 123,22. Sí estos datos hubieran sido algo cercanos entre sí, si sería recomendable utilizar algo más “poderoso” para descartar posibles errores, una recomendación podría ser utilizar un test llamado “prueba de Geary” que se basa en la determinación de un cociente de dos estimadores de la desviación estándar de los datos que tenemos y calcular un estadístico teórico comparativo con el valor de “z” obtenido; sin embargo eso ya es otra historia.
Y si aún se siente suertudo para este 2014, y quiere desafiar a los dioses de la estadística pues aquí le dejamos algunos hechos importantes:
1-La probabilidad de que salga favorecido con el premio mayor de la lotería, tomando en cuenta que son 100 números y 1000 series (sí, recuerde que no es solo pegar número que ya de por sí es difícil) es de 100 números por 1000 series, por lo tanto hay 100 000 posibilidades, y si toma en cuenta que se saca 1 solo numerito con serie entonces tendríamos 1/100 000, lo que nos deja en una probabilidad de que usted se haga millonario de 0,001%, sin embargo no se ponga triste, como la Junta saca 2 emisiones por lo general sus posibilidades aumentaron a 0,002% (¿nada mal verdad?).
2-En nuestros análisis de los demás números concluimos en la estadística descriptiva que la MODA es 12 por haber salido 14 ocasiones favorecido, por si quiere jugarlo a pesar de que ya sabe que los datos son uniformes y el 00 apenas ha salido 4 ocasiones, así que descartado el lema “más jugado que el doble cero”.
3-Las series se comportan igual, por lo que lamentamos contarle que no hay alguna tendencia a salir algo más que otro.
4-La cávala de que los números bajos salen más no es significativamente cierta, a pesar de que el histograma pareciera sugerir eso, principalmente entre los números 00 al 43, además de 86 a 97 y en las series del 00 al 201, del 300 al 403.
Finalmente el autor hace la advertencia que este es un ejercicio probabilístico y no se hace responsable por las “inversiones del aguinaldo” en comprar lotería sin retorno alguno. Como logró ver, no hay base para creer que un número sale significativamente más que otro, todo cae dentro de las probabilidades, o que tan bueno sea ese sueño que tenga, donde un ser querido que ya no está le dice cual número jugar, o que vea en el parabrisas de su carro la evaporación y las gotitas de lluvia dibujando curiosa y extrañamente el número 27.
Al final recuerde es simplemente un juego, y como dicen los amigos de la Junta de Protección Social en su lema tradicional, “el único ganador es… Costa Rica” aunque usted no pegue nada. Mucha suerte en el próximo sorteo y felices fiestas!!!
Autor: Ing. Franklin Acuña Arias
SSBB, SSGB, CMQ, Course Owner PXS