Bueno, tomando en cuenta los recientes acontecimientos dados en nuestro país, donde tuvimos la mala fortuna que el técnico de la Selección Nacional renunciara a su cargo, pues inicia un nuevo proceso de reclutamiento y selección, eso sí, algo obligado de encontrar un nuevo técnico a nuestro Selección a las puertas de empezar las eliminatorias a Catar 2022.
¿La cuestión es, quién debe ser? ¿Qué características debe poseer? Y en fin, que cualidades debe tener este nuevo personaje que nos ayude a volver a creer que la Selección puede clasificar al próximo mundial.
Dado lo anterior, me he dado a la tarea de tratar de analizar el problema y a establecer la aplicación de algunas de nuestras técnicas estadísticas más potentes, con el único fin de hacer más objetiva la selección del candidato que ocupará el cargo de seleccionador nacional.
Resulta ser en la Estadística existe hace muchos años un campo muy interesante, llamado el Análisis Estadístico Multivariante. No es un campo muy común a las ingenierías o a la administración, de hecho, posiblemente muchos de nosotros no nos lo enseñaron en nuestras carreras universitarias, pero para los que somos black belt o máster black belt si nos debe ser conocido, dado que es parte del cuerpo de conocimientos BOK presente de la Sociedad Americana de la Calidad ASQ y por ende debemos dominarlos. Por otro lado, debo ser totalmente honesto que las técnicas del análisis multivariante también, como es lógico pensar, es terreno de nuestros amigos los estadísticos puros. Por lo tanto, decidí con base a mi conocimiento de este tema realizar el presente artículo y compartirlo con ustedes, y además de tratar de ayudar a seleccionar a los mejores candidatos y al posible futuro técnico, también me gustaría que usted aprenda una aplicación práctica de estas técnicas tan útiles, y que muchas veces por desconocimiento pasar desapercibidas pudiendo ser excelentes referentes para la toma de decisiones en los negocios entre otros campos.
Analizando la situación en cuanto a la selección de un nuevo técnico y claro está, no repetir los errores del pasado, pues lo lógico es pensar en una lista algo extensa de variables que deban cumplirse en alguna medida para los candidatos que se propongan al puesto. Por lo tanto, nuestro primer paso en nuestra aventura de buscarle técnico a la Sele es definir las variables más importantes a considerar. Estas variables fueron una suerte de tormenta de ideas con mi amigo y encargado de TI de PXS el Ing. Ariel Ortega y alguna que otra referencia obtenida de Internet, en especial la Comisión de Selecciones de la Federación Costarricense de Futbol , que nos regaló mediante la lectura de artículos de periódico en el proceso “Matosas” los 3 principales criterios de selección, además les hago la acotación que la Comisión es o era presidida por el Sr Erick Lonnis, por lo tanto el análisis multivariado no creo que sea su fuerte.
Las variables que escogimos entre lecturas y lluvias de ideas son:
Vamos a explicar brevemente cada una. Las 3 primeras variables fueron escogidas por cortesía del Sr Lonnis, en entrevistas hechas para medios de prensa nacional. Según leí, Erick Lonnis junto con los demás miembros de la Comisión, determinaron por alguna forma, que a los técnicos anteriores que les fue bien en los procesos de selecciones, tales como Jorge Luis Pinto o Alexandre Guimarães, que su conocimiento previo del medio futbolístico del país fue un aspecto determinante en su éxito como entrenadores de la Sele. A mi me parece una valoración en extremo subjetiva pero, aclaro que también la intuición, por mas parecida que sea a una cuestión irracional es de hecho una de las cuestiones mas “racionales” que puedan haber, pues es nuestro ADN y nuestro proceso evolutivo como seres humanos que ha permitido incorporar estos presentimientos en nuestro proceso de razonamiento cualitativo y advertirnos de peligros entre otros, por lo que esta plenamente validado por múltiples estudios científicos y por ende yo también lo avalo, así que Lonnis, vamos con ese!.
Segundo, pues el tema de liderazgos, y aquí no hay que inventarse el agua hervida para saber que el éxito en cualquier equipo de trabajo es tener lideres capaces, sobre todo tomando en cuenta la idiosincrasia del tico y los antecedentes de don Pinto con la Sele de Brasil.
Tercero, pues dice de nuevo don Erick Lonnis que otro tema fundamental es el manejo de la Prensa. Obviamente el tema de la comunicación es vital en cualquier entorno donde corresponde tener mucha interrelación con personas de muchos tipos, sin embargo, me pongo a analizar el reciente caso de Gustavo Matosas y me doy cuenta de que esta es una cualidad que es importante pero no determinante, y don Jorge Luis Pinto es evidencia de ello, sin embargo dejémosla en la ecuación. Advierto, al ser este un tema muy cualitativo optamos mi colega Ariel y mi persona valorarlo con una escala de 1 a 3, siendo 1 poca competencia en el manejo de la prensa y 3 muy buen manejo de la prensa y fuimos nosotros los que lo determinamos. Por cierto, los dos criterios anteriores también fueron valorados cualitativamente por nosotros 2, sin embargo, la recomendación para hacer este estudio mas robusto seria hacer una valoración a través de una técnica por ejemplo de multivoto con un panel de expertos donde se les pide hacer esta valoración.
Las siguientes 7 variables son más fáciles de determinar, pues que son variables cuantitativas continuas algunas, expresadas en tiempo o en dinero, otras son conteos, por ejemplo en cuanto al la cantidad de títulos ganados en su carrera por parte del técnico y otras son tan sencillas como la edad del técnico candidato o si fue jugador profesional o no (por cierto también cortesía de la Comisión de Selecciones pues una cuestión que se le criticó a Pinto mucho después del mundial de Brasil fue precisamente que no sabía tratar a los jugadores porque no sabía que era ser uno de ellos).
Entonces, cada una de las 10 variables seleccionadas las tuve que investigar en Internet, usando por supuesto, la vieja confiable, en este caso “WIKIPEDIA” que como ustedes sabrán, no es una fuente del todo fidedigna, por el tema que cualquiera puede editar esta información, sin embargo, a efectos de simplificar el estudio vamos a dar por valida la misma. He de resaltar que otros datos los obtuve de revisar artículos de sitios web, sobre todo periódicos en línea, sin embargo, si el estudio se tuviera que aplicar del todo, seria bueno considerar la recopilación de información de primera mano o lo que es lo mismo de “fuentes primarias” para garantizar una mayor calidad de la información.
Los candidatos
Los candidatos que seleccionamos para estar en nuestro análisis fueron producto de una tormenta de ideas de Ariel y mi persona, por lo que no hay ninguna magia estadística de por medio, los únicos dos criterios que debían cumplir era o no ser técnico de una selección en este momento o estar desempleado, por lo que técnicos de “clubes” sí son considerados en este análisis. Tal vez, a su gusto haya algunas ausencias importantes, pero pusimos, consideramos a los mas sonados en este momento, incluso algunos de estos candidatos posiblemente solo en decir su nombre sean descartados por usted, pero los consideramos para enriquecer el análisis como tal, a continuación, la lista de los convocados por PXS son:
Como pudo ver, nos pusimos creativos con los candidatos. Hay algunos que obviamente no serán nunca técnicos de la sele, por cuestiones eminentemente económicas, pero fueron considerados para enriquecer el análisis, además recuerde el viejo y conocido dicho, que lo barato sale caro, por lo tanto, el tema de salario no debería ser tan en extremo limitante. La Federación según la información que hemos recopilado ha puesto un tope salarial de 50 mil dólares mensuales al técnico, eso era lo que ganaba Matosas recientemente, sin embargo, vamos a ver que, en este mundo de los técnicos de futbol de nivel, 50 mil dólares son apenas “unos cinquillos”
Las recopilaciones de datos
Bueno con la ayuda de Internet logré darles a las 10 variables que explicamos anteriormente valores aplicándolo a cada uno de los 15 posibles candidatos, y he de decir que me tomó bastante tiempo hacerlos, lo más increíble es, que los que más costaron fueron precisamente los técnicos de nuestro medio costarricense.
Les voy a explicar las escalas de cada variable, de una vez adelanto que mi intención es defender hasta donde pueda, las variables del tipo cuantitativo continuo pues son mas confiables que las cualitativas sin embargo en algunas de mis variables van de este tipo, solo que las convierto a número para poder aplicarlas en mis análisis.
______________________________
[1] En parte por culpa de Ruiz, Navas y Borges y por Pinto que nunca fue jugador profesional
[2] Inspirado por el infame caso “Matosas”
[3] Inspirado en el “oh Rey Paté”
¡Vamos al futbol! (o lo que es lo mismo, veamos las estadísticas descriptivas recabadas)
Pues haciendo uso de mis habilidades sabuesas me construí la siguiente matriz “L” para poder plasmar los números de mis 15 candidatos y mis 10 variables, a continuación, los datos:
Parece inofensiva la tablita presentada, pero viera que laboriosa es de construir. Los 150 datos presentados por cruce de variables son datos hasta donde pudimos totalmente fidedignos, y algo de pasión futbolera de Ariel Ortega de TI de PXS y mi persona.
Esta tablita, por lo tanto, va a servir para dos cosas. Primero vamos a dejar claro algunos detalles, la decisión de cual es el mejor candidato siempre será cualitativa por parte de este servidor, sin embargo, donde me quiero desmarcar de Lonnis y compañía es de mi “argumento”. Para poder tomar esta decisión he decidido aplicar dos técnicas del análisis estadístico multivariante, a saber:
- El Análisis de Factores tipo R y tipo Q
- El Análisis de Clúster o Conglomerados
Utilicé como referencia principal el texto de los autores De La Garza, Morales y González llamado Análisis Estadístico Multivariante y el conocido Software MINITAB como soporte a mis cálculos.
He de decir, que esta es la parte mas interesante del estudio. El análisis de factores y el análisis de discriminante son técnicas estadísticas que tienen muchos años de existir. En otros tiempos no fueron tan populares por cuanto se necesitaba contar con un conocimiento “sólido” del Algebra Lineal y pues, no es tan común encontrar ese tipo de cualidades en ingenieros y menos en estadísticos como podrá recordar de sus cursos de la U[4]. Sin embargo, le tenemos buenas noticias, el gran avance de las computadoras ahora permite que con unos cuantos clics podamos procesar cientos de matrices algebraicas y obtengamos resultados rápidamente, solo que, hay que saber primero que le metemos al software y segundo cómo se interpretan los resultados.
______________________________
[4] Aquí es donde nos debemos responder aquella pregunta que nos hacíamos en la U, ¿Para qué diantres sirve toda esta matemática que nunca voy a usar en la vida? JEJEJE pues aquí hay una respuesta.
El procesamiento de los datos
Pues vamos a aplicar primeramente el Análisis de Factores para procesar la data. El Análisis de factores he de decir, no es fácil, tiene un importante grado de complejidad, de hecho, es una de las técnicas del multivariado más robustas. Como toda técnica estadística, para que sea confiable debe cumplir algunos supuestos previos antes de aplicar y también, debe ser adecuadamente interpretada para poder confiar en sus resultados. Voy a empezar a explicar que el Análisis de Factores es una técnica de reducción de variables. Esta reducción de variables es necesaria, para escenarios donde tenemos muchas variables y necesitamos poner atención en lo que realmente importa. En mi caso, al tener 10 variables pues me interesa determinar escenarios más reducidos donde pueda poner más atención a cuestiones criticas del proceso. Por lo tanto, el Análisis de Factores busca reducir información encontrando homogeneidad al interior de un conjunto de muchas variables para así formar grupos o factores. Muchas de estas variables que utilizaremos en este estudio pueden ciertamente estar correlacionadas formando el concepto de “dimensión”. Estas dimensiones son importantísimas como argumento para encontrar en nuestro caso a un técnico adecuado para nuestra sele.
Según De la Garza, Morales y Gonzales un factor desde la perspectiva matemática es una combinación lineal de las variables originales de la investigación y se puede representar por la siguiente ecuación:
Donde F es el factor o componente i de la observación k
A representa la importancia o peso que cada variable tiene con respecto al factor encontrado
X es la variable original
i es el numero del factor y K es el numero de la variable
Debemos también, cumplir algunos supuestos, que rápidamente mencionaré, la mayoría ya los he analizado por aparte y no los documentaré del todo en este artículo, para no prolongar excesivamente la lectura de este:
- Normalidad de variables
- Homogeneidad de varianzas
- Variables lineales
- A pesar de que se necesita que no haya ortogonalidad sí debe haber un poco de correlación en entre las variables independientes
Como notará tiene ciertos parecidos a las famosas ANOVAS como tales.
Brevemente también deseo explicar antes de presentar los análisis de datos que, el tipo de análisis de factores que se aplicó fue el Análisis de Factores tipo R y tipo Q por cuanto busco dos cosas. Los datos los arreglé de manera tal que las columnas sean las variables y los reglones los técnicos y busco precisamente agrupar dos cosas, variables y personas, así que de ahí la razón de usar R y Q[5].
Análisis de Factores, tipo R y Q, para variables o personas
El método del Análisis de Factores es muy laborioso, necesita que se apliquen diferentes tipos de variantes al arreglo de la matriz seleccionada. Como en vista de que nunca he trabajado estos datos, pues mi apuesta es empezar aplicando la técnica de lo básico a los más complejo. La recomendación por ende será aplicar como método de extracción de valores el método de “componentes principales” El método de componentes principales me permite aplicar el análisis de factores sin conocer de antemano la cantidad de factores existentes. La definición en esta primera ronda del agrupamiento de las variables en los factores será dada por coeficientes de correlación, por ende, la Matriz de factores realmente la debemos llamar Matriz de componentes. Otro detalle importante es la estandarización de las variables. Como lógicamente usted habrá visto, mis 10 variables tienen algunas diferentes unidades, algunas son dinero, otras son tiempo, y algunas son atributos, etc etc. Lo que debería hacer es o estandarizar variables para que puedan ser trabajables en las matrices de algebra lineal, o también, que es de hecho lo que hice, utilizar alguna técnica que no le importe mucho la estandarización dado que, en su proceso de calculo ya realiza esta estandarización en automático.
No voy a aplicar en esta primera ronda ningún tipo de rotación de matriz. Lo que significa lo anterior es que en muchas ocasiones las matrices construidas con los valores se pueden y deben rotar, con el fin de poder apreciar correlaciones más claras y puntuales que me permitan con mayor certeza determinar los factores deseados. A continuación, les muestro los resultados obtenidos en MINITAB:
___________________________
[5] También están los Análisis de Factores P, S, O y T
Pues lo que usted puede observar en los resultados anteriores, son muchos coeficientes de correlación que tratan de explicar la variación de cada variable y lo agrupa en factores. En este caso observe que el FACTOR 1 en el total de columna muestra un % de variación de un 0,348, interpretativamente hablando podemos decir que la variación de todas esas variables se puede explicar en un 34,9% por medio del factor 1. Pues no es la gran cosa, es fácil interpretar eso, lo que sí es muy interesante ver, es precisamente cuales variables forman parte del factor 1, ese factor que mi amigo Lonnis deberá tomar en cuenta para encontrar el próximo “Matosas”[6]
Observe que la variable que más correlaciona es la variable “Años de experiencia del seleccionador” para el que es muy importante, con un coeficiente de 0,893, seguidamente la Edad del técnico con 0,877 y la variable Experiencia mundialista con 0,601. Super interesante ver que aquí tenemos una clara muestra del poder de la técnica, tenemos un Factor que podemos llamarle “Años vuelo del técnico” todas relacionan variables expresadas en años, por lo que podemos concluir que el primer aspecto a considerar por Lonnis y compañía es la edad de los susodichos, por ejemplo, la experiencia de “Bolillo Gómez” seria por ende super buena para el puesto o de un Pekerman.
Vea que interesante también, que “Liderazgo” y “Manejo de Prensa” salen también fuertes con 37,2% y 37,5% respectivamente, y ambas están muy relacionadas, uno podría asumir por ende que para manejar prensa evidentemente debe tener liderazgo, y que según nuestro análisis de factores tiene mucho que ver con los años en la profesión.
El Factor 2 agrupa la variación de un 22,3% total, junto al Factor 1 tendríamos acumulado el 57,1% de la variación total del modelo (imagíneselo usando un diagrama de Pareto). En el Factor 2 vuelve a salir importante con un 55,6% la experiencia mundialista junto al manejo de la prensa y la relación previa con el País y; por una extraña razón matemáticamente hablando, se valida el hecho de que años generan un impacto importante a los resultados, lo que son malas noticias para Luis Marín y el Paté Centeno, que tienen poco en este factor.
El Factor 3 explica un 13,6% más de la variación del modelo, y acumula junto a los dos anteriores un 70,7%. Este Factor esta relacionando a “que haya sido jugador profesional” con respecto a “salario” y a “manejo de la prensa”. Considero que este factor hay que manejarlo con cuidado, dado que tiene relativamente poco peso en la variación total del modelo, con apenas un 13,6% pero me hace sentido que haber sido jugador profesional y tener un buen salario se correlacione en algo, salvo la excepción de “Special One” o de José Mourinho con sus escasos $ 3 millones de dólares mensuales de salario. No hay que perder de vista que hay un coeficiente negativo de – 0,64 con la variable de “relación previa con el país” por lo que más bien las dos variables que salieron altas se afectan por culpa de esta.
Por lo que en resumen tenemos tres panoramas (Factores):
- Contratamos prevaleciendo los años del técnico enfocado a experiencia como seleccionador y al buen trato con la prensa.
- Contratamos tomando en cuenta la experiencia en mundiales y eliminatorias y que haya tenido relación previa con el país o incluso con la CONCACAF.
- Contratamos (y no tan importante) con base al salario que podamos ofrecerle y a su buena prosa y sin tomar en cuenta la relación previa con el País. Interesante ver que este factor 3 suena mucho de hecho al “finado Matosas”
Los resultados de la Matriz de Componentes Principales se pueden interpretar bien a través de una gráfica de sedimentación:
[6] Dios quiera que no.
Lo que usted aprecia de 1 a 2 y a 3 es el impacto que tienen esos 3 factores al modelo en total. En la escala vertical se presentan los “eigenvalores” que son la variación o cantidad de información que cada uno de los factores logra captar del conjunto de variables. Por cierto, los coeficientes de correlación también los llamamos las “comunalidades”.
La siguiente gráfica relaciona de una forma simple el impacto de cada variable a los factores descubiertos 1 y 2 (el 3 no). Entre más larga es la raya más explica la variación, mismo tema que ya discutimos anteriormente:
Los factores del 4 al 9 no los discuto dado que agrupan el otro 30% de variación que falta, siendo solo el factor 4 digno de tomar en cuenta, pues acumula un 10% de variación, sin embargo, considero prudente usar solo los factores 1, 2, 3 y 4 y tener así el 80% Pareto.
Listo, si a este punto no esta aún “embotado” de tanto número, vamos a buscar “optimizaciones” vamos a cambiar del método de componentes principales a método de Máxima Verosimilitud, sabiendo que necesitamos apenas de 4 factores para explicar 80% de variación. Además, vamos ahora sí, a rotar la matriz utilizando la rotación “Varimax”. ADVIERTO, el hacer ésto no siempre da resultado, puede que haya que alternar otros tipos de métodos y otros tipos de rotaciones hasta llegar a algo que haga sentido, de momento con el “primer round” me siento bastante contento; se presentan los resultados a continuación:
Nuevamente, se esta avalando en el Factor 1 la Edad del Técnico y los años de experiencia como seleccionador como variables importantes, aunque para desgracia de la Federación Costarricense de Futbol también el “Salario” lo que significa que para tener buena experiencia hay que soltar billete. Además, observe el – 0,82 de relación previa con el País, que ciertamente es una afectación inversa que hace que la tesis de Lonnis y la Comisión no pueda relacionarse tanto con la experiencia y la edad. Por cierto, Factor 1 explicaría el 28,4% de variación, lo cual baja de nuestro escenario anterior de 34,8%.
El Factor 2 apuesta fuertemente otra vez por variables relacionadas a tiempo, la variable “Años de Experiencia”, “Experiencia Mundialista” y “Edad del técnico” manejan coeficientes arriba del 50% lo que hace de nuevo que este sea un factor fundamental. A partir de ahí hay 2 factores más que apuestan fuerte por el “salario” tema que sabemos la Federación tiene muy limitado y “la experiencia mundialista” que sí definitivamente como hemos visto es constante como variable del modelo.
Los cuatro factores explicados acá explican entonces el 68,4% de lo que se debería tomar en consideración, no es tan diferente de la primera matriz de componentes principales. Le muestro por curiosidad la grafica de sedimentación y de relación que generó “Máxima Verosimilitud” junto a “Varimax”:
¡El Zarpe! Análisis de Conglomerados
Me parece atinente para cerrar el presente artículo, agrupar los candidatos en “clústeres” o “conglomerados” con el fin de determinar grupo homogéneos según las variables investigadas y que también sean un argumento válido para seleccionar técnicos.
Rápidamente, la técnica del análisis de conglomerados es un método de interdependencia que estudia la relación entre tres o más variables a través de datos métricos, sin distinguir entre variables independientes y dependientes
Específicamente, permite identificar subgrupos homogéneos dentro de una población por medio de una minimización de la variación dentro del subgrupo y una maximización de diferencias entre los subgrupos (Garzón, 2014).
El análisis de conglomerados brinda posibles niveles de agregación, lo que brinda un indicio del número de coaliciones y la manera en que define la similitud entre dos organizaciones resulta útil para medir la compatibilidad de creencias a partir de la medida de distancia. La forma más común es la distancia euclidiana.
Para poder procesar los datos, hice una estandarización de la variable 4 “SALARIO”, pasando los dólares a una escala del 4 al 1 con el siguiente significado:
Los datos quedaron así:
Entonces, aplicando la herramienta de Análisis de Conglomerados de MINITAB procedí a parametrizar la herramienta aplicando el Método de Vínculos Completos y de Distancias Euclidianas pidiendo al menos 4 conglomerados, obteniendo e siguiente “DENDOGRAMA”:
Como se observa, es bastante claro la relación que hay entre técnicos, vea que Ronald González y Juan Carlos Osorio por increíble que parezca se parecen mucho en sus perfiles, tienen una similitud de 63,84%, así que, mejor contratemos a Ronald, que además de ser más económico es costarricense!
Walter Centeno y Hernán Medford son también bastantes similares junto a Hugo Sánchez y el Piojo Herrera. Estas 3 parejas de candidatos son similares entre 43% y 71%. Ahora bien, Ronald, Juan Carlos, Paté, Medford, Hugo, Piojo, y Dely Valdés forman todos un Conglomerado de un máximo de 47% de similitud.
Pinto, Arena y Restrepo son otro conglomerado con entre un 54% y un 61 % de similitud, y no es casualidad, son técnicos que conocen CONCACAF, parecidos en muchos aspectos.
El Bolillo y Víctor Manual Vucetich también forma otro conglomerado con similitudes entre 41% y 54%, otras dos buenas opciones, aunque prefiero al Bolillo por su vasta experiencia en selecciones, argumento que sustento en el Análisis de Factores presentado anteriormente.
Finalmente, José Mourinho tiene sobradas razones para su apodo de “SPECIAL ONE” o el “Especial” siendo un único conglomerado diferenciado de todos los demás 14 candidatos.
Hice el mismo ejercicio, aplicando “Método de Promedio” y aplicando “Distancias con Pearson” y me dio otro Dendograma muy similar por lo que me quedo con mis mismas conclusiones.
Conclusiones
Como puede observar, la cuestión de escoger técnico de la Sele no es nada fácil, definitivamente no solo es importante la buena intuición, sino también en apoyarse en herramientas que permitan objetivamente corroborar nuestras sospechas como investigadores y darle objetividad a lo que estamos haciendo, al fin y al cabo quien iba a creer que contratar a Ronald González y a Juan Carlos Osorio fuera casi lo mismo, o incluso que se deba tomar como primer factor de análisis las relaciones que las variables de experiencia puedan tener con respecto a los candidatos?
En todo caso, me parece muy importante el poder compartir esta técnica con todos ustedes, esperando que en sus futuras faenas estadísticas en sus empresas las puedan, a similitud con lo que yo hice aplicarlas para facilitarse la toma de decisiones y porque no, generar más valor en los procesos.
Por el momento éste es mi aporte, espero verlos a futuro en una nueva entrega del Blog de PXS, y me despido con algo que esta muy de moda, jajajaja como dicen por ahí:
#rodolfovillalobos #lonnis #teodiomatosas