El análisis estadístico y el procesamiento de datos no son fines en ellos mismos. Cada vez que utilizamos estadística estamos buscando un resultado que nos permita explicar un fenómeno con el fin de tomar una decisión. En el año 2018 un grupo de reconocidos expertos en el tema decidieron formar la International Statistical Engineering Association (ISEA, Asociación Internacional de Ingeniería Estadística) con el fin de promover la unidad, la eficacia del esfuerzo y la conducta profesional ética entre quienes se dedican a la teoría y práctica de la ingeniería estadística. La visión del grupo es:
“Un mundo que se basa en la ingeniería estadística para resolver problemas complejos no estructurados.”
¿Qué es ingeniería estadística?
La ingeniería estadística es la disciplina dedicada al arte y la ciencia de resolver problemas complejos que requieren datos y análisis de datos. Estos problemas casi siempre son desestructurados y típicamente grandes, cruzando varias disciplinas. Generalmente vienen desestructurados y, por lo tanto, parecen un “desastre”. La clave es cómo proporcionar suficiente definición y estructura para crear un camino de solución razonable hacia una solución verdaderamente sostenible.
El conocimiento en herramientas que obtenemos de la universidad difícilmente se convierte en solución de problemas. Requiere de tiempo y experiencia aprender la naturaleza iterativa los métodos estadísticos por medio de los cuales vamos entendiendo cada vez más el problema de turno y nos vamos acercando a su solución.
Roger Hoerl y Ron Snee, conocidos expertos estadísticos, proponen las siguientes fases para un proyecto de ingeniería estadística:
Desafortunadamente es común ver a los ingenieros saltar directamente al paso 5 (desarrollar y ejecutar tácticas) sin definición del problema, sin contexto, y como dice Javier González CEO de PXS “apretando botones en algún software para ver si pasa algo.”
Igualmente, el Dr. T. Steven Cotter, profesor de Old Dominion University y líder de opinión de la División de Estadística de ASQ, indica que los ingenieros saben resolver problemas, pero no saben definirlos. Agreguemos que los jefes (gerentes, directores) en realidad tampoco saben qué es lo que están pidiendo. Mediante ingeniería estadística ambas partes, estratégica y táctica, participan de la definición, contextualización y solución de la situación en análisis.
En la siguiente figura se clarifican aún más los elementos de un proyecto de ingeniería estadística.
Cabe destacar el papel de la exploración y visualización de datos en dos momentos de la ejecución. Primero en el paso 3, Entender el Contexto. Además de entender también aprovechamos para limpiar, clasificar, explorar, y presentar los datos. Comprendemos su “pedigree” (el proceso por el cual los datos fueron generados). Es lo que hacemos, por ejemplo, en la etapa de Medir de un proyecto DMAIC. Y nuevamente la visualización se vuelve monumentalmente importante en el paso 5, cuando explicamos el resultado de nuestros modelos.
Los procesos centrales
Las herramientas estadísticas se utilizan en un orden particular:
- Adquisición de datos, incluyendo cuestionarios y experimentos.
- Exploración y visualización de datos.
- Construcción de modelos.
- Sacar inferencias (aprender) a partir de modelos.
- Implementación y sostenimiento de la solución.
Ingeniería estadística versus ciencia de datos
Muchos de los problemas de ciencia de datos son también problemas de ingeniería estadística, hay dos diferencias importantes a considerar. Primero ciencia de datos utiliza grandes cantidades de datos (desde millones hasta miles de millones), que además pueden ser muy complejos, mientras que la ingeniería estadística trabaja con datos más concentrados y muestras estadísticamente calculadas. La segunda diferencia es que la ciencia de datos es más de naturaleza predictiva mientras que la ingeniería estadística se enfoca en la explicación de los datos.
Por supuesto que ambas disciplinas se complementan y comparten espacio y herramientas como se observa en la siguiente figura.
Es un buen momento para revisar cómo está haciendo estadística, si su método consiste en encender su software, meterle algunos datos, y probar con algunas de sus herramientas favoritas, considere la ingeniería estadística como la forma de hacerle upskilling a sus habilidades de análisis.
E!