“Jefe!!! Ya le tengo el reporte: Promedio 46.19, Desviación Estándar 2.51, Cuartil 3 es 48.3. Ah, jefe, y “la data” no es normal…”
En la primera parte indicamos que es imposible tomar una decisión con esta “estadística descriptiva”. Y que conste que pudo ser peor: “Jefe!!!! Ya le tengo el reporte: Promedio 46.19…” ¿Cuántas decisiones erróneas se habrán tomado en el mundo con un simple e incompleto promedio?
Desarrollemos este ejemplo desde cero, pregunta, contexto, cuente una historia y dibújela.
LA PREGUNTA
¿Por qué algunas veces el diámetro de la pieza JGF-MD-001 sale más pequeño?
EL CONTEXTO (simplificado)
La especificación es 48 mm +/- 2 mm, estamos usando materiales de dos proveedores, toda la producción se hace en un sola máquina y en un turno. El mismo operario maneja la máquina siempre.
Con base en el contexto tomaremos una muestra de 40 unidades manteniendo identificada la fuente de material.
LA HISTORIA (incluyendo LA GRAFICACIÓN)
Los datos tomados son los siguientes:
Note que es imposible tomar una decisión solamente con los datos. En algunas empresas se acostumbra hacer consultas a grandes bases de datos (queries) sin filtro, sin contexto, confiando a ciegas en el resultado del query.
Vamos primero a hacer una estadística descriptiva convencional y luego ver el espeluznante resultado.
No hay nada de malo con la estadística descriptiva como tal, pero note que no dice nada. No estamos comparando con la especificación, no estamos manteniendo ninguna información sobre el hecho de que estamos midiendo diámetros en milímetros. El resultado del test de Anderson Darling (una prueba de distribución normal muy usada para muestras pequeñas) indica que los datos no son normales. Pero, ¿qué pasó con los dos materiales?, ¿dónde dejamos perdida esa importantísima información de contexto? Por supuesto que el jefe, o el gerente, o el dueño de este proceso no usarán este resumen descriptivo para tomar su decisión, simplemente no sirve.
EL CONTEXTO CORRECTO
Recuerde que los datos son diámetros en milímetros con una especificación de 48 mm +/- 2 mm y que se han tomado de piezas producidas a partir de dos materiales diferentes.
Vean el resultado de separar los dos materiales con un “Dot Plot”.
Observe los elementos que agregan contexto: la especificación y la separación de los datos de los dos materiales.
Ahora sí tenemos pistas para tomar una decisión.
INFOGRÁFICO Y DECISIÓN FINAL
Fácilmente se concluye que el material 1 proveniente de Goodenough Inc. es la fuente del problema de las piezas JGF-MD-001 más pequeñas.
Otras herramientas de inferencia estadística permitirán validar aún más este resultado. Como los datos, una vez separados, son normales es posible hacer índice de capacidad de proceso, prueba t de dos medias, entre otras.
NOTA: El procesamiento estadístico se hizo con Statsolver.
StatSolver es una herramienta de Análisis Estadístico y Administración de Proyectos de Mejora Continua que funciona como un “add in” para Excel. Si desea hacer una prueba puede bajar el demo a la dirección www.statsolver.net/release.