Serie Las 7 Herramientas de la Calidad. No. 7
Con el histograma iniciamos el recuento de las herramientas de mayor peso estadístico. Excelente para entender si una variable importante de un proceso está dentro de especificaciones, y para visualizar la forma de la distribución de los datos. Gracias a Inglaterra por este importante invento.
DEFINICIÓN Y USOS
El histograma muestra cuantos datos de una variable de interés ocurren en un rango específico.
Se usa para:
- Datos numéricos.
- Ver la forma de la distribución de datos, especialmente para ver si esa forma es aproximadamente normal.
- Ver si un proceso está dentro de especificaciones.
- Ver si un proceso ha cambiado en dos momentos específicos del tiempo.
- Determinar si los resultados de dos o más procesos son diferentes.
EJEMPLO
Se buscaron en internet las estaturas de 104 futbolistas de los cuatro primeros lugares del futbol de España (Liga BBVA) al 29 de enero de 2017 (Real Madrid, Barcelona, Sevilla y Atlético de Madrid). Se generó un histograma usando StatSolver con el siguiente resultado:
Es fácil ver que el promedio está entre 179.5 cm. y 184.5 cm. que corresponde a la barra más alta. También se puede ver que hay muy pocos jugadores pequeños (menos de 169.5 cm.) y también muy pocos jugadores de más de 194.5 cm. Precisamente la representación visual de los datos es la gran virtud del histograma.
PASOS PARA HACER UN HISTOGRAMA
- Defina la variable en estudio y la forma de medir y recolectar los datos.
- Recolecte al menos 50 datos que correspondan al mismo periodo de tiempo, con las mismas características, y de forma consecutiva.
- Determine el número preliminar de barras usando un número cercano a √n, donde n es el número de datos. Ajuste el número de barras hacia arriba o hacia abajo según su juicio. Nunca haga menos de 4 ni más de 20 barras
- Determine el número de rangos dividendo el total de datos entre en número de barras escogido. Procure utilizar un decimal más que los datos en los límites de rango para que así ningún número quede exactamente en un límite. Ajuste según sea necesario.
- Determine el número de datos (frecuencia) que pertenece a cada celda o categoría.
- Dibuje los límites de celda en el eje X.
- Complete la altura de la barra con el número de datos (frecuencia) obtenido en el paso 5.
NOTA: Puede resultar tedioso hacer los histogramas a mano. Las aplicaciones estadísticas de mayor uso como Excel, StatSolver, Minitab, JMP o R, fácilmente permiten hacerlos como en el ejemplo anterior.
RECURSOS Y PLANTILLAS
El menú de “data analysis” es el recurso más inmediato a disposición para hacer un histograma. Aquí puede seguir los pasos para activar la herramienta sino la tiene ya activada. Además de los softwares indicados anteriormente también puede seguir paso a paso esta guía para hacer un histograma a mano.
ORIGEN DEL HISTOGRAMA, UN LEGADO DEL IMPERIO INGLÉS
La palabra histograma se compone de las raíces griegas “istos” (mástil, poste) y gram-ma (algo escrito). Que quede claro que no constituía una palabra compuesta griega como tal, sino que fue el gran estadístico inglés Karl Pearson (1857 – 1936) quien acuñó el término. Pearson dio una serie de conferencias en 1892 con el nombre “La Geometría de la Estadística” y fue ahí donde utilizó por primera vez el nombre.
Karl Pearson
El antepasado más directo del histograma es el gráfico de barras. La primera referencia a los gráficos de barras data del año 1786 en el libro “The Commercial and Political Atlas” del economista político escocés William Playfair (1759 – 1823). Las ilustraciones de Playfair bien se pueden considerar los primeros infogramas.
William Playfair
Ilustraciones del libro The Commercial and Political Atlas (1786)
Cuantas veces no hemos hecho un histograma. Nunca se hubiera imaginado Pearson que su invento de 1892 llegaría a ser tan usado por la comunidad de calidad y mejora continua.