Los datos describen las características de los productos, procesos o servicios. Estas características pueden dividirse en datos cualitativos y cuantitativos. Para el análisis basado en datos en Lean Six Sigma, es importante estar familiarizado con los siguientes tipos de datos y distribuciones.
La distribución binomial es una distribución discreta que representa la frecuencia de características con dos resultados posibles. Por ejemplo, puede utilizarse para modelizar el número de defectos en un proceso de producción.
La distribución poisson es un caso especial de la distribución binomial. Describe el número de errores por unidad que se producen en una unidad determinada.
La distribución hipergeométrica se utiliza cuando se extraen muestras de poblaciones pequeñas sin reemplazo. Un ejemplo son los números de lotería.
La distribución normal es la función de distribución más importante para los datos continuos. La mayoría de los métodos estadísticos se basan en datos distribuidos normalmente.
La distribución log-normal es inclinada a la izquierda y sesgada a la derecha, y no toma valores inferiores a 0. Se utiliza a menudo para describir tiempos de proceso.
La distribución Weibull es muy flexible en su forma. Mediante los valores de los parámetros, la curva puede ajustarse para adaptarse a diversos patrones. Algunos ejemplos son los análisis de vida útil.