¿Cómo identificar la distribución de probabilidad de mis datos?

 

En este blog hablaremos sobre los tipos de distribución que existen y cómo identificar la que más se ajuste al comportamiento de mis datos. Este tema es fundamental dentro del programa de Certificación Green Belt. Sin duda una herramienta poderosa que te ayudará a llevar tu análisis estadístico hacia una correcta interpretación. 

 

Paso 1.- Extraer, depurar y organizar los datos del proceso. 

Si bien lo ideal sería usar los datos tal cual se obtienen de las mediciones, es recomendable revisar de forma manual la base de datos recolectada y depurar las muestras que por obviedad no deben ser consideradas. Ejemplos: Datos en ceros o negativos (Si aplica),  datos con cantidades excesivas, etc.

Cómo identificar la distribución de probabilidad de mis datos

Paso 2.-  Correr la prueba de datos atípicos usando Minitab.  

Minitab es un software estadístico que te recomendamos usar para el ejercicio.
Lo puedes descargar en su sitio web:
https://www.minitab.com/en-us/

Introducimos los datos en Minitab dentro del Menú / Estadística Básica / Prueba de Valores Atípicos

Cómo identificar la distribución de probabilidad de mis datos

En los resultados podemos comprobar la hipótesis dada la prueba de significancia P > 0.05  por lo que podemos decidir omitir esa muestra o no.
En este ejemplo aceptamos hipótesis alterna; concluyendo que contamos con un valor atípico y omitir en análisis posteriores

Cómo identificar la distribución de probabilidad de mis datos

Paso 3.-  Identificar la distribución  


Introducimos los datos dentro del Menú; Estadística / Herramientas de Calidad / Identificación de la distribución individual

Cómo identificar la distribución de probabilidad de mis datos

En los resultados podemos comprobar la hipótesis de la prueba de bondad de ajuste dada la prueba de significancia P > 0.05; Identificando la distribución que tenga el valor más alto.

Cómo identificar la distribución de probabilidad de mis datos

En este ejercicio encontramos que los datos tienen una distribución Exponencial de 2 Parámetros. Recordemos que las transformaciones son nuestras últimas opciones.

 

Te recomendamos ver nuestro blog donde explicamos Que es un Green Belt y como obtener tu Certificación Green Belt

https://proanalytics.mx/certificacion-green-belt-mexico/

 

En Pro Analytics somos una empresa de consultoría, capacitación y entrenamiento Six Sigma en México y expertos en Lean Seis Sigma. Nosotros te guiamos en el proceso de certificación. Contamos con Cursos de Herramientas Seis Sigma. Pregunta por nuestros cursos y niveles.

  • Curso SPC / Curso Control Estadístico de Proceso
  • Cursos Herramientas de Calidad