Dispersion A

Diagrama de Dispersión

El Diagrama de Dispersión tiene el propósito de controlar mejor el proceso y mejorarlo, resulta indispensable conocer como se comportan algunas variables o características de calidad entre si, esto es, descubrir si el comportamiento de unas depende del comportamiento de otras, o no, y en qué grado.

El Diagrama de dispersión es una herramienta utilizada cuando se desea realizar un análisis gráfico de datos bivariados, es decir, los que se refieren a dos conjuntos de datos. El resultado del análisis puede mostrar que existe una relación entre una variable y la otra.

El estudio puede ampliarse para incluir una medida cuantitativa de tal relación.

Las dos variables pueden estar relacionadas de la siguiente manera:

  • Una característica de calidad y un factor que incide sobre ella.
  • Dos características de calidad relacionadas.
  • Dos factores relacionados con una misma característica de calidad.

¿ Para qué sirve el Diagrama de Dispersión ?

  • Indica si dos variables (o factores o características de calidad) están relacionados.
  • Proporciona la posibilidad de reconocer fácilmente relaciones Causa / efecto.

¿ Cómo se construye el Diagrama de Dispersión ?

Paso 1.- Recolectar n parejas de datos de la forma (Xi, Yi), con i = 1, 2, 3,…n donde Xi y Yi representan los valores respectivos de las dos variables. Los datos se suelen representar en una tabla.
Paso 2.- Diseñar las escalas apropiadas para los ejes X y Y.
Paso 3.- Graficar las parejas de datos. Si hay puntos repetidos, se mostrarán como círculos concéntricos.
Paso 4.- Documentar el diagrama.

Lectura y uso del Diagrama de Dispersión

La lectura se hace en base al tipo de relación entre los datos; lo fuerte o débil de la relación, la forma de la relación y la posible presencia de punto anómalos.

La relación entre los datos se denomina “correlación positiva” cuando a un aumento en el valor de la variable X le acompaña un aumento en la otra variable.

El caso inverso da lugar a la llamada “correlación negativa”.

dd1

El patrón de puntos puede asumir formas diversas, dependiendo de la relación que exista entre las variables. Si el patrón de puntos asume la forma (quizás aproximada) de una línea recta, se dice que existe una relación lineal entre las variables.

En ocasiones, algunos datos dan lugar a puntos anómalos, que se presentan separados del patrón de puntos. El usuario debe dejar fuera del análisis esos puntos, que quizás son debidos a lecturas equivocadas o a algún cambio en las condiciones del proceso, etc.

Pero se ganará conocimiento de este último al estudiar las causas por las que se presentaron los puntos.

Un Diagrama de Dispersión no dice nada de porqué existe la correlación, por lo que es imprescindible examinar la aparente relación entre las variables desde el punto de vista científico o técnico.

El Coeficiente de Relación Lineal.

El valor del Coeficiente de Correlación lineal de Pearson (r) proporciona una medida del grado de relación entre dos variables y se calcula mediante la expresión:

r = S (xy) / S(xx) S(yy)

donde:

S(xx) = ƩXi² – (ƩXi)² / n

S(yy) = ƩYi² – (ƩYi)² / n

S(xy) = ƩXiYi – ((ƩXi) (ƩYi))/ n

n es el número de parejas de datos. El término S(xy) se llama covarianza.

El Coeficiente de Relación Lineal.

El valor del Coeficiente de Correlación es:

|r| = < 1

Si r = +1 ó r = -1 se tiene entonces una correlación perfecta, lo cual significa que todos los puntos caen sobre una línea recta.

Un valor de r = 0 indicará la ausencia de relación entre las variables; entre más cercano esté el valor absoluto de r a la unidad mayor será el grado de correlación.

dd2

Ejemplo

A continuación se presenta una tabla en la que la variable X corresponde a la experiencia en semanas de cada uno de los empleados a los que se aplicó la prueba , y la variable Y al tiempo en minutos que tarda el empleado en capturar correctamente los datos de un reporte a la computadora.

dd3

El Coeficiente de Relación Lineal.

S(xx) = ƩXi² – (ƩXi)² / n = 90700 / 22 – (1270)² = 17386.36

S(yy) = ƩYi² – (ƩYi)² / n = 47.77 / 22 – (28.7) ² = 10.32

S(xy) = ƩXiYi – (ƩXi) (ƩYi) / n = 1481 – (1270)(28.7) / 22 = -175.77

El valor del Coeficiente de Correlación es:

r = S (xy) / √(S(xx) S(yy)) = -175.77 / √(17386.36)(10.32)

r = – 0.415 La correlación es negativa.

dd4

La ecuación de regresión lineal.

La regresión lineal es utilizada para determinar modelos matemáticos del comportamiento y relación de dos o varias variables interrelacionadas.
El modelo que se busca corresponde a la ecuación de la “mejor” línea recta que pasa a través de los puntos. Tal ecuación, denominada Ecuación de Regresión de Mínimos Cuadrados, es, en términos de las variables X y Y, la siguiente:

Y = a + b X

b = (nƩXiYi – (ƩXi)(ƩYi))/n ƩXi² – (ƩXi)²

a = (ƩYi – bƩXi)v/ n

Para el ejemplo anterior:

b = (nƩXiYi – (ƩXi)(ƩYi))/ ƩXi² – (ƩXi)² = ((22)(1481) – (1270)(28.7)) / 90700 – (1270) ² = 0.0025

a = ƩYi – bƩXi/n = 28.7 – ((0.0025)(1270)) / 22 = 1.15

Y = a + b X Y = 1.15 + 0.0025 X

Si deseas saber más sobre esta herramienta comunícate hoy con nosotros, o te invitamos a nuestros próximos entrenamientos en las ciudades de Monterrey, Querétaro , Guadalajara y/o Puebla en México. Para acceder a nuestro catalogo completo de cursos has click aqui.

comments powered by Disqus