Professional Documents
Culture Documents
Continuamos con las herramientas de análisis y priorización de problemas, y hoy vamos a conocer una
de las herramientas más utilizadas: El diagrama de dispersión o gráfico de dispersión. No por nada
se considera una de las 7 herramientas básicas de calidad. Es quizá uno de los gráficos que se
aprenden de primero en formación estadística, así que ya tienes una idea de su importancia.
Vamos a comprender qué es un diagrama de dispersión, cómo se hace y por supuesto, un ejemplo de
aplicación para garantizar el aprendizaje, es el tema de hoy, para la gestión del negocio.
Antes de responder este interrogante, es necesario dar respuesta a qué es dispersión. La definición de
dispersión tiene múltiples respuestas, como bien nos muestra wikipedia: Dispersión. Nos quedamos
con la definición matemática:
Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor
medio.
A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de
estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc.
Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de
correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras
palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué
tan independientes son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a
la relación que exista entre ellas, definimos su tipo de correlación.
Correlación positiva
Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una
relación proporcional. Por ejemplo para un vendedor de carros, si él vende más carros (variable 1), va a
ganar más dinero (variable 2).
Correlación negativa
Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que si una
variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo para la
construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1), menos
tiempo se necesitará para tenerlo listo (variable 2)
Correlación nula
Si no encuentras un comportamiento entre las variables, existe una correlación nula.
r=1
La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en una proporción
constante. Es una relación directa, por eso si trazamos una línea de ajuste esta va pasar por todos y
cada uno de los puntos.
0<r<1
Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El grado de cercanía de
1 define qué tan directa y proporcional es la relación entre ambas variables, por ende entre más cerca
esté de 0, más débil será su correlación negativa.
r=0
La correlación es nula, es decir que no existe una relación lineal entre ambas variables. Qué tal si
pruebas buscando otro tipo de relación.
-1 < r < 0
Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El grado de cercanía
a -1 define que tan inversa y proporcional es la relación entre ambas variables, por ende entre más
cerca esté de 0, más débil será su correlación negativa.
r = -1
La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en proporción
constante. Es una relación directa e inversa, por lo tanto una línea de ajuste va a tocar todos los puntos
graficados.
Un ejemplo más claro de todo lo mencionado lo muestra Wikipedia en una imagen: Tipos de
coeficiente de correlación
Imagina que una litográfica está abriendo una nueva área de producción para la impresión de posters,
y en este momento se encuentra haciendo todos los ensayos y pruebas para determinar la cantidad de
tinta de cada color que deberían tener las maquinas.
Como prueba inicial, han decidido establecer la relación de errores de impresión según el grado de
llenado de los recipientes de tinta de la máquina.
Para el paso 3, comenzamos a recolectar las variables. En nuestro caso, el departamento de control
de calidad hace 50 corridas o pruebas durante 5 días continuos.
Los resultados, a continuación:
Cantidad de errores según el grado de
tinta
Para el paso 4 ubicamos los ejes según las variables que tenemos. Al estar el número de errores
influenciado por la cantidad de tinta, lo ubicamos como el eje y. Por consiguiente, el eje x es la cantidad
de tinta. Ahora sí, hacemos el gráfico de dispersión.
Paso 6: Analizamos. Evidentemente hay una relación positiva fuerte entre la cantidad de tinta con la
que se carga el tubo de la máquina y el número de errores generados en la impresión de los posters.
Un paso siguiente para un problema de este tipo, sería buscar la forma de aprovechar la capacidad
restante de la máquina, por ejemplo usar más tubos y más pequeños.
Plantilla en Excel diagrama de dispersión
Una plantilla en Excel en la cual únicamente tendrás que digitar los datos de tus dos variables. De
forma automática obtendrás tus daros representados en un gráfico de correlación. Haz clic para
descargar.
El c o ef i c i e nt e d e c o rre l a c i ó n l i ne a l e s e l co ci e n t e e n t r e la c o va ri a nza y e l
p r o d u ct o d e l a s d e s vi a c i o ne s t í p i ca s d e a mb a s va r i a ble s.
El c o ef i c i e nt e d e c o rre l a c i ó n l i ne a l se e xp r e sa me d i a n t e l a l e tr a r.
Pr o p i ed a d e s
1 . El co e f ic i e nt e de c o rre l a c ió n n o va r í a al ha ce rl o l a e scal a d e me d i ci ón .
Es d e ci r , si e xp r e sa mo s l a al t u r a e n me t r o s o e n ce n t í me t r o s e l coe fi cie n te
d e co r re la ci ó n n o va r í a .
2 . El si g no d el co e f ic i e nt e de c o rre la c i ó n e s el mi smo q u e e l d e
l a co va ri a nza .
Si l a co var ia n za e s p o si ti va , l a co r r ela ci ó n e s di re ct a .
Si l a co var ia n za e s n e g a ti va, l a co rr ela ci ó n e s i n ver sa .
Si l a co var ia n za e s n ul a , no e xi st e cor r el a ci ó n .
3 . El co e f ic i e nt e de c o rre l a c ió n l i ne a l e s u n nú me r o r e a l co mp r e n d i d o e nt r e
−1 y 1 .
−1 ≤ r ≤ 1
4 . Si el co e fi c i e nt e d e co rre l a c i ó n l ine a l t o ma va l o r e s c e r ca n o s a −1 la
co r r el a ci ó n e s f ue rt e e i nve rs a , y se rá t a n t o má s f u e r t e cu an t o má s se
a p r o xi me r a −1 .
5 . Si el co e fi c i e nt e d e co rre l a c i ó n l ine a l t o ma va l o r e s ce r ca n o s a 1 l a
co r r el a ci ó n e s f ue rt e y d i re c t a , y se rá t a n t o má s f u e r t e cu an t o má s se
a p r o xi me r a 1 .
6 . Si el co e fi c i e nt e d e co rre l a c i ó n l ine a l t o ma va l o r e s ce r ca n o s a 0 , l a
co r r el a ci ó n e s dé b i l .
7 . Si r = 1 ó −1 , l o s p u n t o s d e l a n ube e st á n so br e l a r e ct a cr e ci e n t e o
d e cr e ci e n te . En t r e a mb a s va r i a bl e s ha y d e pe nd e nc i a f unc i o na l .
Ejemplos
xi yi x i ·y i xi2 yi2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
72 60 431 504 380
1º H al l am os l as m edias ar it m ét icas .
Y /X 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0
D e t e rmi n ar el coeficien t e de c or r elación .
C on v e rti m os l a t abl a de dobl e e n trada e n t abl a si m pl e .
xi yi fi xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi
0 1 2 0 0 2 2 0
0 2 1 0 0 2 4 0
0 3 2 0 0 6 18 0
2 1 1 2 4 1 1 2
2 2 4 8 16 8 16 16
2 3 5 10 20 15 45 30
4 1 3 12 48 3 3 12
4 2 2 8 32 4 8 16
20 40 120 41 97 76
2º Calculamos la covarianza.
xi yi xi2 yi2 xi · yi
2 14 4 196 28
3 20 9 400 60
5 32 25 1 0 24 160
7 42 49 1 7 64 294
8 44 64 1 9 36 352
25 152 151 5 3 20 894