You are on page 1of 10

Cómo hacer un diagrama de dispersión: Ejemplo en calidad

Continuamos con las herramientas de análisis y priorización de problemas, y hoy vamos a conocer una
de las herramientas más utilizadas: El diagrama de dispersión o gráfico de dispersión. No por nada
se considera una de las 7 herramientas básicas de calidad. Es quizá uno de los gráficos que se
aprenden de primero en formación estadística, así que ya tienes una idea de su importancia.

Vamos a comprender qué es un diagrama de dispersión, cómo se hace y por supuesto, un ejemplo de
aplicación para garantizar el aprendizaje, es el tema de hoy, para la gestión del negocio.

¿Qué vas a encontrar?


1. Qué es un diagrama de dispersión
2. Tipos de correlación en un gráfico de dispersión
Correlación positiva
Correlación negativa
Correlación nula
Otros tipos de clasificación de correlación
3. El coeficiente de correlación en un diagrama de dispersión
4. Cómo hacer un diagrama de dispersión paso a paso
5. Ejemplo de diagrama de dispersión
6. Plantilla en Excel diagrama de dispersión

Qué es un diagrama de dispersión

Antes de responder este interrogante, es necesario dar respuesta a qué es dispersión. La definición de
dispersión tiene múltiples respuestas, como bien nos muestra wikipedia: Dispersión. Nos quedamos
con la definición matemática:
Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor
medio.
A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de
estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc.

Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de
correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En otras
palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué
tan independientes son una de la otra.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a
la relación que exista entre ellas, definimos su tipo de correlación.

Tipos de correlación en un gráfico de dispersión


Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de
correlación: Positiva, negativa y nula.

 Correlación positiva
Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una
relación proporcional. Por ejemplo para un vendedor de carros, si él vende más carros (variable 1), va a
ganar más dinero (variable 2).

 Correlación negativa
Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que si una
variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo para la
construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1), menos
tiempo se necesitará para tenerlo listo (variable 2)
 Correlación nula
Si no encuentras un comportamiento entre las variables, existe una correlación nula.

 Otros tipos de clasificación de correlación


Otros tipos de clasificación están basados en qué tan fuerte o débil es el tipo de correlación, tal como lo
muestra Aiteco en los tipos de relación de un diagrama de dispersión:
 Sin correlación: La misma correlación nula
 Fuerte correlación positiva: Cuando el valor de una variable se incrementa o disminuye con una
relación muy similar a la otra variable.
 Débil correlación positiva: Cuando el valor de una variable se incrementa o disminuye en menor
relación a la otra variable, por ejemplo, que el valor de x se incremente ligeramente al
incrementar el valor de y.
 Fuerte correlación negativa: Cuando el valor de una variable aumenta claramente en relación a
una disminución de la otra variable.
 Débil correlación negativa: Cuando el valor de una variable aumenta levemente en relación a
la disminución de la otra variable.
 Relación compleja: Parece haber algún tipo de relación entre ambas variables, pero no es muy
evidente tornando la detección de la relación compleja.

El coeficiente de correlación en un diagrama de dispersión


El coeficiente de correlación nos describe cómo es la relación existente entre dos variables, en otras
palabras, al conocer este número sabemos si la correlación es positiva o negativa y qué tan fuerte o
débil es. Se usa la letra r para expresarla, veamos cómo:

 r=1
La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en una proporción
constante. Es una relación directa, por eso si trazamos una línea de ajuste esta va pasar por todos y
cada uno de los puntos.
 0<r<1
Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El grado de cercanía de
1 define qué tan directa y proporcional es la relación entre ambas variables, por ende entre más cerca
esté de 0, más débil será su correlación negativa.

 r=0
La correlación es nula, es decir que no existe una relación lineal entre ambas variables. Qué tal si
pruebas buscando otro tipo de relación.

 -1 < r < 0
Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El grado de cercanía
a -1 define que tan inversa y proporcional es la relación entre ambas variables, por ende entre más
cerca esté de 0, más débil será su correlación negativa.

 r = -1
La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en proporción
constante. Es una relación directa e inversa, por lo tanto una línea de ajuste va a tocar todos los puntos
graficados.

Un ejemplo más claro de todo lo mencionado lo muestra Wikipedia en una imagen: Tipos de
coeficiente de correlación

Cómo hacer un diagrama de dispersión paso a paso


 Paso 1: Determina cuál es la situación. Si no entendemos qué es lo que está ocurriendo, no
podremos establecer las variables a estudiar.
 Paso 2: Determina las variables a estudiar. Si ya determinaste las variables a estudiar, es
porque crees que puede existir una relación entre ellas que te permita caracterizar la situación.
 Paso 3: Recolecta los datos de las variables: Si ya los tienes, perfecto. Si no, definimos un
período de tiempo para conseguir los datos de las variables antes definidas. Recuerda que los
datos de las dos variables deben estar dados en el mismo período de tiempo.
 Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable independiente es
aquella que no está influenciada por la otra y se ubica en el eje x. La variable dependiente que
es la que se ve afectada por la otra variable se ubica en el eje y. Así pues, procedemos a
ubicar los valores en el plano cartesiano de acuerdo a su variable (x, y)
 Paso 5: Determina el coeficiente de correlación: El coeficiente de correlación debe verse
reflejado en la forma que toma el gráfico de dispersión. Es el cociente de la covarianza y la
multiplicación de la desviación típica de las dos variables. Con Excel logramos calcularlo de
manera muy simple.
 Paso 6: Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la relación de
las dos variables y tomamos las decisiones pertinentes.

Ejemplo de diagrama de dispersión


Vamos a ver desde una problemática empresarial, un ejemplo resuelto de diagrama de dispersión para
el área de calidad.

Imagina que una litográfica está abriendo una nueva área de producción para la impresión de posters,
y en este momento se encuentra haciendo todos los ensayos y pruebas para determinar la cantidad de
tinta de cada color que deberían tener las maquinas.

Como prueba inicial, han decidido establecer la relación de errores de impresión según el grado de
llenado de los recipientes de tinta de la máquina.

Bien, definida la situación, iniciamos desde el paso 2:


Las variables a estudiar para este ejemplo de grafico de dispersión en calidad son:

 Cantidad de tinta en litros


 Número de errores de impresión

Para el paso 3, comenzamos a recolectar las variables. En nuestro caso, el departamento de control
de calidad hace 50 corridas o pruebas durante 5 días continuos.
Los resultados, a continuación:
Cantidad de errores según el grado de
tinta

Ejemplo resuelto de diagrama de dispersión

Para el paso 4 ubicamos los ejes según las variables que tenemos. Al estar el número de errores
influenciado por la cantidad de tinta, lo ubicamos como el eje y. Por consiguiente, el eje x es la cantidad
de tinta. Ahora sí, hacemos el gráfico de dispersión.

Paso 5: Determinamos el coeficiente de correlación. En Excel lo calculamos con la


formula COEF.DE.CORREL. Para nuestro ejemplo resuelto, obtenemos 0,94, ¿se ve esto reflejado en
el gráfico? Por supuesto que sí, fíjate que los puntos están muy cerca unos de los otros, lo que indica
que los valores se correlacionan fuertemente, es decir que la relación entre un aumento en los litros de
tinta, impacta directamente en el número de errores en la impresión de posters. De hecho se hace
evidente si miramos la tabla, no hay grandes saltos entre datos si miramos el número de errores.

Paso 6: Analizamos. Evidentemente hay una relación positiva fuerte entre la cantidad de tinta con la
que se carga el tubo de la máquina y el número de errores generados en la impresión de los posters.
Un paso siguiente para un problema de este tipo, sería buscar la forma de aprovechar la capacidad
restante de la máquina, por ejemplo usar más tubos y más pequeños.
Plantilla en Excel diagrama de dispersión
Una plantilla en Excel en la cual únicamente tendrás que digitar los datos de tus dos variables. De
forma automática obtendrás tus daros representados en un gráfico de correlación. Haz clic para
descargar.

Coeficiente de correlación lineal

El c o ef i c i e nt e d e c o rre l a c i ó n l i ne a l e s e l co ci e n t e e n t r e la c o va ri a nza y e l
p r o d u ct o d e l a s d e s vi a c i o ne s t í p i ca s d e a mb a s va r i a ble s.
El c o ef i c i e nt e d e c o rre l a c i ó n l i ne a l se e xp r e sa me d i a n t e l a l e tr a r.

Pr o p i ed a d e s

1 . El co e f ic i e nt e de c o rre l a c ió n n o va r í a al ha ce rl o l a e scal a d e me d i ci ón .

Es d e ci r , si e xp r e sa mo s l a al t u r a e n me t r o s o e n ce n t í me t r o s e l coe fi cie n te
d e co r re la ci ó n n o va r í a .

2 . El si g no d el co e f ic i e nt e de c o rre la c i ó n e s el mi smo q u e e l d e
l a co va ri a nza .

Si l a co var ia n za e s p o si ti va , l a co r r ela ci ó n e s di re ct a .
Si l a co var ia n za e s n e g a ti va, l a co rr ela ci ó n e s i n ver sa .
Si l a co var ia n za e s n ul a , no e xi st e cor r el a ci ó n .

3 . El co e f ic i e nt e de c o rre l a c ió n l i ne a l e s u n nú me r o r e a l co mp r e n d i d o e nt r e
−1 y 1 .

−1 ≤ r ≤ 1

4 . Si el co e fi c i e nt e d e co rre l a c i ó n l ine a l t o ma va l o r e s c e r ca n o s a −1 la
co r r el a ci ó n e s f ue rt e e i nve rs a , y se rá t a n t o má s f u e r t e cu an t o má s se
a p r o xi me r a −1 .

5 . Si el co e fi c i e nt e d e co rre l a c i ó n l ine a l t o ma va l o r e s ce r ca n o s a 1 l a
co r r el a ci ó n e s f ue rt e y d i re c t a , y se rá t a n t o má s f u e r t e cu an t o má s se
a p r o xi me r a 1 .

6 . Si el co e fi c i e nt e d e co rre l a c i ó n l ine a l t o ma va l o r e s ce r ca n o s a 0 , l a
co r r el a ci ó n e s dé b i l .

7 . Si r = 1 ó −1 , l o s p u n t o s d e l a n ube e st á n so br e l a r e ct a cr e ci e n t e o
d e cr e ci e n te . En t r e a mb a s va r i a bl e s ha y d e pe nd e nc i a f unc i o na l .

Ejemplos

L as n ot as de 1 2 al u mn os de u n a cl ase e n Mat em áti cas y Fí si ca son l as


si gui e nt e s:
Mat em át ic as F ís ica
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10

H al l ar el coeficien t e de c or r ela ción de l a di st ri bu ci ón e


i n t e rpre t arl o.

xi yi x i ·y i xi2 yi2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
72 60 431 504 380

1º H al l am os l as m edias ar it m ét icas .

2º C al cul am os l a cov ar ian z a .

3º C al cul am os l as desv iacion es t ípicas .


4º Apl i cam os l a f órm ul a del coeficien t e de cor r el aci ón lin eal .

Al se r el coeficien t e de cor r ela c ión posi ti v o, l a corre l aci ón e s


di re ct a.
C om o coefici en t e de cor r el aci ó n e st á m uy próxi m o a 1 l a
corre l aci ón e s m uy f u e rt e .

L os v al ore s de dos v ari abl e s X e Y se di st ri bu y en se gú n l a t abl a


si gui e nt e :

Y /X 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0
D e t e rmi n ar el coeficien t e de c or r elación .
C on v e rti m os l a t abl a de dobl e e n trada e n t abl a si m pl e .
xi yi fi xi · fi xi2 · fi yi · fi yi2 · fi xi · yi · fi
0 1 2 0 0 2 2 0
0 2 1 0 0 2 4 0
0 3 2 0 0 6 18 0
2 1 1 2 4 1 1 2
2 2 4 8 16 8 16 16
2 3 5 10 20 15 45 30
4 1 3 12 48 3 3 12
4 2 2 8 32 4 8 16
20 40 120 41 97 76

Al se r el coeficien t e de cor r ela c ión n e gati v o, l a correl aci ón e s


i n v e rsa.
C om o coefici en t e de cor r el aci ó n e st á m uy próxi m o a 0 l a
corre l aci ón e s m uy dé bi l .
Recta de regresión
La recta de regresión es la que mejor se ajusta a la nube de puntos.
La recta de regresión pasa por el punto llamado centro de gravedad.
Recta de regresión de Y sobre X
La recta de regresión de Y sobre X se utiliza para estimar los valores de la Y a partir de
los de la X.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable
X.

Recta de regresión de X sobre Y


La recta de regresión de X sobre Y se utiliza para estimar los valores de la X a partir
de los de la Y.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable
Y.

Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre sí, y


sus ecuaciones son:
y=
x=
Ejemplos
Las notas de 12 alumnos de una clase en Matemáticas y Física son las siguientes:
Matemáticas Física
2 1
3 3
4 2
4 4
5 4
6 4
6 6
7 4
7 6
8 7
10 9
10 10
Hallar las rectas de regresión y representarlas.

xi yi xi ·yi xi2 yi2


2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
72 60 431 504 380

1º Hallamos las medias aritméticas.

2º Calculamos la covarianza.

3º Calculamos las varianzas.

4º Recta de regresión de Y sobre X.

5º Recta de regresión de X sobre Y.


Ejercicio 1
Ci n co niñ o s d e 2 , 3 , 5 , 7 y 8 añ o s d e e d a d p e san , r e sp e cti va me n t e , 1 4 , 2 0 ,
3 2 , 4 2 y 44 ki lo s.
1 Ha ll ar l a e cu a ció n d e l a r e ct a d e r eg r e si ó n de l a e d ad so b re el p e so.
2 ¿ Cu ál se rí a el p e so a p ro xi ma d o d e u n ni ñ o d e sei s a ñ o s?

xi yi xi2 yi2 xi · yi
2 14 4 196 28
3 20 9 400 60
5 32 25 1 0 24 160
7 42 49 1 7 64 294
8 44 64 1 9 36 352
25 152 151 5 3 20 894

You might also like