You are on page 1of 26

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

ESTADISTICA DESCRIPTIVA

CURSO: 100105A_291

GRUPO Visible: 100105_379

AUTORES:

LUIS GLEIMER LAMBRAO NORIEGA _CODIGO: 9146541

ANA MARIA LOAIZA DURAN _ ODIGO: 1152696460


BRIGABIER VLEZ VELSQUEZ _CODIGO 71295391
YENNY ELIZABETH SEPULVEDA FERRER _ CODIGO: 1.090.456.028

TUTOR:

ALEXANDER GOMEZ

INGENIERA DE TELECOMUNICACIONES

20 DE NOVIEMBRE 2016

MEDELLIN
INTRODUCCIN GENERAL

Es de vital importancia conocer los fundamentos y aplicacin de la regresin


correlacin lineal, puesto que dichos segmentos de la estadstica pretenden
realizar el anlisis de los datos de muestra para saber qu es y cmo se
relacionan entre s dos o ms variables en una poblacin. El anlisis de
correlacin produce un nmero que resume el grado de la correlacin entre dos
variables; y el anlisis de regresin da lugar a una ecuacin matemtica que
describe dicha relacin.

El concepto de relacin o correlacin entre dos variables se refiere al grado de


parecido o variacin conjunta existente entre las mismas. En este apartado vamos
a estudiar un tipo particular de relacin llamada lineal y se limita a considerar
nicamente el caso de dos variables cuantitativas (correlacin simple).
Una relacin lineal positiva entre dos variables X e Y significa que los valores de
las dos variables varan de forma parecida: los sujetos que puntan alto en X
tienden a puntuar alto en Y y los que puntan bajo en X tienden a puntuar bajo en
Y. Una relacin lineal negativa significa que los valores de ambas variables varan
justamente el revs. La forma ms directa de formarse una primera idea sobre el
tipo de relacin existente entre dos variables cuantitativas es a travs de un
Diagrama de dispersin. Este tipo de diagramas puede obtenerse mediante:
Grficos, en las diferentes opciones que tiene: Generador de Grficos, Cuadros
de dilogo antiguos o en Grficos interactivos
JUSTIFICACIN
Con el presente trabajo se pretende mostrar los resultados obtenidos a travs de
un anlisis detallado; el cual tom como muestra una serie de datos relevantes,
que a su vez muestran una problemtica constante como lo son los accidentes de
trnsito; cabe aclarar que para realizar un anlisis detallado de la problemtica
obtenida, se acudi a los mtodos de regresin y correlacin lineal, con los cuales
se pudieron obtener una serie de datos muy dicientes que son el reflejo del
detallado estudio realizado a la base de datos destinada para la actividad misma.
Igualmente con el laboratorio de regresin y correlacin lineal se pretende generar
un anlisis previo a algunos datos entregados, dichos ejercicios afianzan el
conocimiento de cada uno de los integrantes del grupo colaborativo.
POR LUIS GLEIMER LAMBRAO NORIEGA

LABORATORIO DE REGRESIN Y CORRELACIN LINEAL

ASPECTOS TERICOS:

REGRESIN YCORRELACIN
En muchos casos se requiere conocer ms que el comportamiento de una sola
variable, se requiere conocer la relacin entre dos o ms variables como la
relacin entre produccin y consumo; salarios y horas de trabajo; oferta y
demanda; salarios y productividad; la altura de un rbol y el dimetro de su
tronco.

Muchos de estos comportamientos tienen una tendencia lineal, aunque hay


muchos otros que lo hacen de forma curva. Para determinar el grado de
correlacin entre las variables, no basta con calcular la varianza explicada,
pues existe el coeficiente de determinacin coeficiente de correlacin; sin
embargo, frecuentemente se utiliza un coeficiente de correlacin rectilneo,
siendo este un valor entre -1y1.

Para estas confrontaciones se utiliza el diagrama de dispersin que es


plano cartesiano en el que se marcan los puntos correspondientes a los
pares (x,y) de los valores de las variables.

El anlisis de Regresin tiene los siguientes usos: el primero es obtener los


estimadores de los parmetros, estimar la varianza del error, obtener los
errores estndares de los parmetros estimados, probar la hiptesis sobre los
parmetros, clculo de valores estimados basados en la ecuacin estimada,
estimar el ajuste o la falta de ajuste del modelo.

El modelo a utilizar es Y= a+ bx, a es el intercepto, b es la pendiente de


la funcin, la que nos indica el cambio marginal de Y respecto a X.

EJERCICIOS:

1. El rendimiento del producto de un proceso qumico est relacionado con la


temperatura de operacin del proceso. Se desea establecer la relacin que
existe entre la pureza (y) del oxgeno producido y el porcentaje de
hidrocarburo (x) que est presente en el condensador principal en un
proceso de destilacin, de acuerdo con los siguientes datos:
Siendo en este caso X la variable independiente & Y la variable
dependiente

X (%
Y (Pureza)
de Hidro carburos)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
a. Realice el diagrama de dispersin y determine el tipo de asociacin entre
las variables.

b. Encuentre el modelo matemtico que permite predecir el efecto de una


variable sobre la otra. Es confiable?

Y =

c. Determine el porcentaje de explicacin del modelo y el grado de relacin


de las dos variables.
d. Cul es el porcentaje de hidrocarburo cuando la pureza del oxgeno es
igual a 51,4?
2. El nmero de libras de vapor (y) consumidas mensualmente por una planta
qumica, se relaciona con la temperatura ambiental promedio (en o F). Para el ao
2015, se registraron los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y


consumos de vapor.

Temperatur Consumo de
Mes
a vapor
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98

3. Los investigadores estn estudiando la correlacin entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de
reflexin nociceptiva (y) que es una medida de sensacin de punzada.
Obsrvese que ambas, X e Y, son variables aleatorias
x
(porcentaj y (umbral
e de de reflejo
sobrepeso de flexin
) nociceptiva)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

a. Realice el diagrama de dispersin y determine el tipo de asociacin entre


las variables.
b. Ajuste un modelo matemtico que permita predecir el efecto de una
variable sobre la otra. Es confiable?
c. Determine el porcentaje de explicacin del modelo y el grado de relacin
de las dos variables.
d. Cul es el umbral de reflejo de flexin nociceptiva, cuando hay un
porcentaje de sobrepeso, de 50?
POR ANA MARIA LOAIZA DURAN

EJERCICIOS:

3. El rendimiento del producto de un proceso qumico est relacionado con la


temperatura de operacin del proceso. Se desea establecer la relacin que
existe entre la pureza (y) del oxgeno producido y el porcentaje de
hidrocarburo (x) que est presente en el condensador principal en un
proceso de destilacin, de acuerdo con los siguientes datos:

X
(% de Y
Hidro (Pureza)
carburos)

0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
a. Realice el diagrama de dispersin y determine el tipo de asociacin
entre las variables.
Se da una relacin directa quiere decir que entre mayor es el porcentaje de
hidrocarburos mayor va a ser la pureza.

PROCESO QUIMICO
105

100

95 f(x) = 14.95x + 74.28


R = 0.88
PUREZ A
90

85

80
0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6

% HIDROCARBUROS

b. Encuentre el modelo matemtico que permite predecir el efecto de una


variable sobre la otra. Es confiable?
y = 14.947x + 74.283

R = 0,87 coeficiente de determinacin 87%


R= 0,93 Coeficiente de Correlacin
El modelo es confiable porque el coeficiente de determinacin R 2 es cercano a 1.

c. Determine el porcentaje de explicacin del modelo y el grado de relacin


de las dos variables.
R= Coeficiente de correlacin R= 0,93
Correlacin = Excelente
En esta ecuacin podemos observar una buena estimacin entre las variables
debido a que el coeficiente de determinacin R 2 explica el 87.74% de la
informacin y el valor del coeficiente de correlacin R confirma el grado de
relacin de la variables, que es el 93.67%
d. Cul es el porcentaje de hidrocarburo cuando la pureza del oxgeno es
igual a 51.4?

y= 14,947x+ 74,283
y= 51,4
51,4=14,947(x)+ 74,283
51,4-74,283=14,947x
(-22,883)/14,947=x
x= -1,53

Cuando la pureza es igual 51,4 el hidrocarburo debe ser de - 1,53

Conclusin: despus del anlisis Bivariado de regresin y correlacin lineal entre


porcentajes de hidrocarburos y pureza, dos factores que intervienen en un
proceso qumico, podemos determinar que la ecuacin matemtica que las
relaciona es confiable en un 87% y a partir del coeficiente de correlacin podemos
deducir que el porcentaje de hidrocarburo y la pureza es excelente.

4. El nmero de libras de vapor (y) consumidas mensualmente por una planta


qumica, se relaciona con la temperatura ambiental promedio (en o F). Para el ao
2015, se registraron los siguientes valores de temperatura y consumo anual.

2014 Registros de temperatura y


consumos de vapor.

(Y) Consumo de
Mes (X)Temperatura
vapor
Ene. 21 185,79
Feb. 24 214,47
Mar. 32 288,03
Abr. 47 424,84
May. 50 455
Jun. 59 539
Jul. 68 621,55
Ago. 74 675,06
Sep. 62 562,03
Oct. 50 452,93
Nov. 41 369,95
Dic. 30 273,98
a. Realice el diagrama de dispersin y determine el tipo de asociacin
entre las variables.

Se da una relacin directa esto quiere decir que entre mayor es la


temperatura mayor va a ser el consumo de vapor.

PLANTA QUIMICA
800
700
600 f(x) = 9.21x - 6.32
500
R = 1

CONSUMO DE VAPOR 400


300
200
100
0
10 20 30 40 50 60 70 80

TEMPERATURA

b. Encuentre el modelo matemtico que permite predecir el efecto de


una variable sobre la otra. Es confiable?
y= 9,2087x-6,3184
R = 0,99 coeficiente de determinacin 99%
R= 0,99 Coeficiente de Correlacin

El modelo es muy confiable porque el coeficiente de determinacin R 2 es


aproximadamente 1.

c. Determine el porcentaje de explicacin del modelo y el grado de relacin


de las dos variables.
R= Coeficiente de correlacin R= 0,99
Correlacin= Excelente
Esta ecuacin hace una buena relacin entre las variables debido a que el
coeficiente de determinacin R2 explica el 99.99% de la informacin y el valor del
coeficiente de correlacin R confirma el grado de relacin de la variables, que es
el 99.99%
Conclusin: en este anlisis de regresin y correlacin lineal entre la relacin de
libras de vapor y temperatura ambiental que se consumen mensualmente en una
planta qumica en el ao 2015, podemos asegurar que la ecuacin matemtica
que las relaciona es confiable a travs del coeficiente de determinacin en un
99% y el valor del coeficiente de correlacin lineal confirma lineal confirma
adems una correlacin excelente entre las variables; libras de vapor y
temperatura ambiental de una planta qumica.

5. Los investigadores estn estudiando la correlacin entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el
peso ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo
de reflexin nociceptiva (y) que es una medida de sensacin de punzada.
Obsrvese que ambas, X e Y, son variables aleatorias.

x
y (umbral
(porcentaje
de reflejo
de
de flexin
sobrepeso)
nociceptiva)

89 2
90 3
75 4
30 4,5
51 5,5
75 7
62 9
45 13
90 15
20 14

e. Realice el diagrama de dispersin y determine el tipo de asociacin


entre las variables.
Se da una relacin inversa, ya que las variables no existen, esto se puede
observar con el coeficiente de determinacin R2 que es 11.15%.
INVESTIGACION
16
14
12
10
f(x) = - 0.06x + 11.64
UMBRAL DE REFLEJO DE FLEXION NOCICEPTIVA 8 R = 0.11
6
4
2
0
0 20 40 60 80 100

PORCENTAJE DE SOBREPESO

f. Ajuste un modelo matemtico que permita predecir el efecto de una


variable sobre la otra. Es confiable?
y = -0.0629x + 11.642
El modelo no es muy confiable porque el coeficiente de determinacin
R2 est muy lejos de 1

R= 0,11 coeficiente de determinacin 11%


R= 0,33 coeficiente correlacin

El modelo no es muy confiable porque el coeficiente de determinacin


R2 est muy lejos de 1

g. Determine el porcentaje de explicacin del modelo y el grado de


relacin de las dos variables.

R= coeficiente de determinacin R= 11%


Correlacin: Mnima

Esta ecuacin no hace relacin entre las variables debido a que el


coeficiente de determinacin R2 explica el 11.15% de la informacin y el
valor del coeficiente de correlacin R confirma el grado de relacin de la
variables, que es el 33.39

h. Cul es el umbral de reflejo de flexin nociceptiva, cuando hay un


porcentaje de sobrepeso, de 50?
Y= - 0,0629x+11,642

Y= 50

50 = - 0,0629(x)+11,642

50 11,642= - 0,0629x

(38,358)/ - 0,0629 = x

X= 38,29

Cuando hay un porcentaje de sobrepeso de 50, el umbral de reflejo de


flexin nociceptiva debe ser de 38,29.

Conclusin: despus de realizar este anlisis sobre la correlacin existente entre


la obesidad y la respuesta individual al dolor donde la obesidad se mide como
porcentaje sobre el peso ideal, la respuesta al dolor se mide utilizando el umbral
de reflejo de flexin nociceptiva que es una medida de sensacin de punzada,
podemos deducir que la ecuacin matemtica no es confiable ya que el
coeficiente de determinacin es de 11% y a partir del coeficiente de correlacin
podemos deducir que el porcentaje de sobrepeso y el umbral de reflejo
nociceptiva es mnima.
POR BRIGABIER VLEZ VELSQUEZ

1 El rendimiento del producto de un proceso qumico est relacionado con la


temperatura de operacin del proceso. Se desea establecer la relacin que existe
entre la pureza (y) del oxgeno producido y el porcentaje de hidrocarburo (x) que
est presente en el condensador principal en un proceso de destilacin, de
acuerdo con los siguientes datos:

X(% de Y (Pureza)
hidrocarburos)
0,99 90,01
1,02 89,05
1,15 91,43
1,29 93,74
1,46 96,73
1,36 94,45
0,87 87,59
1,23 91,77
1,55 99,42
1,4 93,65
1,19 93,54
1,15 92,52
0,98 90,56
1,01 89,54
1,11 89,85
1,2 90,39
1,26 93,25
1,32 93,41
1,43 94,98
0,95 87,33
a- Realice el diagrama de dispersin y determine el tipo de asociacin entre
las variables.

Diagrama de dispersin
Si existe correlacin entre estas dos variables, su direccin es positiva, ya que
entre mayor es el porcentaje de hidrocarburos, mayor es la pureza.

b - Encuentre el modelo matemtico que permite predecir el efecto de una


variable sobre la otra. Es confiable?
Modelo matemtico
y = 14,947x + 74,283
R = 0,8774 coeficiente de determinacin 87%
R= 0,93 Coeficiente de Correlacin
Se puede decir que el modelo es confiable ya que el coeficiente de determinacin
est prximo a 1
C Determine el porcentaje de explicacin del modelo y el grado de relacin
de las dos variables.
El coeficiente de correlacin R es igual a 0.936696 que es la raz cuadrada del
coeficiente de determinacin.
= 2
= 0.8774 = 0.936696
Coeficiente de correlacin R= 0,93
Correlacin = Excelente
D Cul es el porcentaje de hidrocarburo cuando la pureza del oxgeno es
igual a 51.4?
Y= 14.947 + 74.283
Pureza del oxigeno
Y= 51.4
Cuando la pureza es igual 51,4 el hidrocarburo debe ser de - 1,53

Conclusin:
Despus de realizar el anlisis de regresin y correlacin lineal entre las
variables, se puede concluir que la ecuacin es confiable, ya que se puede
observar un alto porcentaje de un 87%, por lo cual la relacin entre estas
variables es excelente.

2. El nmero de libras de vapor (y) consumidas mensualmente por una


planta qumica, se relaciona con la temperatura ambiental promedio (en o F).
Para el ao 2015, se registraron los siguientes valores de temperatura y
consumo anual.

2014 Registros de temperatura y consumos de vapor.

Mes (X)Temperatura (Y) Consumo de


vapor
Ene 21 185,79
Feb 24 214,47
Mar 32 288,03
Abr 47 424,84
May 50 455
Jun 59 539
Jul 68 621,55
Ago 74 675,06
Sep 62 562,03
Oct 50 452,93
Nov 41 369,95
Dic 30 273,98
a. Realice el diagrama de dispersin y determine el tipo de asociacin entre
las variables
Diagrama de dispersin

b. Encuentre el modelo matemtico que permite predecir el efecto de una


variable sobre la otra. Es confiable?
y= 9,2087x-6,3184
R = 0,99 coeficiente de determinacin 99%
R= 0,99 Coeficiente de Correlacin
Se puede decir que el modelo es confiable ya que el coeficiente de determinacin
est prximo a 1

c. Determine el porcentaje de explicacin del modelo y el grado de relacin


de las dos variables.
= 2
= 0.9999 = 0.999950
Coeficiente de correlacin R= 0,99
Correlacin= Excelente

d. Cul es la temperatura cuando el consumo de vapor es igual a 51,4?


= 9.2087 + 6.3184
Consumo de vapor
= 51.4
Entonces al reemplazar los datos en la ecuacin dada para encontrar el
valor de X o temperatura.
51.4 = 9.2087x + 6.3184
51.4 6.3184 = 9.2087x
45.0816 = 9.2087x
45.0816
9.2087 = x

4.8955 = x

El consumo de vapor es igual a 51.4 la temperatura es igual a 4.8955 F


Conclusin
Despus de realizar el anlisis de regresin y correlacin lineal entre las
variables, se puede concluir que la ecuacin es confiable, ya que se puede
observar que la ecuacin matemtica que las relaciona es confiable en un
99,99%, por lo tanto la relacin entre la temperatura y el porcentaje de vapor es
excelente

3. Los investigadores estn estudiando la correlacin entre la obesidad y la


respuesta individual al dolor. La obesidad se mide como porcentaje sobre el peso
ideal (x). La respuesta al dolor se mide utilizando el umbral de reflejo de reflexin
nociceptiva (y) que es una medida de sensacin de punzada. Obsrvese que
ambas, X e Y, son variables aleatorias.
a. Realice el diagrama de dispersin y
determine el tipo de asociacin entre las variables.
Diagrama de dispersin

Las variables relacionadas en el grfico presentan valores negativos, se puede


observar que al aumentar la magnitud del porcentaje de sobrepeso disminuye
proporcionalmente la magnitud del umbral de reflejo de flexin nociceptiva.

b. Ajuste un modelo matemtico que permita predecir el efecto de una


variable sobre la otra. Es confiable?
El modelo es muy poco confiable ya que el coeficiente de determinacin R2 est
muy lejos de 1
R= 0,11 coeficiente de determinacin 11%
R= 0,33 coeficiente correlacin

c. Determine el porcentaje de explicacin del modelo y el grado de relacin


de las dos variables.
El coeficiente de correlacin R es igual a 0.333916 que es la raz cuadrada del
coeficiente de determinacin.
= 2
= 0.1115 = 0.333916

La correlacin entre las dos variables es mnima, pues est entre 0.30 y 0.60, lo
que nos indica que es poco confiable.

d. Cul es el umbral de reflejo de flexin nociceptiva, cuando hay un


porcentaje de sobrepeso de 50?

Y = 0.0629 X + 11.642
% sobrepeso
Y = 50
Y = 0.0629 X + 11.642
Calculamos el valor de Y
Y = 0.0629 (50) + 11.642
Y = 3.145 + 11.642
Y = 8.497
Se puede concluir que cuando porcentaje de sobrepeso es igual a 50 el umbral de
reflejo de flexin nociceptiva es igual a 8.497

Conclusin
Despus de realizar el anlisis de regresin y correlacin lineal entre las
variables, se puede concluir que la ecuacin matemtica que las relaciona es
poco confiable en un 0.1115% y que el coeficiente de correlacin entre el
porcentaje de sobrepeso y el umbral de reflejo de flexin nociceptiva es mnima,
ya que est entre 0.30 y 0.60.

POR YENNY ELIZABETH SEPULVEDA FERRER

Planteamiento del anlisis estadstico.


La seccional de salud, desea saber de acuerdo a una encuesta, si la experiencia
en el sector salud de los trabajadores, tiene relacin con la edad de los mismos, y
es consecuente con el conocimiento que a travs de la experiencia y la practica
en el entorno, responden a preguntas de tipo legislativo de manera acertada o si
es posible que la edad y la experiencia no influyan respecto a las respuestas
generadas por los 15 encuestados de diferentes entidades de salud.
Instrumento de investigacin:
a. Realice el diagrama de dispersin y determine el tipo de asociacin entre
las variables.

b. Determine la mejor ecuacin que se ajusta a los datos.


Anlisis de los resultados.
Con los resultados obtenidos se puede asegurar que la ecuacin de la
recta es una buena estimacin de la relacin entre las variables Edad y
Experiencia en el sector salud. El R 2 afirma adems que el modelo explica
el 87,19% de la informacin y el valor de R= +1 coeficiente de correlacin
lineal confirma adems una correlacin positiva entre las variables: Edad y
experiencia en el sector de la salud.
Esto nos explica que, de acuerdo a los resultados del anlisis estadstico,
las personas con ms experiencia en el sector salud son mayores en edad
que los dems compaeros con menos edad y que respondieron a una
serie de preguntas de manera equivocada con relacin a los que tienen
ms tiempo de experiencia en el sector salud.
REFERENCIAS BIBLIOGRFICAS

Garca Secades, M. (2004). Dispersin. Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE|
CX4052900012&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=4a9b0a469e755a432
7207c94b4c0d549#

Montero Lorenzo, J. M. (2007). Caractersticas de Una Distribucin de


Frecuencias. Recuperado de

http://go.galegroup.com/ps/i.do?id=GALE|
CX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea
60961107ffc27a0#

Pava, M (2007, 22 de julio). Conceptos Bsicos. Recuperado de


https://www.youtube.com/watch?v=FKcb16juO9c

D.A. Lind, R.D. Mason, W.G. Marchal (2001): Estadstica para Administracin y
Economa. Ed. Irwin McGraw-Hill.F.
http://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf
Kvanli, A. Introduction to Business Statistics South-Western
R. Johnson (1996): Elementary Statistics. Ed. Duxbury
Richard I. Levin & David S. Rubin (1996): Estadstica para Administradores. Ed.
Prentice Hall.
http://www.mcgraw-
hill.com.mx/pye01e/cap13/13analisis_de_correlacion_y_regresion.pdf
E. Farber (1995): A Guide to Minitab. Ed. McGraw-Hill.

You might also like