Professional Documents
Culture Documents
INTEGRANTES
Estudiantes
Estatura (m) Peso(kg)
1 1,70 68
2 1,68 60
3 1,78 102
4 1,55 53
5 1,65 66
6 1,57 49
7 1,75 70
8 1,61 62
9 1,85 77
10 1,55 50
11 1,65 62
12 1,80 85
13 1,76 100
14 1,73 68
15 1,74 68
16 1,68 70
17 1,60 52
18 1,67 57
19 1,60 45
20 1,70 55
Diagrama de dispersin
la estatura y la cantidad de masa que posee cada estudiante estn fuertemente
relacionadas en un sentido lineal positivo.
diagrama de dispercion estudiantes
120
100
80 f(x) = 143.97x - 176.06
R = 0.62
peso 60
40
20
0
1.50 1.55 1.60 1.65 1.70 1.75 1.80 1.85 1.90
estatura
Estudiantes
Coeficiente de correlacin simple 0,78572579
H0: 0=0
HA: 00
Como p-valor es 0,001013143< , por lo tanto, se rechaza H0, por lo tanto, la
interseccin tiene un efecto significativo sobre la variable de respuesta.
Conclusiones
El modelo de regresin lineal es vlido con un p-valor de 0,00004031, en el cual
obtuvimos un coeficiente de correlacin simple de 0,78572579 que indica una
fuerte asocian lineal entre las variables estatura (x) y peso (y) de los estudiantes y
el error estndar tiende a disminuir y el coeficiente de determinacin es alto de
0,617365017 por lo tanta habr una mayor variacin del peso explicada por la
altura.
b) repita lo anterior para el caso de los datos de los progenitores de los
estudiantes.
Padres
Estatura( Peso(k
m) g)
1 1,80 100
2 1,80 100
3 1,77 120
4 1,78 80
5 1,66 80
6 1,65 78
7 1,82 85
8 1,75 120
9 1,74 80
1
0 1,75 80
1
1 1,60 83
1
2 1,70 75
1
3 1,79 84
1
4 1,58 71
1
5 1,70 80
1
6 1,68 85
1
7 1,75 75
1
8 1,78 80
1
9 1,76 72
2
0 1,75 70
Diagrama de dispersin
padres
140
120
100
80
peso 60
40
20
0
1.55 1.60 1.65 1.70 1.75 1.80 1.85
altura
Padres
Coeficiente de correlacin 0,34603595
mltiple 6
Corroborando con la grfica de dispersin, el coeficiente de correlacin simple
indica una relacin lineal dbil entre la estatura (X) y el peso (Y) de los padres.
Anlisis de varianza
Conclusiones
Segn los resultados obtenidos el modelo no es vlido ya que el valor crtico de F
es mayor a 0.05, adems no hay relacin significativa entre la altura y el peso del
padre y el coeficiente de relacin muestra que la relacin entre las variables es
muy dbil.
Anlisis de regresin lineal para las madres
Madre
Estatura( Peso(k
m) g)
1 1,50 74
2 1,50 74
3 1,65 70
4 1,60 68
5 1,55 60
6 1,63 62
7 1,68 70
8 1,62 65
9 1,73 70
1
0 1,52 55
1
1 1,73 58
1
2 1,75 65
1
3 1,67 98
1
4 1,56 65
1
5 1,68 68
1
6 1,70' 65
1
7 1,65 60
1 1,65 56
8
1
9 1,55 67
2
0 1,57 60
Diagrama de dispersin
Madres
120
100
80
peso 60
40
20
0
1.45 1.50 1.55 1.60 1.65 1.70 1.75 1.80
altura
Podemos observar que la grfica de dispersin para las madres muestra una
pendiente de la lnea recta que tiende a cero por lo tanto hay poca
asociacin entre las variables.
Coeficiente de correlacin
Madres
Coeficiente de correlacin simple 0,052502356
Conclusiones
Segn los resultados obtenidos el modelo no es vlido ya que el valor crtico de F
es mayor a 0.05, adems no hay relacin significativa entre la altura(x) y el peso(y)
de la madre y el coeficiente de relacin muestra que hay poca asociacin entre
las variables.
c) tome la estatura del estudiante como variable dependiente, como independiente
las 4 variables que resultan del peso y estatura de los progenitores. De acuerdo
con esto haga un anlisis de regresin mltiple e interprete con detalles los
resultados obtenidos.
X1- X3-
Y -Estatura (m) Estatura(m) X2-Peso(kg) Estatura(m) X4-Peso(kg)
ANLISIS DE
VARIANZA
Grados Valor
de Suma de Promedio de crtico de
libertad cuadrados los cuadrados F F
0,0537749 2,423 0,093792
Regresin 4 31 0,013443733 60224 051
0,0832050
Residuos 15 69 0,005547005
Total 19 0,13698
Coefici Error Estads Proba Inferior Superi Inferior Superior
entes tpico tico t bilidad 95% or 95% 95,0% 95,0%
- -
Intercep 0,6962 0,6513 1,0689 0,3019 0,6920 2,0846 0,6920 2,08460
cin 73147 57695 56662 9043 62916 0921 6292 921
X1- - - - -
Estatura 0,0465 0,2972 0,1564 0,8777 0,6799 0,5869 0,6799 0,58695
(m) 09632 01115 92118 3194 78813 5955 7881 955
X2- - -
Peso(kg 0,0002 0,0012 0,2025 0,8422 0,0024 0,0029 0,0024 0,00299
) 5988 83315 07165 4138 7544 952 7544 52
X3- - -
Estatura 0,4848 0,2279 2,1270 0,0504 0,0010 0,9707 0,0010 0,97074
(m) 70035 54822 44432 1795 04167 4424 0417 424
X4- - -
Peso(kg 0,0038 0,0020 1,8638 0,0820 0,0005 0,0082 0,0005 0,00823
) 41753 6114 96616 2898 51464 3497 5146 497
Estadsticas de la regresin
Coeficiente de correlacin 0,62655810
mltiple 2
Conclusiones
Segn los resultados obtenidos el modelo no es vlido ya que el valor crtico de F
es mayor a 0.05, adems no hay relacin significativa entre las variables y el
coeficiente de relacin muestra que la relacin entre las variables es muy dbil.
d) repita el inciso anterior, pero ahora utilice como variable dependiente el peso de
los estudiantes.
Modelo de regresin lineal mltiple
y= 0+ 1 X 1+ 2 X 2+ 3 X 3+ 4 X 4
Coeficiente de determinacin
Modelo 1
Y= -91,09103487 -41,73327889X1+ 0,372234984X2+ 80,60429373X3+
1,003248852X4
Por cada unidad que aumente la altura del padre, el peso del estudiante
disminuye en 41,73 kilogramos
Por cada kilogramo que aumente el peso del padre, el peso del estudiante
aumenta 0,37
Por cada unidad que aumente la altura de la madre, el peso del estudiante
aumenta 80,60 kilogramos
Por cada kilogramo que aumente el peso de la madre, el peso del
estudiante aumenta en 1,00
H0: 0=0
HA: 00
Como p-valor es de 0,31921191 > , no se rechaza H0 por lo tanta la interseccin
no tiene un efecto significativo sobre la variable de respuesta.
H0: 1=0
HA: 10
Como p-valor es de 0,31729893> , no se rechaza H0 por lo tanto la altura del
padre no tiene un efecto significativo sobre la variable de respuesta.
H0: 2=0
HA: 20
Como p-valor es de 0,04949031< , se rechaza H0 por lo tanto el peso del padre
tiene un efecto significativo sobre la variable de respuesta.
H0: 3=0
HA: 30
Como p-valor es de 0,01990103< , se rechaza H0 por lo tanto la altura de la
madre tiene un efecto significativo sobre la variable de respuesta.
H0: 4=0
HA: 40
Como p-valor es de 0,00270285< , se rechaza H0 por lo tanto el peso de la
madre tiene un efecto significativo sobre la variable de respuesta.
Modelo 2
Estadsticas de la regresin
Existe una asociacin fuerte entre el peso del estudiante con la altura y peso de
cada uno de sus progenitores, y la capacidad de prediccin del modelo es
satisfactorio ya que tiene un coeficiente de determinacin del 0,971
Y= 0,172659773 X2 + 1,22684967 x3 + 0,745843676 x4
e) calcule el incide de masa corporal (IMC) tanto para estudiantes como para
progenitores, que resulta de dividir el peso por la estatura al cuadrado: IMC=Y/(X) 2
y analizar la relacin del IMC de hijos y padres. Tome como variable independiente
los datos de los padres y como dependiente la de los hijos. Comente ampliamente
los resultados obtenidos.
IMC
HIJOS PADRE MADRE
1 23,53 30,86 32,89
2 21,26 30,86 32,89
3 32,19 38,30 25,71
4 22,06 25,25 26,56
5 24,24 29,03 24,97
6 19,88 28,65 23,34
7 22,86 25,66 24,80
8 23,92 39,18 24,77
9 22,50 26,42 23,39
10 20,81 26,12 23,81
11 22,77 32,42 19,38
12 26,23 25,95 21,22
13 32,28 26,22 35,14
14 22,72 28,44 26,71
15 22,46 27,68 24,09
16 24,80 30,12 22,49
17 20,31 24,49 22,04
18 20,44 25,25 20,57
19 17,58 23,24 27,89
20 19,03 22,86 24,34
Diagrama de dispersin
45.00
40.00
35.00
30.00 f(x) = 0.57x + 15.25
R = 0.23
25.00
IMC DEL PADRE 20.00
PADRE
15.00 Linear (PADRE)
10.00
5.00
0.00
0.00 20.00 40.00
IMCE DE LA MADRE
En la grfica podemos observar que hay una dispersin considerable de los datos,
ya que la relacin entre el ndice de masa corporal de los hijos y el padre es muy
dbil, por lo tanto, existe poca asociacin entre los datos.
Modelo estadstico
ANLISIS DE
VARIANZA
Promedio
Grados de Suma de de los Valor crtico
libertad cuadrados cuadrados F de F
85,2434516 85,2434516 5,4580182 0,03124386
Regresin 1 6 6 9 6
281,124402 15,6180223
Residuos 18 3 5
Total 19 366,367854
Conclusiones
Aunque el modelo de regresin lineal simple es vlido, El coeficiente de
correlacin indica que no hay una relacin significativa entre las variables del
ndice de masa corporal del padre con los hijos, teniendo en cuenta el coeficiente
de determinacin indica que el modelo no tiene un ajuste satisfactorio, puesto que
hay 23% de variabilidad de los datos que explica el modelo.
35.00
30.00
25.00
20.00
Axis Title
15.00 MADRE
Linear (MADRE )
10.00
5.00
0.00
10.00 20.00 30.00 40.00
Axis Title
Podemos observar que el valor del coeficiente indica que no hay una relacin
significativa entre el ndice de masa corporal de la madre e hijos.
Conclusiones
Segn los resultados obtenidos, el modelo no es vlido ya que el valor crtico de F
es mayor a 0.05, adems no hay relacin significativa entre el IMC de la madre
con el IMC de los hijos.
f) haga un reporte (presentacin) del trabajo hecho.
Verificacin de supuestos
Normalidad Shapiro-wilk.
Puesto que el valor-p es menor que 0,05 se rechaza la idea de que los valores
siguen una distribucin normal, por lo tanto, no se cumple el supuesto de
normalidad.
Independencia
Verificacin de varianza
Residuos vs. CaCO3
El valor-p de la prueba de Bartlett para los residuos vs cada uno de los factores
son mayores que 0,05, por lo tanto, se puede ver que entre los datos si existe
estadsticamente diferencias significativas entre las desviaciones estndar, es
decir, no se cumple con el supuesto de igualdad de varianza.
RESULTADOS
TRABAJO EDAD HORAS NUMERO NOTA
ESTUDIO DE DEFINITIVA
MATERIAS
NO 17 3 5 340
SI 17 3 5 320
NO 20 3 5 360
SI 20 3 5 200
NO 17 7 5 400
SI 17 7 5 360
NO 20 7 5 420
SI 20 7 5 330
NO 17 3 6 300
SI 17 3 6 220
NO 20 3 6 290
SI 20 3 6 190
NO 17 7 6 350
SI 17 7 6 240
NO 20 7 6 380
SI 20 7 6 320
MODELO ESTADISTICO
= + + + + + ( ) +
Hiptesis:
Factor A
H 0 : 1+ 2=0
H a : 1 + 2 0
Factor B
H 0 : 1 + 2=0
H a : 1 + 2 0
Factor C
H 0 : 1 + 2=0
H a : 1 + 2 0
Factor D
H 0 : 1 + 2=0
H a : 1 + 2 0
Luego de haber corrido nuestro experimento encontramos que entre las cuatro
variables que se corrieron y sus interacciones solo los factores TRABAJO, HORAS
DE ESTUDIO y NUMERO DE MATERIAS fueron significativas y la interaccin BC,
esto fue corroborado con el valor-p obtenido en nuestro mejor ANOVA, as mismo
decimos que tenemos un modelo estadsticamente valido ya que nuestro
R2=85 . Por lo que se concluye que la nota final obtenida por los estudiantes
en la materia estadstica solo se ve afectada por los factores e interaccin A-C-D Y
BC, lo que se puede corroborar en la grfica de Pareto y de probabilidad normal.
Coeficiente Estima
do
Constante 2514,38
A:TRABAJO -41,25
B:EDAD -107,5
C:HORAS ESTUDIO -74,375
D:NUMERO DE -332,5
MATERIAS
BC 5,0
BD 15,0
VERIFICACIN DE SUPUESTO
SUPUESTO DE NORMALIDAD
Revisando cada uno de los valores nos damos cuenta que cada uno de ellos es
mayor que el nivel de significancia (0,05) por lo que se puede decir que se cumple
el supuesto de igualdad de varianzas para cada uno de los factores y por tanto del
experimento.
SUPUESTO DE INDEPENDENCIA