Professional Documents
Culture Documents
PARTE I
Se hizo un estudio sobre terrenos construidos en una determinada región, se analizó el costo del
terreno (Terreno$), el costo total con construcción (Total$), el área total del terreno en metros
cuadrados (Área), que combustible usa (Combust), número total de habitaciones, numero de
chimeneas, si tiene o no garaje de cuantos y el número de pisos en el área construida.
1
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
2
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
RESOLUCIÓN:
Terreno$, es una variable cuantitativa (continua) que describe es el precio total de un terreno.
Conteo
Variable total Media Desv.Est. CoefVar Mínimo Mediana Máximo Rango
Terreno$ 76 66743 23019 34.49 35353 61093 131224 95871
16
14 120000
12
Frecuencia
100000
10 Terreno$
8
80000
6
4
60000
2
0
40000 60000 80000 100000 120000 40000
Terreno$
Total$, es una variable cuantitativa (continua) que describe precio total del terreno después
de la construcción de una vivienda.
Conteo
Variable total Media Desv.Est. CoefVar Mínimo Mediana Máximo Rango
Total$ 76 189436 85241 45.00 74365 167562 453744 379379
15 400000
Frecuencia
10 300000
Total$
5 200000
0 100000
100000 150000 200000 250000 300000 350000 400000 450000
Total$
3
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
Área, es una variable cuantitativa (continua) que describe el área total del terreno en metros
cuadrados.
Conteo
Variable total Media Desv.Est. CoefVar Mínimo Mediana Máximo Rango
Area 76 6549 5398 82.43 1174 4427 23796 22623
20000
20
Frecuencia
15 15000
Area
10
10000
5
5000
0
0 5000 10000 15000 20000 25000
Area 0
Combust, es una variable cualitativa (nominal) que describe el tipo de combustible que usa
una vivienda.
30
Conteo
20 NatGas
36, 47.4%
Electric
40, 52.6%
10
0
Electric NatGas
Combust
4
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
Conteo
Variable total Media Desv.Est. CoefVar Mínimo Mediana Máximo Rango
Nro_hab 76 8.500 2.260 26.59 5.000 8.000 14.000 9.000
14 14
12 13
12
10
11
Frecuencia
Nro_hab
10
6
9
4 8
2 7
6
0
6 8 10 12 14
5
Nro_hab
Conteo
Variable total Media Desv.Est. CoefVar Mínimo Mediana Máximo Rango
Nro_chimenea 76 1.947 1.365 70.11 0.000 2.000 7.000 7.000
25 6
20 5
Frecuencia
Nro_chimenea
15 4
3
10
2
5
1
0
0 1 2 3 4 5 6 7
0
Nro_chimenea
5
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
Garaje?, es una variable cualitativa (nominal) que describe si una determinada vivienda
cuenta o no con garaje.
50
40
Conteo
30
20
10
10
0 Garaje
66, 86.8%
Garaje NoGaraje
Garaje?
Pisos, es una variable cuantitativa (discreta) que describe el número de pisos que se
construyeron en una vivienda.
Conteo
Variable total Media Desv.Est. CoefVar Mínimo Mediana Máximo Rango
pisos 76 2.0000 0.8485 42.43 1.0000 2.0000 3.0000 2.0000
25
2.5
20
Frecuencia
15
pisos
2.0
10
5 1.5
0
1 2 3
1.0
pisos
6
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
Prueba de Hipótesis
H0 : 6
I. Formulación de la hipótesis:
Ha : 6
Error
estándar
de la 95% Límite
Variable N Media Desv.Est. media inferior Z P
Nro_hab 76 8.500 2.260 0.259 8.074 9.64 0.000
P( X <= x ) x
0.95 1.64485
V. Conclusión:
Como Zc 9.64 1.64 Z0 ( 0.05 0.00 P ) entonces se rechaza la hipótesis nula, por
lo tanto existe suficiente evidencia para afirmar que el promedio de número de habitaciones
es mayor que 6.
3. Pruebe si hay diferencias en las varianzas del área del terreno según si tiene o no Garaje
Prueba de Hipótesis
H 0 : 12 22
I. Formulación de la hipótesis:
H a : 12 22
7
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
2
S mayor
III. Estadístico de prueba: Fc 2
S menor
Método
Estadísticas
IC para IC para
Distribución relación de relación de
de los datos Desv.Est. varianza
Normal (0.589, 1.664) (0.347, 2.768)
Continuo (0.198, 2.136) (0.039, 4.564)
Pruebas
Estadística
Método GL1 GL2 de prueba Valor P
Prueba F (normal) 65 9 1.19 0.830
Prueba de Levene (cualquiera continua) 1 74 0.03 0.864
P( X <= x ) x
0.975 3.44054
V. Conclusión:
Como Fc 1.19 3.44 F0 ( 0.05 0.83 P ) entonces no se rechaza la hipótesis nula,
por lo tanto, existe suficiente evidencia para afirmar que las varianzas de las áreas de los
terrenos según si tienen o no garaje, son estadísticamente iguales.
8
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
4. Pruebe si hay diferencias significativas de los promedios del área del terreno entre los que tienen
y no tiene Garaje.
Prueba de Hipótesis
H 0 : 1 2
I. Formulación de la hipótesis:
H a : 1 2
X Y m 1 S12 n 1 S 22
III. Estadístico de prueba: tc ; donde: S P
1 1 mn2
Sp
m n
Error
estándar
de la
Garaje? N Media Desv.Est. media
Garaje 66 6655 5482 675
NoGaraje 10 5846 5015 1586
P( X <= x ) x
0.975 1.99254
V. Conclusión:
Como t c 0.44 1.99 t 0 ( 0.05 0.66 P ) entonces no se rechaza la hipótesis nula,
por lo tanto existe suficiente evidencia para afirmar que los promedios de las áreas de los
terrenos según si tienen o no garaje, son estadísticamente iguales.
9
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
5. Probar si existe una relación entre el uso de combustible y los pisos de la construcción
Prueba de Hipótesis
I. Formulación de la hipótesis:
H 0 : Pij Pi. P.j No existe relación entre el uso de combustible y los pisos cons.
H a : algún Pij Pi. P. j Existe relación entre el uso de combustible y los pisos cons.
n
2
r k e ij
2 ij
III. Estadístico de prueba: c
i1 j1 e ij
1 2 3 Todo
Electric 14 10 16 40
18.42 13.16 21.05 52.63
14.21 11.58 14.21 40.00
NatGas 13 12 11 36
17.11 15.79 14.47 47.37
12.79 10.42 12.79 36.00
Todo 27 22 27 76
35.53 28.95 35.53 100.00
27.00 22.00 27.00 76.00
Chi-cuadrada con 2 GL
P( X <= x ) x
0.975 7.37776
10
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
V. Conclusión:
Como c2 0.937 7.377 02 ( 0.05 0.626 P ) entonces no se rechaza la hipótesis
nula, por lo tanto, existe suficiente evidencia para afirmar que no existe relación entre el
combustible y el número de pisos construidos en una vivienda.
Prueba de Hipótesis
I. Formulación de la hipótesis:
H0 : La secuencia de la selección de uso de combustible es aleatoria.
Ha : La secuencia de la selección de uso de combustible no es aleatoria.
R r
III. Estadístico de prueba: Zc ;
r
2n1.n2 (2n1n2 )(2n1n2 n)
donde: r 1 , r
(n1 n1 ) n2 (n 1)
n1 = Número de ocurrencias tipo 1
n2 = Número de ocurrencias tipo 2
n = Número total de observaciones.
R = Numero de rachas
P( X ≤ x ) x
0.975 1.95996
11
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
V. Conclusión:
Como Z c Z 0 ( 0.05 0.04 P ) entonces se rechaza la hipótesis nula, por lo tanto, no
existe suficiente evidencia estadística para afirmar que la secuencia de la selección de uso
de combustible es aleatoria.
7. Realizar una prueba de Smirnov-Kolmogorov para determinar si el costo total con construcción
tiene distribución normal
Prueba de Hipótesis
I. Formulación de la hipótesis:
H0 : Los datos analizados siguen una distribución normal.
Ha : Los datos analizados no siguen una distribución normal.
Dmax ( x) max | F0 ( x) Sn ( x) |
donde:
( F0 ( x))
Probabilidad Esperada Acumulada:
Di | F0 ( x1 ) Sn ( xi ) |
Diferencias Absolutas entre la distribución esperada y observada:
12
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
1.358
KS- Table, Cuando n > 70 =0,1558
n
V. Conclusión:
Como 0.05 0.01 P entonces se rechaza la hipótesis nula, por lo tanto, no existe
suficiente evidencia estadística para afirmar que los datos analizados siguen una
distribución normal.
Observación:
Prueba de Hipótesis
I. Formulación de la hipótesis:
H0 : Las medianas de las poblaciones son consideradas iguales.
Ha : Al menos una de las poblaciones tiene mediana distinta a las otras.
13
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
12 k Rm2
H 3(n 1)
n(n 1) m 1 nm
donde:
n , total de datos
Rm , Suma de Rangos
H
En caso de empates: H ' g
(t 3
ti )
1 i 1
n3 n
Clasificación
Pisos N Mediana del promedio Z
1 27 198935 40.7 0.65
2 22 185509 43.2 1.19
3 27 131263 32.4 -1.77
General 76 38.5
H = 3.31 GL = 2 P = 0.191
Chi-cuadrada con 2 GL
P( X <= x ) x
0.975 7.37776
V. Conclusión:
Como H 2k 1,1 ( 0.05 0.191 P ) entonces no se rechaza la hipótesis nula, por lo
tanto, existe suficiente evidencia estadística para afirmar que el costo total es igual según
los pisos construidos.
14
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
Prueba de Hipótesis
H0 : M e 7
I. Formulación de la hipótesis:
Ha : M e 7
WC Ri
WC
Dónde: = Suma de rangos de las diferencias positivas
n(n 1)
W
n 20 Zc 4
n(n 1)(2n 1)
24
n(n 1)
W
En caso de Empates: Z c 4
n(n 1)(2n 1) n ti3 ti
24 i 1 2
Número
de Estadística Mediana
N prueba de Wilcoxon P estimada
N_Hab 76 63 1723.5 0.000 8.500
P( X ≤ x ) x
0.975 1.95996
V. Conclusión:
15
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
PARTE II
¿Podemos afirmar con una confianza del 98% que las valoraciones de los profesores difieren?
Prueba de Hipótesis
I. Formulación de la hipótesis:
H0 : No existen diferencias en las valoraciones de los tres profesores.
Ha : Existen diferencias en las valoraciones de los tres profesores.
k
12
S { ( R j )2 } 3n(k 1)
[nk (k 1)] j 1
donde:
S = Estadístico Calculado del análisis de varianza de rangos de Friedman
n = Representa el número de elementos de bloques.
k = El número de variables relacionales, grupos o muestras
R j = Rango por columnas
En caso de Empates:
k
(k 1)[k T j 2 T 2 ]
j 1
S n
kT Ti 2
i 1
16
SEGUNDO EXAMEN PARCIAL DE INFERENCIA ESTADÍSTICA PARAMÉTRICA Y NO PARAMÉTRICA
T = Total de observaciones
k = Numero de tratamientos
T j = Total de la j-esima columna
S = 3.65 GL = 2 P = 0.161
S = 3.95 GL = 2 P = 0.139 (ajustados para los vínculos)
Mediana Suma de
Profesores N Est. clasificaciones
Profesor A 10 4.500 24.5
Profesor B 10 3.500 19.5
Profesor C 10 2.500 16.0
Chi-cuadrada con 2 GL
P( X ≤ x ) x
0.99 9.21034
V. Conclusión:
Como Q 2k 1,1 ( 0.05 0.161 P ) entonces no se rechaza la hipótesis nula, por lo
tanto, existe suficiente evidencia para afirmar que las valoraciones de los profesores no
difieren.
17