Professional Documents
Culture Documents
ESPECIALIZACION DE POSTGRADO EN
ASESORIA DE TESIS
ANLISIS E INTERPRETACIN DE
RESULTADOS ESTADISTICOS
PRUEBAS
ESTADISTICAS
PARAMETRICAS
Prueba t
de Student
QUE ES LA PRUEBA t ?
ES
UNA PRUEBA
ESTADISTICA PARA
EVALUAR SI DOS GRUPOS
DIFIEREN ENTRE SI DE
MANERA SIGNIFICATIVA
RESPECTO DE SUS MEDIAS.
SIMBOLO
x
t
S/ n
tiene distribucin t( n 1)
x1 x 2
t 2
2
S 1 / N1 S 2 / N 2
HIPOTESIS A PROBAR
Se
La
VARIABLE INVOLUCRADA
LA
EL
INTERPRETACION
PARA GRUPOS
PEQUEOS (n < 30)
X la media del grupo.
la media poblacional
S la Desv. Estandar
n = tamao de muestra
x
t
S/ n
tiene distribucin t( n 1)
INTERPRETACION
Para
RECOMENDACION
Mientras
Distribucin t-Student
Para muestras pequeas de poblacin normal
T
x
tiene distribucin t ( n1)
S/ n
PRUEBA t
t1-
t(v)
gl = (N1 + N2) 2
N1 y N2 representan al tamao de cada grupo
comparado.
EVALUACION DE RESULTADOS
Si
USO DE LA TABLA..
EJERCICIOS
Tomar
la Tabla t y calcular:
Media Muestral
=
Media Poblacional
=
=
n
=
gl. (t-1)
=
DESCANSO
HIPOTESIS A
CONTRASTAR
Se definen:
Las hiptesis nula y alternativa con una
distribucin de probabilidad conocida
H1
SI
NO
Se extraen conclusiones
Utilizar prueba de Z
Si
Se
Se
conoce
conoce ??
No
Si
Utilizar prueba de Z
Es
Es nn 30?
30?
No
Utilizar prueba de Z
Si
Si
Se
Se
conoce?
conoce?
No
Se
Se sabe
sabeqq
la
lapoblacin
poblacin
es
es normal?
normal?
Utilizar prueba de t
Si
No
Utilizar prueba de Z
(por el teorema central
del lmite)
Se
Se conoce?
conoce?
No
Si
Es
Es nn 30?
30?
Se rechaza la
hiptesis
nula
Se rechaza la
hiptesis nula
Area A = rea B
y (A+B) = el
nivel deseado
de significancia
Area A
Area B
Valor
critico
Valor terico
de la diferencia
+ Valor
critico
n > = 30
Distribucin
normal
No
No
Si
Si
Si
Nmero
de
grupos
2 Grupos
n > = 30
No
Si
Varianzas
iguales
No
Distribuci
n normal
Independientes
n > = 30
No
Si
No
Distribuci
normal
3 a ms Grupos
Independientes
No
Distribucin
normal c/varianzas semejantes
Distribucin
normal c/varianzas semejantes
n
No
Si
No
Si
Prueba T para
diferencia de medias
Si
No
Si
No
Continua
Escala de
medicin
para ambas
variables
Ordinal y/o
numrica
Si
Nominal
Cada variable
tiene dos
categoras
(tablas 2x2)
No
Nmero de Grupos
Un grupo
Variable
cuantitativa
Hiptesis:
= 0
Dos grupos
Variable
categrica
Hiptesis:
2 < 20
Parmetro
Parmetro:
media
varianza
Variable
cuantitativa
Hiptesis:
P=P
Parmetro
Proporcin
Hiptesis:
0
= 2
Parmetros
medias
Tres o ms grupos
Variable
caategrica
Hiptesis:
Parmetros
varianzas
Hiptesis:
P 1 =P
Parmetros
Proporciones
Variable
cuantitativa
Hiptesis:
2
= ...= k
Parmetros
k medias
Variable
categrica
Hiptesis:
2 1 2 2 =
...= 2 k
Parmetros
k varianzas
Hiptesis:
P 1 =P
....= P
Parmetros
k Proporciones
Prueba de Correlacin de
Rango de SPEARMAN
Donde:
N: # de observaciones, # de individuos o fenmenos
clasificados por rango.
di: Diferencia en los rangos atribuida a dos caractersticas
diferentes del i-simo individuo o fenmeno.
La
La correlacin
correlacin por
por rangos
rangos de
de Spearman
Spearman mide
mide la
la relacin
relacin entre
entre
dos
dos variables
variables que
que han
han sido
sido clasificadas
clasificadas por
por orden
orden de
de menos
menos aa
mayor
mayor(o
(ode
demayor
mayoraamenor)
menor)
EJEMPLO
Una empresa contrat a 7 tcnicos en informtica, que fueron
sometidos a un examen de conocimientos bsicos. Luego de un
ao de servicio, se calific su rendimiento en el trabajo. A
continuacin, se muestran los resultados:
Puntuacin en el
examen
82
Clasificacin por
rendimiento
4
M. Contreras
73
C. Gutarra
60
F. Olaechea
80
D. Barrientos
67
F. Estombelo
94
J. Cordova
89
Tcnico
J. Manzo
1
1 Se
Se elabora
elabora la
la clasificacin
clasificacin de
de las
las puntuaciones
puntuaciones del
del
examen
examen
Tcnico
Puntuacin
en el examen
Clasificacin por
el examen (X)
Clasificacin por
rendimiento (Y)
J. Manzo
82
-1
M. Contreras
73
-2
C. Gutarra
60
F. Olaechea
80
D. Barrientos
67
F. Estombelo
94
J. Cordova
89
X Y d i (X Y) 2 d i2
2
2 Se
Se calcula
calcula del
del coeficiente
coeficiente de
de correlacin
correlacin por
por rangos
rangos de
de
Spearman
Spearmanrrs:s:
0.857
rs 1 6
1 6
2
2
7(7 1)
N( N 1)
Un
Un coeficiente
coeficiente de
de correlacin
correlacin oscila
oscila entre
entre -1
-1 yy 1;
1; los
los
resultados
resultados muestran
muestran una
una fuerte
fuerte relacin
relacin positiva
positiva entre
entre las
las
puntuaciones
puntuaciones de
de examen
examen de
de cada
cada tcnico
tcnico yy su
su rendimiento
rendimiento
en
enleletrabajo
trabajo
Contrastando la hipotes:
HH0: s ==0,
0,no
nohay
hayrelacin
relacinentre
entrelas
lasdos
dosvariables
variables
0: s
HH1: s 0,
0,hay
hayrelacin
relacinentre
entrelas
lasdos
dosvariables
variables
1:
Se acepta
Se
Rechaza
Se
Rechaza
0.05
-0.6786
Valor critico
0.05
+0.6786
Valor critico
0.857
Como
Comorrssest
estfuera
fuerade
delalaregin
reginde
deaceptacin,
aceptacin,rechazamos
rechazamoslalaHH00. .Se
Se
concluye,
concluye,alal90%
90%de
deconfianza,
confianza,existe
existerelacin
relacinentre
entrelas
laspuntuaciones
puntuaciones
del
delexamen
examenyyelelorden
ordende
derendimiento
rendimientoen
eneleltrabajo
trabajo
L ( x 1 x 2 ) Z 1 / 2 S x1 x 2
donde
S x1 x 2
s12 s22
n1 n2
Cambiar de
tema
ANALISIS
NO
PARAMETRICO
CONSIDERACIONES
METODOS O PRUEBAS NO
PARAMETRICAS MAS
EMPLEADAS
1)
LA Ji CUADRADA CHI-CUADRADA
2) COEFICIENTES DE CORRELACION E
INDEPENDNENCIA PARA TABULACIONES
CRUZADAS.
3) LOS COEFICIENTES DE
CORRELACION PARA RANGOS
ORDENADOS DE SPERMAN Y KENDALL
Ji - CUADRADA
Es
Ji - CUADRADA
La
Cada
Cada
La Prueba Ji-Cuadrado
Distribucin Ji-Cuadrado
Supngase que se tiene una serie de variables aleatorias independientes con distribucin normal
estndar, Z1 , Z 2 , ... , Z n , entonces la variable aleatoria ,X Z12 ... Z 2n sigue una distribucin
Ji-Cuadrado.
La Prueba Ji-Cuadrado
FUNCIN DE DENSIDAD
MEDIA Y VARIANZA.
2
i 1 j1
ij
E ij
E ij
USO DE LA TABLA
0,1
0,05
0,025
0,01
0,005
2,71
3,84
5,02
6,63
7,88
4,61
5,99
7,38
9,21
10,60
6,25
7,81
9,35
11,34
12,84
7,78
9,49
11,14
13,28
14,86
9,24
11,07
12,83
15,09
16,75
10,64
12,59
14,45
16,81
18,55
12,02
14,07
16,01
18,48
20,28
13,36
15,51
17,53
20,09
21,95
14,68
16,92
19,02
21,67
23,59
10
15,99
18,31
20,48
23,21
25,19
P [ 11.07 2 | n 5] 0.05
0,1
0,05
0,025
0,01
0,005
2,71
3,84
5,02
6,63
7,88
4,61
5,99
7,38
9,21
10,60
6,25
7,81
9,35
11,34
12,84
7,78
9,49
11,14
13,28
14,86
9,24
11,07
12,83
15,09
16,75
10,64
12,59
14,45
16,81
18,55
12,02
14,07
16,01
18,48
20,28
13,36
15,51
17,53
20,09
21,95
14,68
16,92
19,02
21,67
23,59
10
15,99
18,31
20,48
23,21
25,19
EJEMPLO
Martha Revilla, directora de mantenimiento de la calidad
en MEGA, elige 29 bicicletas y halla una varianza en la
distancia entre ejes de 32.7 pulgadas cuadradas. Si la
seora Revilla tienen que garantizar que la variacin no
supere 27 pulgadas cuadradas indica esto que se
cumplen las normas de produccin? (=0.05)
Hiptesis
Hiptesis
H 0 2 27
H1 2 27
Prueba
Pruebade
deuna
unacola
colaaala
laderecha
derecha
n 29
s 2 32.7
2 27
n 1 s 2 29 1 32.7
33.91
2
27
f 2
02.05; 28 41.337
0.05
33.91
41.337
Como XX2=33.91<41.337
=33.91<41.337 lala seora
seora Revilla
Revilla no
no rechazar
rechazar lala HH00 yy
Como
confiar
confiaralal95%
95%en
enque
quese
secumplen
cumplenlas
lasnormas
normasde
deproduccin
produccin
H 0 27
2
H1 27
2
Prueba
Pruebade
deuna
unacola
colaaala
laizquierda
izquierda
f 2
02.95; 28 16.928
0.05
16.928
33.91
=33.91,la
laseora
seoraRevilla
Revillano
norechazar
rechazarla
laHH00yyconfiar
confiaral
al95%
95%en
en
XX2=33.91,
que
quese
secumplen
cumplenlas
lasnormas
normasde
deproduccin
produccin
n 1 s 2
2
0.05; 28
n 1 s 2
02.95; 28
29 1 32.7 2 29 1 32.7
41.337
16.928
22.15 2 54.09
0.90
0.05
0.05
16.928
0.95
41.337
Revilla
Revilla puede
puede confiar
confiar alal 90%
90% en
en que
que lala varianza
varianza de
de la
la distancia
distancia
entre
entreejes
ejesse
seencuentra
encuentraentre
entre22.15
22.15yy54.09
54.09pulgadas
pulgadascuadradas
cuadradas
Categ. 1
......
Categ. s
Total
Cat. 1
O11
......
O1s
R1
.........
.......
......
.......
.....
Cat. r
Or1
......
Ors
Rr
Total
C1
......
Cs
Estadstica
r
(O ij E ij ) 2
E ij
i 1 j1
donde ,
E ij
Ri Cj
n
12
R .C.
Presencia de
Sntoma
Total
Alto
Medio
Bajo
Si
No
Total
175
90
265
43
60
103
27
55
82
245
205
450
HH0::Las
alteraciones respiratorias son independientes de la
0 Las alteraciones respiratorias son independientes de la
exposicin
exposicinal
alproducto.
producto.
HH1:: Las
Las alteraciones
alteraciones respiratorias
respiratorias estn
estn asociadas
asociadas aa la
la
1
exposicin
exposicinalalproducto
producto
Frecuencias Esperadas:
Por ejemplo:
E 23
E ij
R iC j
n
R 2 C3 205 82
37.4
n
450
Nivel de Exposicin
Presencia de
Sntoma
Alto
Medio
Bajo
Si
No
Total
144.3
120.7
265
56.1
46.9
103
44.6
37.4
82
Total
245
205
450
Estadstica
2
(O ij E ij ) 2
E ij
i 1 j1
donde ,
E ij
Ri Cj
n
0.05
12
R .C.
O
2 ij n
i 1 j1 E ij
2
1752
552
...
450 36.4
144.3
37.4
Que
Quesigue
sigueuna
unadistribucin
distribucinJi-cuadrado
Ji-cuadradocon
con
(n-1)*(C-1)=(
(n-1)*(C-1)=(2-1)*(3-1)=2
2-1)*(3-1)=2grados
gradosde
delibertad
libertad
En
En conclusin,
conclusin, se
se rechaza
rechaza lala HH00(p
(p << 0.05),
0.05), es
es decir
decir las
las
alteraciones
alteraciones respiratorias
respiratorias estn
estn asociadas
asociadas aa lala
exposicin
exposicinalalproducto
producto
Distribucin F de Snedecor
Si
y X 2 son variables Ji-cuadrado distribuidas en forma
independiente
con y
grados de libertad, respectivamente, la
X1
variable k k
Z k
2
1
F 1 1
Z2 k 2
yk1 grados
de libertad.
k2
Tabla F de Fisher
Ejemplo de Aplicacin
x1 14.40
x 2 14.87
S12 1.600
n1 10
S22 2.981
n 2 15
H 0 : 12 22
H1 : 12 22
Luego
Si
0.05
1.600
0.5367
2.981
1y / 2
0.025
0.025
0.26
0.5367
3.21
EJEMPLO
La compaa llantera Good Year del Per, ha efectuado
un estudio sobre los hbitos de manejo de varios grupos
ocupacionales. En una muestra de 35 profesores
universitarios, el nmero promedio de kilmetros
recorridos al ao fue de 14,500 con una desviacin
standart de 3,200 km. En una muestra de 40 dentistas,
el kilometraje fue de 13,400, con una desviacin standart
de 1,950 km.
Se
Setiene
tiene
X1 14,500, s1 3,200, n1 35
X 2 13,450, s 2 1,950, n 2 40
1 2
H 0 : 12 22
H1 : 12 22
10240000
F
2.693
3802500
Para =0.05
0.025
0.95
0.515
0.025
1.9
2.693
Se
Serechaza
rechazalalaHH00,,es
esdecir
decirque
que 11 22
Luego, se prueba
la hiptesis:
H 0 : 1 2
Diferencia de las
medias muestrales
s12 s 22
s X1 X 2
n1 n 2
Valores
Valorescrticos
crticos
H1 : 1 2
3,200 2 1,950 2
35
40
622.6
0 Z * s X1 X 2
0 1.96 622.6
0 1,220.3
YY los
los valores
valores crticos
crticos son:
son: -1,220.3
-1,220.3 yy +1,220.3
+1,220.3
Se Rechaza
Se Rechaza
rea =0.025
rea =0.025
Z= -1.96
Z= +1.96
X1 X 2 0
-1220.3
Valor critico
+1220.3
Valor critico
+1050 = diferencia
observada entre las
medias muestrales.
Ejercicio
Como la diferencia entre las medias
muestrales es de 1050 millas y se
acepta un margen de error de 1220
millas, en consecuencia, no hay
diferencias significativas entre los
dos grupos
EJEMPLO
Freddy Lopez, operador de la cadena de restaurantes Las
Tejas, ha hecho una encuesta entre los clientes en dos
ciudades, pues desea averiguar si les gustara que en el
men se incluyeran sandwiches de jamn y queso. De las 500
personas encuestadas en la capital, 200 contestaron
afirmativamente, mientras que 150 de las 300 encuestadas en
una ciudad cercana tambin contestaron afirmativamente.
Freddy quiere saber si, en un nivel de 0.05 esos resultados
son significativamente diferente.
En
Enresumen
resumen
Se
Setiene
tiene
1 2
500
300
H0 :
2
1
2
2
H1 :
2
1
2
2
0.00048
F
0.576
0.00083
Para =0.05
0.025
0.576
0.95
0.8184
0.025
1.228
Se
Serechaza
rechazalalaHH00,,es
esdecir
decirque
que 11 22
Luego, se prueba
la hiptesis:
H 0 : P1 P2
H1 : P1 P2
Diferencia de las
P
1 P 2 0.40 0.50 0.10
proporciones muestrales
n P1 n 2 P 2 500 0.40 300 0.50
P 1
0.4375
n1 n 2
500 300
Re mplazando p 0.4375 en la frmula de s P1 P 2
asi como los valores de
n1 , n 2
1 1
s P1 P 2 P1 P
0.0362
n1 n 2
Valores
Valorescrticos
crticos
0 Z * s P1 P 2
0 1.96 0.0362
0 0.071
YY los
los valores
valores crticos
crticos son:
son: -0.071
-0.071 yy +0.071
+0.071
Se rechaza
Se rechaza
rea =0.025
rea =0.025
Z= -1.96
Diferencia observada
entre las proporciones
muestrales =
(0.40-.050) =-0.10
Z= +1.96
P1 P2 0
-0.071
Valor
critico
s P1 P2 0.0362
+0.071
Valor
critico
Ejercicio
Como la diferencia entre las
proporciones muestrales es de -0.10
y se acepta un margen de error de
0.071, en consecuencia, si hay
diferencias significativas entre los
dos grupos
FIN
MUCHAS
GRACIAS