Professional Documents
Culture Documents
iF ;
. ,. . .;
Supongamos oh9ra que e n vez de tener un universo de fichas con
en escola de intervalos continua tuvieramos un universo con una variable.: I
escala nominal, por eJ' emp10 un uni verso de boli tas en que e1 40%: de las i'
, . Promedio:
litas iueran azules y el 60%: grises. En este coso e1 parametro del uni r.
8. P = 0.4 10 pt9Porcion 0 taBQ de boli taa azulea. aiendo Q su complemenf .
1 - p, 10 proporeion de boli tas gr ises. . .
Al aaear repetidas mu".tras de tamafio n = 20 d te univer.o (re, L
niendo lao bolita. deapu8s de cada extraccion) 1a proporeion p de ,
Qzules de las muestras s e distribuica en forma aproximadamente normal 1
Promedio: J1. p' = P Y Error Standard: IT p
en e1 preaente ejemplo:
Promedi 0 : J1. p
=
0,4 Error Standard
IT P =V_O_'4 __ X_O_'_6
20
= O.
. 'ue ell la ' pra
'.' t!!IJI!t4Jolll!be'
1 -," ,
Nota: Es .aceptable describir esta distribucion cOIla normal siempre que" ./ -V< - ". ,
muestra tenga tamano suficiente para q'ue nP y nQ tengan valores iguale,;. _ Sx
superiores a 5. =, _,--.
Estos dos de de un nOB serviran para en3tl .., .. , .. .. v: :'
dec e1 procedlID18nto de 8&tl110010n d. para troe. Para comprender loa d -,,'
tribucionea mueatrales que .e ut'l11zan en 10 docimClala de hipoteaia
util considerar los siguientes casos: .';lrmal y 10 v
Supongamos que en vez de extraer cada vez una muestra de nuestro ,'.'- .
verso de fic hes, s eCQlDOS pares de muestras de 25 fichas cada una y que .1
tudiamos 10 diferencia entre los promedios de_estos pares. Si
a1 promedio de 1a primera muestra2el y x2 a1 promedio de la .
muestro. ocurre que 10 estadistica Xl - X2 Be distribuye normalmente
Promedio
Xi -x2
=
0 y Er ror St andard:
IT
2
IT_
'"
X x
Xl -"2
+
nl n2
72
" .. " .. .... ... . ...... ..... ... -----'-------... -... ---.... -... ..
cercano a 20.
En el presento ejomple:
trar que 8i se extr "'.
! un universo con
stribuyen normalmeD
Promedio: fl - - = 0
XlX2
y Error SluClJard:
D
- - 20
:5
de fichas con valo
'50 con una variable
=
10 .(XX) + 10. (XX)
28
25 25
Si igual procedimi e nto se siyue en e 1 univers o de holitas. ex trayendo
ures de muestras de tomono n =:: 20 10 dislribnc i on de dife rencias entre
.orcenlajes de fXlres de tendra una distribuc i on norma l con
Promedio:
" Jl:el ejeQlplo:
I que el 4m de las
parametro del unive . '.f
iendo Q su complemen ,-
, .
Promedie:
=0
y Error Standa,-d: d Pl P2
teat. universo (r.
roporcion p de boli
ximadamente normal
..
I
'" VO'4 x 0,6 +
20
0,4 x 0,6
= 0.16
20
Por los ejemplos plldielo quedar 10 impres i on que loda distri.
pucion muestral es una di s t rilluc i ou UOl" mol. 5to 110 es efec tivo. As! por
,jellplo 10 estadistica up para extraidas Gon r e posic i on tlene dis ...
t r ibucion binomial. Una d. la8 diM t ,-ibuciunes maa importcm to. en inferencia
1,4 x 0,6
= 0,1\ 10 distribucion t de Student. CUQndo se desconoce el ax de l univer.so, 10
oJ
,
'que en 10 practice es 10 8i tuac ion luas corrisnte. el error standard del
debe culculurli6 <.J partir de 1u deoviacion standard de 1u ll;Iuestra:
normal siempra qua I :'
Igon valoree iguale. ' ;
s aerviran para ent. i
s
x
=
En este caso ya no a s llcito trabajar con 1u distri b ucion
ra coaprender 108 dl
sia de hipotaais
, orlDal
y 10 variable no.' ma l s t cmdur d
x ... IL
",s tra de DUSS tro UI\
ons coda una y qua
pares, 5i 110.0.05
,romedio de 10 segun
uye normalmente con
rd:
a 2
x
a 2
x
z =
ipo 'lue 5e trabajora c on 10 variable t ..
a--
x
x - que ti ene una distribucion
s-
x
arecida a 10 normal pero Ull poc o mas Ulllr1iu. Lof:. valores de t de pe llde n del
! de 9rados de libertud. loti r.lt::: dottll"Luiuon u pca til" de l Humero usado
n el denominador para el ca1c u1o de s x ' So oLserva por e j emp l o que 01 per.
97 f 5 que an 10 curva non ual a uu valor de z ::; 1 96 e n
i;! < , ,
'!
73
I
r
I
la distribucion'de t para 24 grados de libertad corresponde a un t
2.064. Para n infinito 10 distribucion t es igual a 10 normal pero en
practica cuando el numero de observaciones as superior a 30 los valoree
z y t aon tan parecido8 que ae puede utilizar como aproximaclon la
bucion normal.
comunmenl
<:-CInEllste
18 alt",
provieno
tad,t.tt,
Aforlunadamente 10 mayoria de loa diotribucloneo muestrales
parecerse a la normal cuando el tamano de 1a muestra es grande.
fstimacion de parametros
Al estudiar las distribuciones muestrales se han elaborado
extraacion de mU8atraa d. univeraoa conocidoa. En Ia practioa
consiste en cambla, en obtener informacion sabre un universo dese a mas de
basandose en los resultados obtenidos en una sola muestra. En otras de cal
bras. se deseaestimar los parametros del universo a partir de las Donald.ral
tioaa mue.troles. realmente
Se vio en el ejemplo de 10 distribucion de promedios muestrales
maxima frecuencia de muestras este frente a1 parometIa del universal
que significa que fLx es el valor mas probable de obtener como
mU88trcl. Por 10 tanto 01 disponer de una sola muestra. 10 satad!.
sera la mejor estimacion de J-lx. Este praceso se llama Itestimacion
ya que se refiere a un punto en 10 escala de medicion. El mismo
to se puede aplicar a 10 estimacion de P a traves de 10 estadistica p. "
Es evidente que la estimacion puntual da una informacion inoomple,
porque no toma en considerocion 10 dispersion de La distribucion muest '
Al afirmor que 10 distribucion de los promedios muestroles, par
pIa. es normal se deduce que aproximadamente un 95% de
mU8atras aleatorics extrrfldas del universo no se alejari mas de 2 er
standa'rd del promedio !1-
x
del universo. A la inversa se puede decir
95% de las veces,que se obtiene una muestra del universo, su
no,queddt9 0 una distancia mayor que das errores standard del
muestral x. Existe por 10 tanto una probabilidad de 0.95 de incluir a
el intervalo cons.truido con J:' dos errores standard.
p = 0.95
En otros polabras tenemos confianza que de coda 100 predicciones
hagomos en esta forma, 95 de elIas incluiran el verdadero valor del ,
so y solo fracasaremos en 5. Este p"rocedimiento se llama "estimacion:
intervale' y se habla de intervdlos de cenfianza de 95%, de 99%. etc.
pendiendo de 10 ssquridad que 8e qUiera ,dar a la .atimacion.
Docimalia de hipritesis
La docimasia de hipotesis se reHere generalmente a 1a
dos 0 mas grupos sometidos a diferentes. Vimos que para el i
so de das grupos es cenocida 10 distribucion muestral de las diferenciaa
promedlos 0 de poroentojes de pares de muestras provenientes de un mit
universo y que ambos estan centrodas en O. Aplicando los conocimientoai;
bra distripucion normal se puede predeeir que en estas distribucione.' t
rara encontrar diferenoias muy alejadas de 0 cuando las muestras provii'
del mismo universp y que es posible adjudicar probabilidades a las
des de las diferencias haciendo uso de la variable z. E1 conocimiento!,
estos hechos ha dado lugar 01 procedimiento para docimar hipotesis 10 i
711
';("
orresponde a un t
la normal pero en
If a 30 los valoree
)foximaeion 10 dis
comunmente se eonoes como 10 prueba de significacion estadistica.
Con_iste en plalltear dos hip"tesis: la hip"tesis de nulidad Ho Y la hi
alternativa HI" En 10 hipotesis de nulidad se plantea que las mues ...
provienen del wismo univenw y por tunto conocemos 10 distribucion de
estadistica bajo este supuesto. En 10 hipOtesis se plantea
muestrales provienen de diferentes universos. Cuando 10 diferencio
grande. 8a tan grande que bajo el supu&slo de l.a hipotesiii de nulidad es ...
hecho e. poco probable, se rechuza 10 hipota_i. da nulidod y en camhio
ncepta 1a hipetesis alternativa.
La cali f ieaci"n de poco probable arbi t .-ac ia y poe cos tUDlbce se ce
e1abocado a una pcobabilidad de 5% 0 de 1%. Esto es 10 que se llama el Divel de
I practice u." ,qn.loficacion. Si para una diferencia entre dos grupos se encuentra que eSa
universo a mas de 2 errores standard de 0 sabew.os que eato ocurre 0 10 mas en al
leat En otros de los cas os en que se extraen muestros de Wl miSlno universo. Como esto
part. ... de las as consideramos improbable rachazawos asta procedencia comun y oceptamos
realmente provienen de universos diferentes. P,or eate motivo en las pu-
:lios muestrales que 1I cientificas aparece con frecuencia 10 anotaciOD al lade de una
co f1x del universo, Her.neia: nDiCerencia eetadisticamente signiflcativa, p < 0,05" a bien
)blenec como pc < 0,01" 10 que se ref ieee 01 pccceDtaje de 5% 0 1% habitual paca el ni-
tea. 1a es tOOis t qe signif icacion.
a "estimacion pun
0' E1 mismo
10 estadistica p.
nformacion incompl,
distribucion muest
per ej
de promed
lejari mas de 2 er
se puede decir
lvereo. su
standard del
),95 de inc1uir
),95
l 100 prediccioDes
adero valor del
llama "estimacion
95%, de 99%, etc.
imocion.
Ite a 10
Vim as que paca
1 de las diferEIDc1o.
de un
) los conocimiento8
tas nistribuciones
las tl'a.
ilidades a
z. E1 conoc,mien t
)cimar hipotelia 10
75
!:
'.
n
j.
-... .... -------.------.-----------r------
ESTIMACION DE LA TASA DEL UNIVERSO (P) BASADA EN LA TASA MUESTRAL (p)
[I problema
Con el propos ito de evaluar un programa de ateneion materno-infantil se
deBea eonocer la tasa de mortalidad neonatal de la poblaeion sometida a
.It. programa. Para el10 se tomb una mu tra d. nacldo8 vivos d ta
poblac16n y 8e regl$tro el N2 de defunciones ocurridas antes de los 29 dias
de vida. Estas fueron 16 10 que da una tasa de mortalidad neonatal de
Aunque este valor no as necesariamente igual a 10 tasa de mortalidad
tal de la poblaeion. 55 10 podemoB utilizar como una e5timaeion ella.
Eslimacion punlual
La distribuclon de las tasas (p) de muestras aleatoriaa extraidas de un
universo donde 1a taaa ea P. &8 apro,ximadamente una curva normal con:
promedio
error standard
=
p
a
p
Podemos decir, pues, que 10 tasa observada. 20%0, e8 una estimaci on de
10 desconocicla tosa de mortalidad neonatal de 10 poblacion sometida a este
programa materno-infantil. .
Estimac.i6n por
Considerando la freeuente disparidad entre la tasa muestro1 y 1a del
universo. parece mejor establecer un intervalo, para estimar 10 lasa de 10
pob1aci6n.
De acuerdo al teorema referido. repetidas muestras de tamano n = 800.
obtenidas aleatoriomente de u"n universo en e1 cual 10 tasa de mortalidad
neonatal es P. se distribuyen aproximadamente de acuerdo a una curva nor ...
lRal. con promedio y error standard yo indicadoso Debereruos esperar que e1
95% de las muestras, aproximadamente tengon tosas (p) comprendidas entre
los limites:
(P
2.5%
1. 96 0- )
P
y (P + 1. 96 a )
p
95% de
lasa de mues-
lras comprendidas
eS!os I imi les.
p
/
P + 1.96 up
La tasa d e Dlortaj1dod neonatal
dioll por 1000 naci dos vivos:
el NP de de menOTes de 28
76
Ln
l.l:1l [tlera de es
Est os limit
pacte de la ta,
pueden eatablec
(p 1. 96
Pues to que
mas de 1.96"0 e
universo (Pl" er
Por ella se ha
proxima pagina)
En 5 de cad
mas de 1.98 0 f
entre sus limPt
1m % - 95
p
IL (p)
Ifanti! se
ometida a
'B de esta
IS 28 diaB
11 de 20%.
lad necna ...
ella.
das de un
'on:
wcion de
:10 a este
y la del
Jsa de la
n
"
800.
,rtalidad
(rVa 11or-
iC que el
as entre
!S de 28
Lt; (.:dl\$eCuencia, solo 5'; df.! las rnue!'Jtras corresponder6n a tasas que es-
tU11 fuera de estes limites.
Estos limitee no son determinables, puesto que P 9S desconocido. S1 Be
pOi'te de 10 tasa de 10 muestra, que si es conocide .(en eete caso = 2CtYoo),
pueden establecerse los limites.:
(p y (p +
Puesto que 10 tasa de 10 muestra no diferira de 10 tasa del Universo en
mas de 1.9600 en 95% de Ius muestros, estes limites incluiran 10 tasa del
universo (P)' en 95 de cada 100 intervalos que construyamos de este modo.
Por ella se habla de INTERVALDS DE 95% DE CONfIANZA. (Ver esquema de 10
proxima pagina).
En 5 de cada 100 veces, 10 tasa de 10 muestra diferira del universo en
mas de y los que constrllyamos con este'p no incluiran
entre sus 11m tes Itt toso del un1verso. Este error acontecera en:
100 % .. 95 5%
95\
p
p
85 ,
d.
I"
intervalos de
p
confianza in
8
clui ran la
sa del univel
so.
I
I
I
! d.
I"
p .I
i ntervalos de
confianza no
incluyen P.
p'
77
,
!l
II
: I
."
i'
,
,.
Para eAtoe lrll il eR neC88itamo8 determinar el
error standard.
up = IjPnQ
Se ve que este valor no es determinable porque requiere el valor de p.
que es precisomente 10 taso de"conocida del universo. Nos vemos obligados
a estimarlo basados en 10 muestra y designaremoB e1 efror standard estimado
por fl
p
.
V
;O" 980 =
800
V
I9
Goo
=
800
24.5 = 4.95
5
El intervalo d. oonflan"o de 95% queda determlnado en t. eJemplo por
los siguientes limites:
p + 1. 96 s = 20 + 1.96(5) =
29.8 %,
30 %0
p
p - 1. 96 s = 20 - 1.96(5) '"
p .
10,2 %"
!.
10 %,
EN SUMA. basados en una exper iencia de 800 recJ.en podemos de-
cir con una c onfianza del 95%., que 10 tosa mortalidad neonatal en 1"0 po-
blacion oeneficiaria de este programa este comprendida entre 29,B%o
Seguridad y precision de la eslimacion
Hay dos elementos de interes practico en la eBtimacion de 10 toea del
universo. La SGURIDAD 0 CONrrANZA es 10 probabilidad de que sett correcto
un intervalo de conficrnza calculado con el metodo indicado, esto es, que
inciuya -entre sus limites a 10 tosa del universo; En este ejem.
plo. 10 seguridad es de 95%. La confianza del intervalo esta determinada
por el valor z que hayamos elegido. que en este caso ha sido 1.96.
Por otro parte. con esto confianzo qe 95% afirmamos que la taaa de 10
muestra no debe diferir de 10 toso del universo en maS de 1.96. En este
ejemplo. en mas de 1.96 (5) '" 9.8%,. Este valor mide la PRECISIO" de
10 estimacion. Diriamos que una eatimaaion de 10 v.rdadera ta.a d. morta-
lided n.onato1 d. 10 pohlac16n a programa'serla ma. precisa sr.
por ejempl o. pudieramos afirmar que 10 taso de 10 muestra no difiere de la
tasa del uni verso en mas de 5% .
La conFianza del intervalo puede aumentarse utilizando mayores valores
para z. Por ejemplo, para de conFianza de 99%,
z = + 2.58
z '" - 2.58
puesto que dentro de estos limites se encuentran aproximadame:n,te el 99% de
las muestras. El intervalo es ahora:
p + 2.58
2.58 p
s '" 20 + 2.58(5)
p
= 32,9 %0
s '" 20 - 2.58(5) '"
P
7.1
78
.!. 33%0
7%0
Hernos qanadc
que ahora:
en tan to que en
zs '" 1. :
p
El modo de g'
tar el tamano de
tasas varla inve:
gamos que 10 expE
Se ve que au.
eate error stand(
raiz cuadrado.
Los limites d
95 %
99 %
EN IIESUJrE". 1,
8on:
Confianza
95 %
Determinacion del
De todo es to t
decidir sobre el
objetlvos que se h
intervalo de conf j
masludo ampllo par
clones. Podria pI
taria. lCU61 serra
Supongamos que
mac ion de la verda
- Segur idad : i n te
- Precision: que
en m
.... .... -.. .... -----....
I
.. ---.. - ... ---.... - .... _____ """. ..... .",,..-,:u,, .. ,.
t erminer e1
valor de p.
lS obligados
Ird es tlmado
1.95 - 5
ejemplo por
podemos de-
II en fa po-
.2%.y 29.8%.
la taea del
eo cor recto
sto es, que
este ejem ...
deter . ,ada
16.
tasa de la
3. En este
de
a de morta_
)recisa sr,
fiere de la
res valores
el 99% de
Hemos ganado aSI seguridad. pero a costa de sacrificar precision. por.
que ahora:
zs = 2.58(5) = 12.9
p
en tanto que en los Ifmites de confianza de 95% era:
zs = 1.96(5) = 9.8
P
El modo de ganar precision sin perder seguridad (y viceversa) es aumen-
tar el tamano de la muestra. puesto que la magnitud del error standard de
tasas varia inversamente dondeo es e1 tamono de 10 muestra. Supan-
games que 10 experiencia se hubiera hecho con 3.200 nines:
20 x 980
3.200
= V12.6OO =\ I6.l =
3.200 V
2.47 :!:
2.5
Se ve que aumentar la muestra en 4 veces " (3.200/800) ha hecho reduelr
este error standard a la mitad (5/2.5) debido a que n se encuentra bajo la
rai.z cuadrado.
Los limites de confianza son ahora:
son:
(20 + 1.96(2.5)
,;
25
95 %
.
(20 - 1.96 (2.5) 15
(20 + 2.58(2.5)
..
26.45
;
26
99 %
(20 2.58(2.5)
=
13.55
14
EN ltESUJrEN, los tervalo de conf ianza para las si tuaciones es tudiadas
Confianza
95 %
99 %
n = am
10 - 30
7 - 33
n = 3.200
15 - 25
14 - 26
Determinacion del tamano necesario de 13 muestra
De todo esto resulta que es conveniente. al iniciar una investigacion.
decidir sobre e1 tomano que deberfa tener la muestra para satisfacer los
ohjetivos que se han determinado. Por ejemplo. podria considerarse que e1
intervalo de confianza que se ha calculado basado en BOO ninos. parece de-
maslado ampllo para reBolver sobre la exten.16n del programa Q otrdft pobla-
olon... Podria planearse entonce. hacer una segunda experiencia complemen-
taria. LCUal seria el numero de observaciones que deberiamos realizar?
Supongamos que se especifican las siguientes condiciones para 10 esti
macion de la verdadera tasa de mortalidad neonatal:
_ Seguridad: intervalo de confianza de 95%
- Precision". que la tasa de la m t d'f' d 1 t d 1
ues ra no e a asa e universe
en mas de 4%QI
79
I
,
i'
'.
:' i.'
El requisito de seguridad 0 confianza se cumple utilizando un valor d.
z tal que el 95% de las muestros esten incluidas entre (P - z U ) y
(P + z up)' este coso: p
z= 1.96=2
El requisite de precision se haclende
p-P=4 %.
Es necesario ademas tener alguna idea sobre el posible valor dp. 1u U1S0
de mortalidad neonatal que se trata de estimar <Pl. Basados en 10 expe.
riencia anterior. usorfomos 10 tasa observada = 20%0. como estlmacion de P.
Entonces:
p - P
z" ---
sp
980
=
siendo
4
2
=
2
20 x 980
:;: 22::: 4
n
n =
20 x 980
4
=
19.600
4
= 4.900
Una muestra de aproximadamente 5.000 ninos satisfaria los requisitos
establecidos.
80
_._ .... . _-". _, .. ....... - . . -----...
'---"--"" . ...... ,
I
LA PRUEBI I
Problema
En al proc
cia se trata f
caracterlstic(
trae de univeJ
cias. el proLl
dad de tales d
mueatreo pued!!!
rencias recies
bleme que resl
teorie de la pre
Requlal to
grupos que se
8i los grt
cion. en otro!
ellos es resp<
En general
han sido adjud
semejantes en {
nes de obse rvOf
do se t rata d,
do 101 ebeervOf
Exlaten Inu<
aleator ia de If
Uble "ntonee.
como Bea posib:
grupos en los I
estudio. Por
rio. podrio uU
programo y que
Bociales, econ,
con e1 per iede
tantea faetore.
016n.
Aun OBl., eE
iguales. Por,
droga A en la I
cion con lin gru
mas que s e obse
Si stl cedi81
que los del gru
be (1 1a mayor ,
t ratodos can el
en el mismo sen
Por el cont
as! el grupo tu'
ba de "ignif ieo
Conven c:,! 'onc:rl me
cUra acelon "9
lD valor de
,l y
de 10 Lusa
in 10 expe ..
acion de P.
requisi tos
LA PRUEBA DE SIGNIFICACION ESTADISTICA DE UIFERENCIAS ENTRE TASAS
EL METODO GENERAL SEGUIOO EN LA PRUEBA
Problema
En e1 proceso de investigar 1a veracidad de llna hipOtesis, con frecuen ..
cia se trata de comprobar s1 existen 0 no diferencias en alguna 0 algunas
caracteristicas de dos 0 mas grupos. Estos grupos son habitualmente mues-
tras de universes en estudio. Cuando 10 investigocion comprueba diferen ...
cias. e1 problema que resta es pronunciarse, per iqduccion. sobre 10 reali ...
dad de tales diferencias en los universos de origen. puesto que e1 error de
mU8streo puede producir dlferencios fl)ueatralee que no Gorreaponden a dire ..
renolas realea en 1aa poblaclones e unlversos orlginales. Este es el pro.
blema que resuelve 10 PRUEBA DE SIGNTrICACION ESTADIS1'ICA. usando de la
teoria de la probabilidad.
Requisito previo a 10 prueba de significacion es 10 similitud de los
grupos que se comparan.
Si los grupos difieren ademas del factor que es motivo de investiga-
cion, en otros atributos, es evidente que no podemos establecer cual de
ellos es responsable de la diferencia observada.
En general aceptamos 10 similit.ud de los grupos 8i los "tratamientos"
han sido adjudicodos aleatoriamente a las unirlades de observacion y si son
semejantes en ambos grupos las definiciones. metodos de medicion, condicio-
nes de observocion. etc. Estos requisitos son mas fociles de cumplir cuon-
do se trata de- un experimentol esto eSt cuando e1 .investigodor ha provoco-
do las observaciories.
Existen muchas si tuaciones practicas en que no es posible 10 asignacien
aleatorio de los tratamientos a las unidades de observacion. Solo es fae-
tible entonces buscar un grupo de control tan parecido al grupo "tratado"
como Beo poaible. En tal caso, Be requlere Investlgar 10 similitud de los
grupes en los atributos reglstrables y que sean at1ngentes 01 fenemeno en
estudio. Por ejemplo, 81 se deseo evaluar 10 acelen de un programo sanita-
ria. padria utilizaree una poblaci6n testlgo en 10 que no se desarrol1e tal
programa y que tenga similores caracteiisticas demograficas, sanitarian.
sociales. economicas. etc. 0 bien utilizar la misma comunidad. comparando
con el perfodo anterior al programa. siempre que todo indique que los res-
tantes footores q\le influyen en el nivel de salud no hayan tenido varia-
cion.
Aun osl. es posible que se encuentre que los grupos no son enterarnente
iguoles. Por ejemplo. supongamos que se investiga 10 aecion de una nueva
drogo A en 10 tosa de eurocian de una determinada enfermedod par compara-
cion con un grupe de control que recihe 10 droga convencional B. Suponga-
mos que se observa una mayor toea de eurocian con A que can B.
8i sucediero ooemas que los cases tratados con A fueran menos graves
que los del grupo de control, no podriomos precisar si 10 diferencia se de ...
be (1 10 mayor ClCcion del tratcrmiento A 0 01 caracter mas benigno de lOB
tratados con elf En este caso e1 factor que perturba e1 experlmento opera
en e1 rnismo sentido que el efecto que se intenta detector.
Por e1 contrario, si los casos tratados con A fueran mas graves y aun
aSI el grupo tuviera una tosa de curacion maS alta que el control, lcr prue-
ba de significaci6n. si se cumplen las condiciones que se establecen mas
"Convencionalmente se habla de '"Tratamie,tlto" para referirse q .los (actores
cura aecl&n S8 per comparac16n de grupos.
81
\
'I
i
(
" i,
"'; ;1
!.
t
' "
\.;\
<. i
::1
adelante. podria llevarnos a aceptar la meJor aeclon de A. Esto es po.ible
porque e1 factor que diferencia los grupos tiene una acolon inverso 01
efecto investigado. Naturalmente. el efeeto revelado por e1 experimento
eerla menor que el real.
Cuando es po sible individualizar los faetores que haeen que loa grupos
no sean similares
r
estes factores pueden ser neutralizados y restablecer
asi la eondieion de similitud. Por ejemplo. en el experimento que se eo-
menta podrfa B9f factible dividir los caROB aegun gravedud, y comparar laB
dos drogas en dos qrupos de graved ad semejante.
La prueba de significacion estadistica
I) Planteamiento de hipotesis
Toda prueba de significacion estadistica se plantea en terminos de una
disyuntiva entre dos hipotesis referentes a 0 los universos en estudio:
10 hip6tesis de nulidad y 10 hip6tesis alternative. Se enuncian en 10
gulente Corma general:
Hipotesis de nul idad (Ho)
Los grupos comparados no difieren en 10 caracteristica (parametro) es-
tudiado. Por 10 tanto, 10 'diferencia observada en 10 investigacion es con
secuencia del error de muestreo.
Hipiitesis alternativa (H,)
Los grupos difieren en 10 caracteristica (parametro estudiado. Por 10
tanto 10 diferencia observada es consecuencia de efectivas diferencias en
tre los universos de origen:
Ejemplo, Un investigador estudia 1a viru1encia de dos cepas microbianas
(A y B) por inoculacion 0 dos grupos de animales, registrando 10 toso de
letalidad (% de muertes) en 10s animales inoculados.
Sea:
P ,-,
A
toso de letalidad en universo de animales Inoculadoll con capa A.
P
B
'"
tasa de letalidad en universo de animales inoculados con cepo B.
Las hipotesis son las si.guientes:
Hipotesis de nul idad
La tasa de letalidad de animales inoculados es igual con amba8 cepas.
Esto equivale a negar una diferencia real de virulencia entre las dos ce
pas.
II P - P 0 bien P - P '" 0
O'A B A B
Hip6tesis alternativa
La letalidad de ani males inoculados con 10 capo A ee diotinto que 1a
letalidad induclda pC'r 10 cepa B. Esto es 10 mlsmo que aceptar que 10 vi
rulencia de las dos capas e, diferente.
o
E1 metodo para resolver esta disyuntiva de hipotesis es el siguiente.
5e aeepta por un momento que la hipotesis de nulidad es cierta. Es posible
entonces estimor 10 probahil-idad de obtener una diferencia de igual 0 mayor
82
-._----
magnitud qu
mueBtros 01
sis. 8i 10
5i la proba
yunti va que,
2) Hive
De aCHe
sino de pro:
Aadh<lM
babi I idad a,
na prebabi I
heche de qu
que oeu rro
siendo esta
El nive
entre otTOM
un nivel de
para" rechaz!
108 datoR Y
Podrfa I
este error,
cometer un E
zar una hip
posibles "8
Deei
No r
Rech
3) Deter
La regii
extremos qUE!
de que 10 mu
La local
de HI' 5i H
entonces se
diferencia.
E'jemplo:
la/2
El area
,s posible
Iversa 01
perimento
08 grupos
stablec .. r
ue se co-
'parar las
lOS de una
I es-tudio:
en 10 si-
letro) ell_
,
:m es con-
>. Por 10
:mcias en-
.crobianos
la tasa de
a A.
a B.
bas cepas.
as dos ce-
nta que 10
que la vi-
siguiente.
Es posible
,al 0 mayor
\
,
'.
magnitud que 10 observoda. puesto que se conoee 10 distribucion teorica de
muestras aleatorias obtenidos en las condiciones que establece la hip6te-
sis, Si la probabilidad es muy baja, rechazamOB 10 hipotesis de nulidad.
Si la probabilidod es mayor no rechazamo8 10 hipotesis de nulidad y 10 dis-
yuntiva queda sin resolver.
2) Hivel de signi ficacion
De acuerdo oeste razonamiento la decision que se tomo no es de certezo
sino de probabi.lidad; en consecuencia. esta sometida a error.
Aechozare mos 1.a hip6tesis de nutided si 10 pr,ueba da un valor cuya pro-
ba bilidud asociado de ocurrencia bajo H es igual 0 mellor que alguna peque-
no probahilidad simbolizada por u. que llamaremos nivel de significacion. El
hecho de que e1 volor sea poco probable, no quiere decir imposibilidad de
que ocurra par azar, luego, corremos un riesgo conocido de rechazar H
siendo esta verdadera. Este es e1 e rror t ipo I. que designamos como n. a
El nivel de significacion es fijado par e 1 investigador. considerando
entre otras factores. los consecue'ncias del e rror. Habitualmente se fija
un nive l de 5% ( a _ 0,05) 0 de 1% (ll._ 0.01). En todo coso, el criterio
para' rechazar la hip6teaiB nu1a debe establecerse previamente a1 examen de
los datos y no subordinaTse a los hal1azgos de .La investigacion.
Podria pensarae que e1 procedimlento mae segura es reduclr a un minima
8ste error, pero este requisito signiflcaria aumentar 10 probabilidad de
cometer un segundo tipo de error. designado que es e1 error de no recha-
zar una hip6tesis nula siendo esto falsa. El esquema de las situaciones
posibles es el siguiente:
Decision Realidad de hip6tesis de nulidad
Verdadera FalBO
No rechazar Ho Decision correct a Error f3
Rechazar Ho Error a correcta
J) Determinaci6n de la regi6n de rechazo de hip6tesis nula
La region de rechazo con_iate en un eonjunto de valoree poalbl tan
extremos que, cuando H
o
' es verdadera, es muy pequena la probabilidad
de que la muestra observada produzca un valor que este entre el10s.
La localizacion de la region de rechazo es afectada por 10 naturalezQ
de H
l
Si HI indica la direccion predicha de 10 diferencio. (HI: P
A
> PB)
entonces se requiere una prueba unilctteral. si no indica 10 direccion de 10
diferencia. (Hi: P
A
t Ps) entonces se requiere una prueba bilateral.
Ej emplo:
l0/2
Ho : P
A
= PH
Hi : P
A
" P
B
-l
(J/ 2
Ho: P" = PH
HI : P
A
> P
B
E1 area sombreada muestra 1a region de rechazo de Ho' Th ambos casos.
83
'I
, ", 11
1
"1 .
II '.'"
;f
J" .
I
'; .
,;1::.
, ,
,
,
, .
... .
,
i
La determinacion de 10 zona de de 10 hlpot h nula a. baaa
en 1e dlotrlbuoion t.6rloa d. 10 dlf.ronaia entre mueotra ia auai d.pend.
d. lae condiciones del experimento. E. diferente. por eJempio. Ii 101 di.
fereneia on entre proporeionel. promediol. eoefieientea de regreli6n.
etc ai las muestras son dependiente. 0 independientea: .1 Ie comparan dOl
o ma. grupos: .i 10 de.viaeion standard del universo eS conocida 0 descono.
cida, etc.
4. Interpretacion de los resultados de la prueba
Oiferencias estadfsticamente significativas:
Interpretacion correcta
5i la hipotesis nula fuera verdadera. es improbable. de aeuerdo al ni-
vel de significacion establecido
t
que se hubiera obtenido una diferencia
igucrl 0 mayor que 10 diferencia Por 10 tanto, aceptamos que ' se
origina en el efeeto de un factor difereneial entre los grupo
Interpretaclones Incorrectas
a) "Es imposible que de esto magnitud se produzcan por error de
muestreo.
b) La significacion estadistica prueba que el factor en estudio ha causado
la diferencia registrada:
01 ferencias estadfsticamente no signi ficativas:
Interpretacion correcta
De acuerdo al nivel de s'ignificacion que se ha preestableeido, no hay
suficiente evideneia para reehazar la posibilidad de que 10 diferencia ob.
servada se debo a error de muestreo. es decir. 10 posibilidad de que no
exista realmente en los universos en estudio.
Interpretaciones incorrectas
a) El experimento prueba que e1 factor en estudio no tiene ereeto diferen-
cial en los grupos.
A continuacion veremos algunos pruebos de significacion estadistica.
Prueha de significacion estadlstica de diferencias entre la tesa del uni-
(P) y la tasa de una muestra (p)
EI problema
La tasa de 1etaiidad de 11] Hebre tif:>idea antes del usa de 10 clorcnli ..
ceti na era de HJ!b (P.,). segun 10 muestra una larga experiencia hospitala-
ria. Los primE'ros 1& casos tratados con este antibi6tico revelan una Ie.
talidad de 2% (Pt) ,Puede aceptarse la dlferencia lOY. - 2% = 8% como una
evidencia del mejor .efecto del nuevo tratamiento?
previo de los datos 'disponlbles
Deberiamos estor ciertos que e1 grupo tratado can cldromicetina no di-
f i ere de 10 'experiencia hespitalaria anterior en ningun factor atingente a
10 letolidad. excepto en at heche de no haber recibido e1 antibiotico. Po ..
drlan ser factores de no eomparabilidad. entre otros, la menor gravedad de
84
108 cas os t.n
1a virulenclo
La simiJi
vidido en gru
lldad. Por,
los P!JE
las tasas de
cad a grupo.
Si los fa
r-d. exper
.t a df'! h abo, r' I"
que sera odmi
to a 10 mi tad
SnUsfed],
Fp.duc(' .La 1(' t
cion a portir
expuest.a 0] e
ClIIP linn 11'
posihle .imrJqi l
sualmel1te. "I'"
Clar if i.cor e" I
ha de signific
La prueba de
I. Form,,1
Hipotesis de n
La taAD dl
10J;;. iguol qlli'
It] c lOTom ice lj
En simbolc
H P ,-
o' t
Esto es p-
error de muest
Hipotesis aile
La tOS(1 df.
menor que 1.0 t-
En s.i.mbolo:
Hl : PI: <
Es to es erp
vas di f ere'lc io:
2. N I ve I I
Podemos elf
re deci r que f:
decl r. recllaz(
aceptor que .10
realmente no 1<
Si somos ' m
1%, par e j empl
1a bala
a1 depende
ai la8 di-
oeqredon.
mparan d08
o descono-
rdo al ni-
liferencia
nos C" " ' se
r error de
1Q causado
10. no hay
ob-
de que no
:> diferen ..
lstic'-...
I del uni-
lciororo i-
lospitala-
tn una 1" ..
; como una
ina no di-
:inqente a
tieo. Po-
:avedad de
I
:'
los casos tratados: diferencias entre criterios diognosticos 0 cmnbios en
10 virulenci a del germen.
La similitud de los grupos podria ser si e 1 JlHll f' rial es
vidido en grupos segun e1 factor ajeno 01 tratamienlo que Ctf l1{'L' 1 (I Ja leta ..
lided. Por ejemplo, si s e trata de 10 gravedad inlciill de lu I.":, nfermedad,
los casos pueden ser c lnsificados en leves. de medinnn grl'Jvednd y graves:
las tasas de letolidod para trat.adoa y con troles podr.ltJll flar comparadoll en
cado qr.upo.
Si los fac toTes que hacen clisimi les a los grupos no pueden ser detecta-
dos. el expe r.imen to no pue de 11egar a una cone I usian uti 1. Sa ve 10 Yen to ..
j a de haber 10 d iseiiCldo me j or : par e j emp.la. de f inienda un grupo de en fermos
que sera adln it ida en 10 expe r iencia y as ignondo oleo tor iamen te e1 t ratamien ..
to a 10 tnilad de elIas para dejar 1" otra mitod como grupo testigo.
Satisfechas estas condiciones, asegurar que 10 c 1oromicetino
reduce 10 letolirlad 0 Z'-6 en cuolqujer CQSO de {jehre trntaclo en
condiciones similares? La i de a de "cualquier casq" implieD una generalize ...
cion a partir de una muelStra de 100 COBOII. Sabemoa que toda mU9atra @lItd
expuesta a1 error de muestreo . aunque sea uno muestra aleatoria. Podrio
ser que una nueva experiencia mostrora una letalidad de 4% 0 de 1%. Aun es
posibl e imaginar que el antibi6tico no fuer a realmente efectivo y que, co ...
sualmente, hemos obtenido una muestra con una tasa excepcionalmente. bajo.
Clarificar es ta duda. en terminos de probabliidad. es e1 objeto de 10 prue-
ba de signiflcacion estadis tica. .
La prueba de significacion esladfsllca
1. formulacion de hipolesis
Hipolesi s de nul idad:
La tasa de letolidod de tifoideos tratadas con clorornicetino (P
t
) es
laC;. iguo1 que 10 tasa de letalidad de 10 fiebre tifoidea antAs del lISC de
10 (Pc)'
.En ,elmboloB:
Esto es equivolente a decir que 10 diferenclo abservada se debe 01
error de muestrea.
Hipolesis aiternat'iva
La toso de l e talidod de tifoideas tratados c-on c lor omi ce tino (P
t
) es
menor que In to sa de letlllidod de l os no tratados (Pc )'
En s;rnbolos:
Hl : P
t
< Pc 0 bien HI: P
t
- Pc < 0
E:;t:o os equivalente a decir que 10 dif e rencia observada traduce efecti-
vas di ferEmcias en las poblaciones ol"iginales.
2. Hivel de significacion
Pademos eleqir un nivel de signifieac ion de 5% (l = 0.05). Esto quie-
re decir que fijalilos en 5% e 1 riesgo de comet e r el primer t i po de error, es
deeir, rechazar 10 hipotesis nul a siendo e sto verdadera, en este coso,
aceptor que 10 cloromicetincr es mejor tratamiento que e1 antiguo. cuando
realmente no 10 es.
Si somos mas exigentes y trabajamos con un nivel de significacion de
1%, . por ejemplo, habremos reducido el primer tipo de error pero aumentado
85
I
' ' ;
I.
;. j
(,
i
el legundo Upo de error, que conlilte en declarar qua a1 nuevo tratamlento
no eR efectivo, "cuando en la realldad eR meJor que e1 antiguo.
3. Determlneclon de Ie zone de rechno de HQ
Aoeptamo. por un momento que Ho (P
t
= Pc = e. verdadera. En tal
caso podemos tomar 10& 100 tratados con cloromicetlna como una mu tra d,
un universo con tasa de letalidad para 10 fiebre tifoidea de 10V0.
Teorema
La distribucion de porcentajes (tasas) de muestras de tamafio n. extrai.
das de un universo con una tasa igual a P, es aproximadamente una normal
con!
promedio -= taMa d"l universe == P
error standard = a
p
= \/ donde Q = 1 P
En este ejemplo. de acuerdo con 10 hipotesis de nulidad:
P
=
tosa de 1etalidad de tifoideas, tratados o no con cloromicetina
=
1m:
(0.10)
Q
=
tosa de sobrevivencia de estes enfermos = SCF<; (0.90)
n
= tamano de 10 muestra ibo COSOS
Definidos el promedio y 10 desviacion standard de 10 curvo normal, es
posible utilizar la tabla de area de esta curva. Se trata de encontrar que
tosas muestrales. menoras que el promedio, difieren d. '.te en tal magnitud
que la probabllldad de obtener, par simple azar, esas tasas a una menor en
10 muestra. no exceda 5%.
Se requlere definir. pues. un area en e1 extremo Izquierdo de 10 dis ..
tribucion que equivale 0 5% del areo total bajo 10 curvo.
En 10 tabla 'correspondiente se observa que e1 area a la lzquier'dn de
z = -1.65 es igual a 0.05 (5%). De acuerdo con e1 nivel de significaci6n
preestablecido. esta sera de rchazo de 10 hipotesis nula.
l0'13 de
de Ho
-, "65
D
I
86
Por 10 tc
t ros datos
4. Reso I
S610 res!
de rechazo de
z =
p-
o
Sabre I a COliC
Esta Calle
rias limitaci
Desde llle
deo y recho7.o
mas un riesgo
es posible. cr
de muestreo.
dumhre y es s
similores, qUI
te juicio: es
de tal modo q
10 tifoidea.
La prueba
grupos son en
mente las con
t lene aplicoc
terminos de c
De 19l1al
las medici onE
pueden llevar
nlficacion no
Notese. p
droga en term
no modi f leata
(reduccion de
El juicio sob.
Prueba dOe" sig
tras.
Problema
En un con
de terreno en
sectores en ql
tes, a los cue
tores en que J
cilia de lOR 1
Log resul t
tratatlll.nto
'a, En tal
mueotra de
n. extraf ..
una normal
.tina =
normal, e.
contrar que
a1 magnitud
no menor en
de 10 dis-
I de
lcoc16n
a,
I
,
,
Por 10 tanto redwzaremos It sj el 7. que c alc HlamoA CJ partir de hues.
tre e datos es menor 0 i gual que _1.6 5 .
4. Resolviendo sobre la diferencia observada.
Solo resta ahora establecer si 10 diferenc ia observada cae en 10 zona
de rechazo de H cal c ulando el c orrespontiie nte z:
o
z
p-p
cr
p
2 - 10
3
=
-8
- 2.6
3
El zobs es menor 4ttP. ... 1,65 .por 10 tanto, de cicuerdo
obj e tivos p[ eestahlec idos . rechazamos 10 hipcSte sis nula .
Sobre la conclusl6n alcanzada
los criterios
(P
t
P =
, C
Esta conc lusion. Qunque obtenida por una me t odologia. tiene va-
rias limitaciones que deben tene rse s iempre pr esentee
Desde 111ego, 01 oceptor lin real efecto de 10 cloromicetino en 10 t Hoi-
deo y rechazar 10 hip6tesis que 10 diferencla observada s ea casual. corre ..
mas un rie sgo calculado de error. Basados solo en una experiencia de 100.
A8 posible. aunque sen poco probable. que 10 dlfel'encia fuera simple error
de muestreo. La induccion basada en 10 muestra no liene c aracter de certi-
dumbre y es s olo tm in i cio de probabilidmi. La repetlclon de exper l enclos
similares, que coinc idon similar c onclusio n. afia'1zaron coda vez mas es-
t e juicio: e s to 10 que ha sucedido en 10 practica con 10 claromicetino
de tal modo que no panemas ahara en duda 10 e fi caciade este tratamiento en
10 tifoideo .
La prueba de significacion t rabaja can e l supuesto impl.icito que ambos
grupos s on en teramen t e i guales. 5i e 1 grupo tes t no c umple rozonable-
mente las condiciones de similaridad con el grup9 tratodo. esta teoria no
tiene aplicacion. Por eso e1 di.ena del experimento y e1 estudio de loe
terminos de c omparacion son asuntos previos a la prueha de significaci6n.
'De igual modo, 108 e rrores de observacion,definiciones deticientes, rna ....
las medieiones. criterios no uniformes. sesgo de los observadores. etc.
pueden 11e vclr a una conc lusion e rronea, que 10 teor.ia de 10 prueba de sig ..
nificacion no evitar.
N6tese.por otra pa rte, que se juzga en este ejemplo e1 efecto de 10
droga en terminos' de r educe ion Je 10 letalidad. Pudiera se r que una droga
no modificatcr est a toso. PbCO sin embargo fuero efectiva en otros aspectos
(reducci on de l tiempo de enfermedad. menor frecuencia de secuelos. ,etc.).
El juicio sobre,la en consecuencia. depende del indicador usado.
Prueba d'e
o
sigllificacion estadisti ca rle dilerencia 'entre tasas de dos mues-
t r as.
Problema
En un coosultori o se deseohn estudiar e l impacto que tiene e1 trabajo
de terreno en e 1 es tado nutri.tivo de l iac t ant e. Con tal objetivo. en los
aeetares tl n que no hay programa de terreno, se tomb un a muestra de laetan ..
tes, a los cnales se califico su eslado nutritivo, 10 mi sma se hizo en sec-
tores en las auxiliares de enferrneria hacen visitas pe riodicas 01 darnl ..
ci1io de los 10ctantes .
Los r esultados fueron los siglJientes:
81
oj
I
i
II
\I
(' (!
.,
I
.l \
>' .'
:-",:,
Sectores
Con programa
Sin .programa
Tot 0 i
E.tado nutritivo de lactante. en .ectore.
con y sin programa de terreno
Estado Nutritivo
Eutr6fico.
De.nutrido.
N % N %
120 80.0 30 20.0
126 70.0 54 30.0
246 74.5 84 25.5
Total
N %
150 100.0
180 100.0
330 iOO.O
;,Es realmente mayor 10 tasa de desnutricion en los sectores sin progra-
ma?
Anal isis previo de los datos disponibles
Antes de prooeder a lopruebo d. oiQnificooicn tad tioo d.bt.ra
existir una razonable aeguridacl de que los sectores con y sin programa no
difieren en otros aspectos que pueden influir en e1 estado nutritivo del
lactonte. El hecho de existir tales dlferencias podria impedir .oear con-
c lusiones respecto 01 fact or trabajo de terreno que es e1 que n08 in,teresa
en es teo caso.
La prueba de signi licacion estadislica
I. Formulacion de hipotesis
Hlpotesis de nulidad
La tdsa de desnutricion en el universe de lactantes sin programa: PI'
es igual a 10 del universo de lactantes con programa: P .
Esto equivale a decir que 10 diferencia debe a1 error de
muestreo.
En simbolos:
Ho : PI '= P
2
Hlpotesis alternatlva
o bien:
In tasa de desnutricion real de los loctantes sin programa es mayor que
10 de los lactantes con programa.
Esto equivale a decir que 10 diferencia observada traduce diferencias
recles entre las poblaciones oriqinales.
En simbolos:
HI : PI > P
2
o bien
2. Hlvel de signilicacion
Podemos elegir un nivel de significacion de 5%. esto equivale a decir
que estamos aceptando un riesgo de un 5%. de rechazar 10 hipotesis nula
slendo esta verdadera.
88
, ,
-----,--
3. Deter
Suponien
PI = P2 = P
Teorerna
Al extral
renclas entt'l
Como una non
promedio
error st l
En eete ejem}
n
= numero
1
O
2
=
numero
p = tasa d.
CanUel.
co1're8f
De eata m
DefioidoB
tobia de area
en tre taaDa mt
bilidad de obi
cion Hjndo).
derecho de 10
En 10 tabla c
(Zcrit) es igt
tal
% "
100.0
100.0
IcY' 'J
8in progra-
'co dehiera
rograma no
ritivo del
BaCor con-
s in,teresa
)groma PI'
al error de
8 mayor que
Hferencias
Ie a dee!r
;tesis nula
..
_ .1 . "';"
3. Delerminaciin de la zona de rechazo de la hip61esis nula
Suponiendo que la hipotesis nula fuera verdadera tendriamos que,
PI = P
2
= P.
Teorema
Al extraer pares de muestras de un universe con porcentaje P. las dife-
reneias entre los porcentaje8 de las mueBtras Se aproximadamente
como una normal can :
promedio = 0
error standard =
En eete ejemp1o:
n
1
n
2
p
=
=
=
numero de lactantes en la muestra del sector sin programa =
150
numero de 1actantes en 1a muestro del sector con proqroma =
180
taea d. deanutricion en el universe de lactantes con 0 sin programa.
Cantidad desconocida y que habria que estimar. La mejor estimacion
corresponde a 10 tasa de desnutricion del total de ninDs estudiados.
x 100 = 25.5 %
De esta manera a PI-P2 queda estimado por:
= +
=
25.5 74.5
+
25.5 74.5
=
4.8
ISO 180
Definidos el promedio y la desviacion standard. es posible utilizar la
tabla de area de la euna normal. Se trata de encontrar que diferenc ias
entre tasas muestrales. mayo res que 0 tienen una magnitud tal que 1a proba-
bi1idad de obtenerlas por simple azar sea menor que 5% (nivel de signifiea-
cion fiJado). Se requiere determinar por 10 tanto un area en 81 extremo
darecho de 10 distribucion que equivale al 5% del area total bajo 1a curva.
En 1a tabla correspondiente se observa que el area a la derecha de 1.65
(Z "t) es igual a 5%.
en
89
,
I
\
,
. ,
" 1
'. i
\ 1
I.'.i'
I
"
',',1:;;,.1
1:; 'I'
'-1
iI,'
)'
I
Zona de Rechazo
"0
1,65 Z
Por 10 tanto para todo z '(observado) 1.65 rechazaremoo Ho'
4. Resolviendo sobre I a di lerencia observada
Necesitamos saber si 10 diferencia observada cae en 10 zona de rechazo,
,por 10 tanto, es nece.ario calcular el z (observado).
=
10
4.8
= 2,29
El Z b > Z it par 10 tanto se rechaza 1,0 hipoteds nula. La tdsa
de desnufrfcion e;rmaYor en lao sectores oin programa.
90
Las prueba
miten tornar de
10 menos una,
menudo nos en
mas de dos tas
Ejemplo. :
1. Comparar I
Sant 1090 .
2. Comparar e
3.
troles dp.
4. Estudiar s
fumat.
5, Estudiar s
Problemas
nificacion est
U 80 de 1a "db
Pi.alamo. a ac
Distribution
A. Caract ,
1. Es una
2. S610 t
las x I
3. Est" c
lib .. rt
4. El 6r ..
En ia figu l
nos val ore. de
8. Api i eae
Entre las 0
de 10 ."lud, po
B.lo Prueb
B.Z. Prueb
P r u eba de Asoc i
Esta prueba
nados anterior
(., Esttr pruebc
br. de "t ob J
, .
de rechazo.
ala. La tdsa
I
PRUEBA "X,2 (J I CUADRADO)
Las pruebas de significacion estadistica presentadas anteriormente per-
miten tamar decisiones sobre diferencias entre "dos" tosas, de las euoles a
10 menos una, es una tasa muestral, sin embargo en el campo de 10 salud. a
menudo nos enfrentdmos con problemas en los cuales es necesario comparar
mas de dos tasas.
Ejemplos:
1. Comparar porcentajes de desnutridos de las distlntas comunas del Gran
Santiago.
2. Comparar efectiviclad de varies tratamientos para una misma enfermedad.
1. Estudiar 8i 10 mortalidad neonatal es independiente del numere de con-
troles de la madre durante el embarazo.
4. Estudiar si hay asociacion entre muerte par, cancer pulmonar y habito de
fumat.
5. Estudiar si hay asociacion entre tipo de ulceras y ubicacion de elIas.
Problemas de estQ naturalezQ son resueltos mediante una prueba de sig-
nificacion estadistica denominada "Prueba Ji-cuadrado" y en 10 eual Be hace
U80 de la "distribucion Ji-cuadrado". cuyas caracteristicas principales.
senalanoB a con tinuacion:
Oistribucion 'X,2
A. Caracterlsticas
1. Es una distribueion asimetrlca
2. Solo toma valores poaiilvos y es asintotiea con respecto al eje de
las x posi ti vas (0 < < ro )
3. EstCi: caracterizada por un unieD ;'n" llamado "grados de
libertad"
4. El orea comprendida entre 10 curva y el eje de leis x eB 1 " lCXlY..
En la figura adjunta. aparecen grafico8 de esta distribuciori para algu-
nos valoree de "n".
K! dl muutru
n =
B. Api icaciones
Entre las aplicaciones mas frecuentes de esta distribucion. en el' orea
de la salud. podemos senalar:
B.l. Prueha de aoociacion
B.Z. Prueba de "bondad de ajuste"
Prueha de ASDciacion
Esta prueba, como se
nados anteriormente"
puede visualizer 0 troves de los ejemplos menclo.
permite 01 el1nleo 0 Investigador determinar s1
(., e.ta pru.ha
t
ta.hif" en 1a 1Jt.ratora con .1
br. 4. d. eontJagencJo-.
91
::
, '
;
'1 .
i,
I ,
j':'; .
I
i' :
" ; , il\' ,
;y,
:
.:
exlste a.oelaeion entre dos variables con eseala de medieion nominal u or.
dinal.
Estudlaremos 10 aplieaelon de esta prueba. a troves de 10 resolueion de
un problema.
Problelll8
Los datos que Be presentan a continuacion corresponden a un estudio
anat6mico de ulceraciones gastricos benignas y malignas realizadas entre
1940 y 1950 en el Boston City Hospital.
UBlCACICN T i
0 , d e
U 1 c era
I:E lA
Beni<:J1a ign a rotAL
lJI..CERA N!!
% N9. % Nil
"
Prepilorica 100 62.5 (!O 37.5 160 100
del Cuerpo 70 70.0 30 30.0 100 100
Cardial
30 75.0 10 25.0 40 100
1UI'AL 200 66.7 100 33.3 300 100
iSe podria decir que hay asociaclon entre la ubicacion de 10 ulcera y
e 1 tip<> de "s to?
Solucion
i) Planteamlenlo de
Hipotesis ilUla:
(Ho)
Simb61icamente. Ho
las hlpolesis
No hay a.oclacion entre ubicacion de 10
tipo de "sta. es decir. el porcentrije de
molignae es e1- lIiama ya sea la ublcacion
prepiloriCXJ en el cuerpo 0 cordial.
p =
prep
p =p
Cller car
ulcera y
u!ceras
de o;sta
Hipotasis alternativa
(Hi)
Hay aooelaelon entre ubleacl6n de 10 ulcera y
:tipo de "sta. as decir. el porcentaje de Hce-
ras malignas es dlferente en por 10 menos una
de las ubicaciones.
Simboiiccmente. Hl 1 p l p y/o
. prep cuer
pip y/o
prep . car
ii) Mivel de significacion: = 0.05 (arbitrario)
III) Esladfsllc8 8 ulillzar:
f e
en que
i-I
92
1
= fn
El
=(n
,
f
e = nur
nur
a) Calculo da
ULCERA
UBIClICICN 1
prep116r i- b
ca del m
cuerpo b
cordial m
b,
In'
JUrAL
2
'X, ob
= 3 . 2!
OOfA: Bajo la I
cacion de es ta,
m ismo para las I
en coda celda 1,
pectivamente. 1
por diferencia (
b) -x,2 c/fU co
E1 'X,2 cri tic
de la fila neal
lihertad (9'1.).
tlenen mul tlplic
f Has men os 1 (f
para esh
_)
2
1; ,c
't
2
c
lominal u or-
:,esolucion de
a un esttidio
izadas entre
JfAL
%
)
100
100
100
,
10 ulcera y
,
,.
.'
,
;.
I 10
, de
:10n
\
ulcera y
ulceras
de 8ata
10 ulcera y
taje de ulce-
Lo menos una
'/0
/ ,
,.,
0
1
= frecuencla ob.arvada en 10 caldo 1
E i = frecuendo esperada en 10 calcla 1
f c = numero de celdo se obtlene multipl1cando numero de fllao (f) por
numaro de columnaa (c). En este problema. fc .6
I) Celculo de 1L2 obsefvado
r---------,------ --,-.-------,------. .,-------,
ULCERA fRECUENCIA
-
(0. E. ) 2 (). _ E. ) 2
1 1 1 1
UBlCACHN TIro Observoda Esperada
O. E.
E,
1 1
1
prep1l6ri- benigno 100 101 .7 .6.7 44.9 0.42
co del maligne 60 53.3 6.7 44.9 0.84
cuerpo benigna 70 66.7 3.3 10.9 0.16
cordial maligna 30 33.3 -3.3 10.9 0.33
benigna 30 26.7 3.7 13.7 0.51
maligna 10 13.3 .3.1 13.7 1.03
JUrAL 300 300 0.0
X
3.29
.. 2 =
'" ob
3.29
NOTA: Bajo 10 hipOtesis nul a no hay asociacion entre tipo de ulcera y ubi-
cacion de eata, por 10 tanto a1 pomntaje de uleeraa maliqnaa, deb er e1
liame para las tree ubicaciones ( 33,l% Y 10 frecuencia esperada (E.)
en coda celda la obtenemos aplic 0 este porcentaje a 160. 100 y 40
pectivamente. La frecuencia esperada para las oenignas se pueden obtener
por diferencia 0 aplicando a las mismas frecuencias anteriores 66.7%.
b) 1L
2
c f i ti co
El 1,2 edtieo se observa en 10 tabla de 1.
2
(1-1804) ell la ' interseccion
de 10 fila n con 10 columna probabilidad. En que: -) n: son los grados de
libertad (g.I.). En una tabla de alociacion. 101 grados de 1ibertad oe ob-
tienen multip11cando el numero de columnas menos 1 (c 1) pOT el numero de
lil08 menos 1 If - 1).
I g.l
"
If - 1) . Ie -
1)
I
,
para este problema: g.1
"
(3
- 1)
(2
1)
g.1
:=
2
-)
probabi lidad : corresponde al nivel de significacion a
... 2 't' -2
crl lCO, .para n - y a " 0.05 es 5.991
.. 2 't' = 5 991
IV cn leo
93
I
i
!
i
I
i
,
I
':
i
.
r,'
r
i'
". '
Iv) Reglon , de Rechazo : R
La re
g
ion
2
de rechazo. R. esta const ituldo par todos 108 valoree de 1t
2
mayores que crl.tico.
de muestlBs
R =
{ 'X2
1,2
>
':f.v2
critioo
}
R =
{
1.J
'X.,2
> 5.991
}
'X 7.
t
R
oL
v) Conclusion
Como 'Xl b es menor que 'X,2 critico. concluimos que no hay evidencia para
rechazar 1& hlp6tesis nula. 'pora aflrmar que &1 tlpo de ulcera.
dependa de 10 ubicaci(,n de ella.
B.2. Prue.ba de bondad de ajuste
La prueba de bondcrd de ajuste. permite afirmar can un cierta nivel de
confianza. si lasdistribuciones de lOB universos de orlgenes de muestro8
en estudio. se "ajustan" ,a algun" distribucion de inten's tal como: normal
t. binomial. 9 : 3 : 3 : I; etc. a f i n de utili"or las propiedades de eB-
gq
tal clhtrlbJo
tener un numt!
en una generc
EJempl"l
1. Sa podri<
dl.trlbuc
es normal
coda que
norlllOlida
2. En genetJ
de origen
dos eston
Veremos c
resolucic
Problema
'Segun una
y ri zado8 ex t
zado .extremo.
iSi en un
suave y ' 20 DC
Mendel?
Solucion
i . Plant l
Hipot,
Hipot
i i. Hivel
iii. Es t ad
'X}
i
E.
=
fre
1
i
= fre
k = num
alores de 'YJ
ridencia parc::i
o de ulc;:'era,
rta nivel de
de muestras
'omo : normal
clades de es-
taa diltribucionas 0 como en ganetioa. conducir experimental de modo de ob-
tener un numero dado de fenotipol a predac1r la estructura de 10 poblacion
en una generaeion dada. .
EJemplol
1. Se pod ria realizar una prueba de bondad de ajuste para estudiar si la
distribucien de los pesos de hombres sanos de una esttitura determinada
es normal con peso promedio igual aMY desviacion standard Verifi -
cado que 10 diatribucion es normal, Be podrio establecer l!mitea de
normolidad para el peso.
2. En genetica es usual verificar 8i las distribuciones de 108 universos
de origenes de las muestras son mendelianos 0 si los resultados obteni-
dos estan de Qcuerdo a los modelos geneticos.
Veremos como se resueive un problema de bondad de ajuste. 10
resoInden de un problema del segundo tipo:
Problema
'Sequn una de 10. leyes de Mendel. e1 entre pollos normales
y rizados extremo. debeproducir en 10 segundo generacion (FZ) pollos : ri-
zado,extremo, rizado suave y normal en 10 proporcion I : 2 : 1.
en un cruzamiento, se obtuvo en F2 : 23 rizado extremo. 50 rizudo
suave y 20 normal. se pod rio decir que esta distribucion es 10 dada por
Mendel?
Solucion
i. Planteamiento de las hipotesis
HipoteaiB nula: La mueatra proviene de un univerBo. donde laB pro_
(Ho). babilidades de ocurrencia de los diversos fenbti-
pos es tan en 10 proporcion 1 : _2 : 1.
Hipotesis Alternativa: La muestra proviene de un universa, donde
las probabilidades de ocurrencia de los
(HI) diversos no est<i'n en 10_ pro-
porcion 1 : 2 : 1
ii. Hivel de significacion
iii. Estadistica a utilizar:
a = 0.01
k
=c (bi - Ei)2
en que:
i " 1 Ei
Ei = frecuencia esperada. segun tea ria. en 10 clase i
01
k
=
=
frecuencla obaervada en lo clase 1
numero de clases
95
C<ilculo de:
a) X,
2
observado
FmJrlFO O.
- E.
(0. - E.)2
1 1 1 1
i
Ei
.
.
Rlzado ex- 23 23.25 0.Cll25
tremo
Rizado 50 46.50 3.5 12.25
euave
Normal 20 23;25 .-3.25 10.56
IDl'AL 93 93 0.00
><
NorA:" La frecuencia esperada de cada fenotipo. se obtiene
tal observado. las proporciones. predicha por 10 teoria.
10 proporcion del. fenotipo : rizado extremo e. 1.
4
rizado suave es
4
normal es 1
4
(0. - E. j2
1 . 1
Ei
0.0027
0.1899
0.4543
0.6449
aplicando al to-
En este ejemplo
luego. las frecuencias esperadas. se obtienen multiplicando por cada
una de es tas propoiciones ..
b) t
2
cd tico
En general. en problemas de bondad de ajuste. en que no hay estimor
parametros. los grados de liberta:l eston dados por e1 numero de closes me-
nos uno.
g.! = k - 1 En este problem9 k = 3 y tanto g.l = 2.
. ,
EJ x,2 critico, se observo" en la tabla de 't
2
en 10 intereeccion de .la
r Ua n=2 con la columna a = 0 .01
. 'Y 2 ,. 9 210
IV cntlco = .
Iv) R'egion de R
La de rechazo esto constituida por todos los valoree de J3 mayo-
res .. que 'X. err ticos.
96
o.
v. Conclusion
Como X.
2
<
que la distr"lbu.
ObserV3ciones
1. La estructu
yor sea 10 (
yor sera e1
zar 10 hipa!
2. Tambien oe I
cerD 0 cere
ningUn vale
clases adyc
3.
ta resolver i
pacas . ?br j
correCClon
la mul tin om:
4. Siempre que
de que 1a 9'
las r recuen<
s. Para el calc
absolutas y
" - E. i 2
" 1
.0027
.1899
.454::'
.6449
cando al to-
late. ejemplo
lor coda
que estimar
! closes me-
ccion de lo
de 'X3 mayo-
I
N de muestrss
R = {X} I x.,
2
> 9.210}
-x.
2
ob 4 R
Y. Conclusion
Como x.,
2
0b < critico, concluimos que no hay evidencia para suponer.
que la distribucion de los fenotipos sea diferente de I : 2 : 1
Obse rvac i ones
1. La estructura de 10 estadi8tica, nos permits que mientros ma-
yor sea 10 dlferencia entre los valoree observados y los esperados. ma-
yor sera el valor del? y aumentara por tanto la probabilidad de recha-
zar la hip6tesis nula.
2. Tambien S6 puede observar, que 81 en alguna close e1 valor esperado es
cero 0 cercano acero, el valor d .. 12 tendera a 00. Se recomienda que
ningUn valor esperado sea menor que 5. y cuando esto suceda. juntar
closes adyacentes.
3. Como 'X,2 es una variable aleatoriC- continua. y 10 utilizando pa-
problemas de variable discrete, es nece80r10, para e1 caso
de pOCOS observaciones. usar una correccion de continuidad, denominada
"correccion de Yates" 0 bien utilizar 10 distribucion exacta, que sera
10 multinomial, 0 una prueha no parametrica.
4. Siempre que se utiliza alguna de las pruebas 12. debe tenerse cuidado
de que la suma"" de las frecuencias observadas, coincida con la suma de
las frecuencias esperadas.
s. Para el calculo del x.2 observado. 88 d.ebe trabajar con loa frecuenciaa
absolutas y no can los porcentaje
97
:'
,
I
I,
I
I,H I . '
' :f , I
11
.
... i i
. ' ;
.; , '
lit i
'.: !
, "
J
INTRODUCCION A LA TECNICA DE MUESTREO
Entre las'caracterlsticas importantes del hombre, figura su capacidad
para generalizar. En 1a busqueda de l conoc imiento de su media, pone en
practica inconcientemente este proceeo, aun cuando no 10 designe como tal
y 10 realiza desde e1 nivel mas elemental.
1\S1 par ejemplo, es posible formarse una Jdea buena 0 mala de una pe!,
sona al tratarla una sola ve z. Tambien 5e generaliza cuando 5e examina u
na pequena cantidad de sangre de una persona y se supone que toda su san:
gre tiene esa misma composi.cion.
Es diffcil comprenoer este procedimiento es arriesgado y a veces
peligroso, ya que puede cameter un gran error. Las unidades con que se
toma contacto son solo a veces muy pequena, del total 0 universo y
10 que se hace no es otra cosa que reconstruir una caracteristica del uni
verso en base a Ia formacion proporcionada por algunos representantes -;
los cuales constituyen muestra.
:;1 el universo ea r.:ua 1 ql1.i ar mUI!!Ist rl!l. prc"nt'c inn" el miflm() r!
y e1 procedlmiento de selecci6n careee de importaneia. Pero euan
de el universe es he terogenea como sucede en la mayoria d e los casas, eT
procedimiento mediante e1 cual se obtiene 1a muestra es decisi.vo y se ha-
ce necesario utilizar un.procedimiento que nos indique to
mar, como seleccionar1as de modo que 59 pueden obtener conclusiones val!:
das para el total. Dicho procedimiento es e1 que se desarrol1a a conti-
nuacion en forma muy general.
Definiciones
1. Unidad de Las unidades de analisis son las unidades para
cuales se de sea obtener informaci6n. Estas pueden ser personae,
hospitales, ciudades.
2. Poblacion 0 Universo: La poblacion 0 universo es e1 grupo completo
oe todas las unidades de anal isis cuyas caractertsticas 5e desea estu
diar. Los siguientes conjuntos podran constituir universos para
nos estudios.
Enfermos hospitalizados en e1 Hospital "EI Salvador" entre e1 10 y 15
de marzo de 1976 .
ocurrida8 en chile en e1 AAo 1975.
En 1a definici6n del universa, Be debe indicar la unidad de
dcnde se investiga (lugar) y cuando se investiga (tiempo) dejando cl!
rc:'lmente especifi c ado.estos aspec t os .
3. T)n .i. c1.-"!:d Huest reo: La unidad de muestreo es una unidad selecciona-
dd del m<lrcc de muesf;reo. Puede ser igua1 a 1a unidad de C'lnru.isis aun
que 11(' necesariamentJ.. Por ejemplo. para obtener i nformacion sobre
pe r.sonas, se uti) izar una lista completa de un censo y seleccio
nor una mlJestr". de l/? rsonas directamente. Sin embargo, t.ambHin FJe p
sel"?cc.lona.r , ' na de hoga res e incluir en la muestra 2l to-
das laB penmn<:',s los hogares seleccionados. La elecci6n de 1a \lfli
oad de muestx-ef) m;l..o; eficiente, es una de las consideraciones mas im-
portante en el de 1a muestra.
4. f.1arc o de muestr (!" : La totalidad de las unidades de muestreo, entre
las cuales se se \ u.:c i onara 1a muestra, se denominara marco de mues-
tree . El marco f'lW r],! ser un listado de personas, de viviendas oun ma
pa rlonde estan todas unidades de muestreo.
5 . Es un c onjnnto de llni dac1es de ana1isis extraidas del uni-
verso, con el fin (1 10.' conocer una 0 mas caracteristicas de el. Diremos
98
.
que una r
des de 1m
tra, 1a
TI POS DE ERR(
Sesgo de SelE
Se entier.
de las unidac
del universo
vel socioecon
muestra a pat
familiae de 1
que habrlan a
muestra.
Error de Hues
tJiferenci
mente sucede
archivo con 5
menino y los
tra de 50 fic
res y 20 de h
21 de hombres
bab1e de:
29
50 x
estll dife:
rlime1:ro (60\)
Aparerttemf
un grave incot
que cuando USt
error.
Procedimiento
Huestreo Aleal
Se ctenomir
des de entre "
n, tengan igua
En 1a pd.c
Las unidades E
va de "1" a UN
111" Y UN" a pa
miento que aBe
En el mues
mo !Ie
ma unidad en 1
tuida por "nit
La probabi
9i6n:
"f" 0::: !l
N
denominada fra
tra y ItN" e1 d
su capacidad
io, pone en
igne como tal
la de una pe!.
se examina u
toda su san=-
do y a veces
des con que se
o universo y
stica del uni
rese r ' .,tes ,
na el mismo re
a. Pera euan
as CBecs, e1
siva y se ha-
as unidades to
usiones vali:-
11a a conti-
nidadslI para
er perBonae ,
upo completo
: se desea estu
50S para alg.!!.
re el 10 y 15
de a) '. &119i9,
de janr'to c
d s e lecciona-
e a nalisis aun
acion sabre
s o y
tamblt;n Sf! p.:.1.
uestra a t .o-
i6n de la uni
ones mSs 1m=-
streo, entre
co de mues-
iendas 0 un rna
das del un i-
eel. Diremos
,
r
,.
que una muestra e8 representatlva del universo cuando todas las unida
des de muestreo tienen una probabilidad conocida de entrar en 1a muei
tra, 1a que debe eer diatinta de cero.
TIPOS DE ERRORES
Sesgo de Selecc16n:
Se entiende par tal a un error sistematico 0 dirigido en la selecci6n
de las unidades, con 10 eual se obtiene una informaci6n parcial re.peeta
del universo que se investiga. Por ejempl0, can e1 fin de conocer e1 ni-
vel socioeconomico los habitantes de una ciudad, se se1eccionara una
muestra a partir de la gu1a telefonica de la misma y se entrev.UrtarS a las
familias de las seleccionadas, se 8star1a cometiendo un sesgo, ya
que habrlan algunas familias que no tendrian posibilidad de entrar en la
muestra.
Error de Huestreo:
Diferencia entre 10 que informa 1a muestra (estimacionl y 10 que rea!
mente sueade en e1 universo As! par ejemplo, s1 tenemoe un
arch iva can 500 casos clinicos de los cuales 300,corresponden a1 sexo fe-
menina y los 200 restantes al sexo masculino y ai tomamos a1 azar una mue.!.
tra de 50 fichas es muy "poco probable" que obtengamos 30 fichas de muje-
res y 20 de hombres. Podemos obtener par ejempl9 29 fichas de mujeres y
21 de hombres-, 10 que indicara que en este kardex hay Wla proporcion pro-
bable de:
29
SO x 100 = 58\ de mujeres, cuando efectivamente hay 60t
Esta diferencia entre 1a 8atlmaoi6n dada per 1a mu tra (59') y .1
r'metro (60', as 10 que se denomlna error de
Aparentemente pareciera que 1a presencia del error de muestreo serta
un grave inconveniente para el usa de muestreo, pero esto no es as1, ya
que cuando usamoa muestras probabl11sticas podemos controlar eate tipo de
error.
Procedimiento de Selecci6n
Muestreo Aleatorio Simple:
Se c1enomina mue"treo aleatorio a un m8todo para eeleooionar "nlt unida
des de entre "N", de modo que cada una de las muestras posihles de tamano
n, tengan iqual posibilidad de ser seleccionadas.
En la practica una muestra a1eatoria es extratda unidad par unidad.
Las unidades en la pbblacion Bon previamente numeradas en forma correlati
va de "1" a "Nt!. A continuacion se extraen un" numeroa aleatorios entr;
"1" y UN" a partir de una tabla de nGmeros aleatorios, 0 can otro proced,!
miento que Asegure igual de ae1ecci6n para cads unidad.
En a1 mueetreo aleatorio simple, 0 mu treo aleatorio irr trlcto, co
mo se Ie denomina, no es permitida 1a dob1e inclusion de una mis=
rna unidad en 1a Beto elgnifica que la mu tra debe tar canst!
tuida por "n" unidades diferentes.
La probabilidad de ee1ecci6n en cada unidad dada por 1a expre-
allln.
"f" == n
N
denominada fracei6n de muestreo'J
tra y "Nil e1 del universo_
donde "n" representa el tamafio de ]a mue..!
99
I,:
I
j;;,
r .
I
1
1
,1
I ,
,
I
f
"!, i
. '. i ' -,_
.' i
I
I,! '
Seleccl0n
Es el procedimiento mas aplicado per su sencillez y r.apidez.
racterlst ica es la seleccion de unidades tomando una de cada k
siendo k el espaciamient,Q de mueetr.eo, dado par la expresitSn t
k =
h
Su ca-
unidad
dande
tra.
"Nil corresponde al tamaiio de la poblacion y "n" al tamafio de la mue!
El procedimiento consiste en tamar un nUmera en forma aleatoria den-
tro de las k primeras unidades. A esta primera unidad de muestreo selec-
cionada 1a denominaremos unidad de arranque. Para seleccionar las siguien
tes unidades que formaran 1a muestra, Be Ie Burna a la unidad de arranque
k, 2k, 3k, etc. hasta obtener e1 tamano de muestra deBeado.
Sea por ejemplo 1a s8t'ie 1, 2, 3, 4, 5, 6, 1, 8, 9, 10, 11, 1.2, que rl
presents a las dnce unidades de una poblaci6n determinada. Sup6ngase qu;
deseamo8 tamar mueatra de tamafio 4, ten.moB entona.. que e1 a.pao!a
miento de muestreo k es !qual a 3. Por 10 tanto, debemos eleqir un nGme=
ro en f o rma aleatoria entre 1 y ) '. Suponga'mos que el numero elegido sea
2, 1a muestra queda constituida par las unidades de muestree 2, 5, By 11.
Notese que para 1a segunda unidad de ana:lis is (5), se sumO a
1a unida d de arranque (2) el intervale de muestreo (3), procediendose en
forma analoga para todas las unidades seleccionadas.
Es c laro que a1 fijar e1 numero de arranque, e1 resto de las unidadeB
que inqresan a 1a quedan seleccionadaB en forma eimultSnea, as
mo eortellr un grupo completo. Lt5gicamente que s1 siempre se partiera de
9610 podr1an entrar en la muestra las unidades 2, 5, a, 11 y e1 resto
quedar1a con probabilidad "eerb
ll
de 8e1ecoi6n, en ouyo C890 serta una mue!
tra eesgada. De aqui que es necesario sortear 1s primers unidad en forma
aleatoria.
Las ventajas de este metoda radican como se dijo a1 Inleio en la rap!
dez y sencil1ez de su operatoria. No necesita numeracion de las unidade87
sino solamente un ordenami.ento f1sieo que permita a1 recuento. Puede pr!
senter al.gunas desventajas. Una de e118.9 se refter. a 1e. p08tbll
existencia de 01010s en 1& inform8.ci6n y conjugAndoee con ella la poe1b1-
Ildad de que k coincida can dlcho cicIo.
Un ejemplo claro 10 presentan las d!arreae infant!le.. Tienen un ci-
cIo anual con m&ximo de ver8.no y minima en invierno.
S1 para hacer un estudio en rel8.ci6n a diarreas infantiles, se nortel
ra un mes del ana y se hicleran observaciones cada 12 meBes, obtendrI
una informacion falsa aUn ' cuando e1 procedimiento estuviera bien emp1ea-
do,
t-:j'mplo: feb., fen., ............... . h:b.
t::Jl este caso se nV:r:rt ndrl8. un resumen 8610 de lOB indicGI!I elBvadoi .
Par eeta razon J.mp01: t .llnte averlgual. 1a posibillda..-l de ..... lCis
tE!:n,cia de y ", ' g,ue rle ser as!, Be puede recurrir a diverSOR F
mlen'tos
Entre ellos figt1ra el doble sorteo
utili"..ar 1. n(ul\er'DQ :," .-:;. a tor.ios entre 1 y
de muest.reo pa.J:a UTl(1 de elIoA 2k.
cedimientos tMS
Muestreo Estratificadu Simple
de n6mero8 de arranque, es
2k y utilizar como eapaciamiento
Rare. vez as neceaario ut.i.1.i.v.ar pr2
Muchas vecee ll\:g caract.e.t:i9tlc8a que !Ie estudian en una poblaci6n, va
rlan de muy distinta m:s.nera entre loe dlverl!lol!l indlviduo. 0 unidadee de !
nlilis1e, decir. r se t.:lene una poblaci6n lnUy heter09'nea
100
81 no t(
que nuestrn!
los verda del
Una manf
su1tadoB es
nes y muestl
blaciones ir
Los diet
muestreo qUE
les se Ie dE
Una vez
del nlimero d
fijacion), e
es tomar un
neo, pero su
este caso .!
mas sencillo
fio (N de un
afijaci6n pr
La estra
zones para 5
1. S1 Be de
aconse:'a
mente ta
2. Ventajas
ficacion
ner ofic.
cuesta pi
3. La estral
La idea I
en Bubpo)
eat 8Uq,
pae. Sf
rian poce
de cualq\
estrato.
Muestreo de (
Puede sue
aial
por ejemplo
miliaree 0 en
hospitales, c
51 nos in
1ftII!ramente com
dividuos, par
a todos 0 par
otras vee
de la poblaci
dronamientos,
do enseguida
rior;
Debido a1
z. SU oa-
k unidadea
o de 1a mues
teria den-
tree 8e1ec-
las
.e arranque
12, que re
pong' "que
e1 1..., ,rlacia
ir un nUma=-
legido sea
,5,Byll.
se sumO a
.iendose en '
as unidades
_anea, es
artiera de
y .,1 reato
ta una mU8.!
lad en forma
I en la rapi
18 wlidad -;
Puede pre
I 1a po.ibi.
1a poeibi-
.enen .., 01-
I , 88 sort
9'" obtendrI
den emplea-
3.aS elevados.
i dad de "xis
:sO::J r
es docir,
Ipaciamiento
utillzar
,blac i6n , va
ddades de !
s1 no tomamos en consideraci6n esta "heterogeneidad" es muy posible
que nuestras estimaciones a base de 14 mUestra difieran de
los verdaderoe valores en 1a poblaci6n.
Una manera de evitar la influenc ia de esta heterogeneldad en los re -
sultados es agrupar los individuos mas 0 menos semejantes en subpoblacio-
nes y rnuestrear cada una de las subpoblaciones como si se tratara de po-
blaeiones independientes.
Los distintos grupos formados se denornlnan estratos y al proceso de
muestreo que procede a agrupar los individuos en estos estratos especia-
lea se I e denomina estratificacion .
Una vez que se han fijado los estratos, se procede a 1a determinacion
del nGmero de individuos qu@ deben aeleccionarse de cada uno de ellos (a-
fijacion), existen diferentes formas de fijar estos tamafios, una de ella9
es tomar un tamafio de muestra mayor en aquel estrato que sea m!s heteroge
neo , pero sucede muchas veces que no se tiene una medida aceptahle de 1-;
variabl1idad de la caracteristica estudiada en los diversos estratos, en
eete easo 8i queremos una muestra del 10' de la pablaei6n por ejemplo, 10
mSe sencill0 ser!a tomar dentro de cads estrato tambien un 10% de su tama
fio (N de unidades quecontiene), a este tipo de afijaci6n sele
afijacion proporcional.
La estratificacion es una tecniea muy cornun.: Entre las princ.!pales ra
Eones para su usa se encuentran 188 siguientes:
1. Si se desean resultados para ciertas subpoblaciones de la pob1acion es
aconsejable considerar cada subpoblacion como una upob1aci6n
u
propia-
mente tal, y tamar una muestra independiente en cada una de ellas.
2 . Ventajas de tipo administrativo pueden aconsejar el usc de 1a estrat!
flcacian, por ejemplo, la institucion que realiza la encuesta puede te
ner oficinas regiona les, cada una de las cuales puede supervisar la en
cuesta para una parte de la poblacion. -
La estratificacion puede contribuir a disminuir el error de muestreo.
La idea b4eica e8 14 que ea pOBible dlvidir una poblaoi6n heterog'nea
en subpoblaciones, cada una de elIas homogenea en su interior . Esto
estS eugerido por e1 nombre de estrato, que impliea la diviai6n en ca
pall. Si cada eetrat.o es homo91neo en e1 sentido de que 1.&s medidae va
rtan poco de una unidad a otra, una estimacion precisa del
de cualquier estrato puede obtenerse en base a una p-equena muestra del
estrato.
Muestreo de Conglomerados
Puede suceder en 1a practi ca que las unidades de an'118i9 no se en-
aialadas, sino formando 9rupos 0 Tal eB e1 c aso
por ejemplo, de 108 habitant.es de una c1.udad que'. viven ya aea en gntpos t,!
ml1iares 0 en agrupaciones especiales como ser; residenciales, hote les,
hospitales, cSrceles, internados, etc.
Si nos interesa saber 10 que pasa con el individua, se puede p 41
meramente cane unidades de muestreo estos nGcleos 0 IIconglomerados" de ii!
dividuos, para enseguida t omar dentro de los conglomerados de la muestra
a todos 0 parte de los individuos que en ellos se encuentran.
Otras veces, por rezones de orden econ6mieo" se agrupan 108 individuos
de 1a poblaci6n en "oonglomerados" pec!al"., tale. como aon 4_ empa-
dronamientos, par ejemplo, a divisione s administrativas pequenas,
do enseguida.un proceso de seleccion, como e1 indicado en e1 parrafo
rior.
Debido al usc de "conq1omerados" como unidades (prim"rias) de mues-
101
I
., !
i
1"
I
i
t
" ,',
' I
I
j
h'
'I'"
A. Piii
- treo, e1 proceso de muestreo que hace usc de esta modalidad de 8grupac!iSn
de las unidades de analisis, recibe e1 Hombre de "nuU.tJt.ea de. c.ongiome/Ul-
dOJ,II.
Ventajas del usa del Muestrea:
Hay sels razones basir:as para e1 usa de muestreo:
Una muestra puede ahorrar dinero comparado con e1 costo de un censo.
Una muestra tjempo, cllando e1 hecho a estud!ar presenta varia-
clones relativamente rapidas a traves del este poco consume de
tiempo p.n obtener. loa d'ltos cobr.a espacial importancia puss permite
completar In de ellcs ante9 que se preeenten variaoiones
de importancia.
Una muestra penri..te cOIlcentrar la atencion en casos individuales, e1
tener que analizar un niimero reducido de individuos permite obtener rna
yor a elIas can todD e1 detalle que es necesario
de acuerdo a los Jbjeti"vos.
4. Una muestra permite e1 usc oe poco personal y espacio. En general bas
ta con un numero rp.OllG 100 ne nebldBmenta entrenadas y que pu.!
dan trnbnjar en un mAs 'que e1 que 5e necesitarta pa-
ra un trabajo de tipo censal.
5. Una muestxa permite obtener resultados de mejor calldad, e1 usa de P
co personal permite un mejor entrenamiento de elIas, junto a1 hecho de
que se rechace 1a variac ion can que puede presentarse por e1 observa-
dor mismo. Toaos estos hechos redundan en una mejor chlidad de los re
sultados.
6. Una muestra, muchas veces es la unica posibilidad ra2ionab1e de ahall ..
sis, en muchas oportunidades e1 eXR.men de lOB elementos que forman u-
na poblacion 0 t1ni'trer9o ex.tge AU destrucoi6n 0 inutil!zaci6n, como ee
e1 examen rutinarlo de leche embotel1ada, conservas, etc., por 10 tan
to, es absurdo todo el lote de producci6n para tener una in-
formacion respecto a sucalidad.
Desventajas del Muestrea:
A pesar de las ventajas' del muestreo muchas veces no 99
realizar una investigaGion a base de muestras. CaSDS de este
siguientes:
aconsejable
tipo son los
a. Cuando 5e necesitan ORtos para Bubdivisiones muy pequenas de la pobla
cion, se requieren muestras desproporcionadamente grandes,pues 1a pre
ci!=l:ion de ,ma mucst.ra dependp. frecuentemente del tamaiio de Ia muestra
y '_-,13 Ia frace ion de muestreo. En este caso de muestreo puede ser
casi '.an costoso como un censo completo.
h. Cu,ndo se requiere un inventario para cada uno de los elementos de la
poblacion, ejt.:'mplos de tlpo es 1a ficha _c11nica de hospital que
tienen que exjst.:l.r para todos los paeientes, no solo para un grupo de
ellos.
ApI icaciones de
En e1 campo sanitar:.i..o el muestren tiene multiples aplicaciones, que
son par ejemplo:
a. La obt.encion an inrnurv:I.-:.ion a las personas que vivan en el '-
rea de un centxo ,,1111:1 con e] objetQ de elaborar 0 transformar un
programa.
b. Probar Ia eficlencia OP. un metoda antes de aplicarlo a1 total de]a P:2.
blacion .
102
C. Determ
da, de
d. Evalua
19rupacion
ongiomeJra-
m censo.
Ita varia-
:onsumo de
permite
lriaciones
lales, e1
obtener rna
necesario
mer'at- bas
3 Y que pue
ltarla pa=-
usa de po
. hecho de
l observa-
de las re
: de
I forman u-
, como es
or 10 tan
r \lJ'\a _1n-
onsejable
son los
1a l.---_.Jla
le8 14 pri
a muestra
.uede ser
tos de la
. ital que
1 de
les, que
1m en e1 ,
formar Wl
,1 de la P
c. Determinar ne ces idade s de recur s os me dic os, asi stenciales, de vivien-
da, de saneamiento dentro del area del Centro de Salud.
d. Evalua r los resultados que e s ta dando un programa en e jecucion.
103
,
i
"I
I
' 1 >-
I
REGRESION LINEAL
EI problema
Se investiga 10 capacidad vital en 8 ninos d" diferentes edades, con
los siguien tes resuJ. todos:
.
f.dad (unos) Capucidad Vital
(x)
(y)
-----
4 0.79
5 0.93
6 1.15
7 1.29
8 1.47
1 1.71
lU 1.87
11 1.99
Los datos se caHlcter izan porque en coda unidad de observacion (nIno)
se hacen dos mediciones: edad (x) y capacidad vital (1'), Se dispone de B
pares de observaciones:
Nino
I
Xl
=
4
Yl
=
0.79
2
x2
=
5
Y2 "
0.93
etc.
En general. ,para 10 observacion i == 1,2, . ,n, en que n 8S a1 numero de
observaciones eJ par de mediciones es (xj: Vi)' Observ9se-que Id variable
x (edad) no as (Jlecrtor ia, porque los nlnos han side elegidos en ciertae
edades; es 10 variable independiente. La variable capacidad vital (y) eB
aleator ia y es la variuble dependiente . fundamentalmente se trata de con
testar las slguientes pregl1ntos:
1. 10 capaciddd vltal de la edad del nino? ;J)epende y de x?
2., :."'; 1u es afirmativQ9 i,CuCiI es la forma de esta dependencia. 0
bir-'ll l.05mo 5e y en funcion de x?
Este Urn de prohTpm(] es frecuente en medicina. Ejemplos: iCual es 10
curva pondered. de lm j) ina saho? ieomo varia la concentracion sanguinea de
un antibiotico d8SPU0S de adrninistracion oral? LQue relacion hay entre
el de i.ndividuos inmunizados en una poblacion y e1 numero de ca ..
sos de una enferruedad infecciosn? i>Cual es el valor predictivo que tiene
e1 exnmen de selp.cr.i(,n de Medicina respecto a las calificaciones del primer
ano de est\1dio(; .
La utUidad d" 1 ll,,,todo "" mul tiple. Si se construye un modelo con e1
peso de n UiOf; SCTrlOS mt- fl1ncion de 10 edad. sera posible saber cu6l ea e1
peso normal oe lln ,liflo pelro lmet pdod determinada, 10 que ayuda a1 diagoos",
tico. El usc del ex"metl de seJp.ccion llevo implicita 10 idea que ea capaz
de predeci r los resllJ todos de los estudios unlversi tarios. La expresion
mntematica de 1" "';Q1'iocion de dos variables facilita el resumen de muchas
1011
observQcior
cion y expr
lar hipotee
EI grafico
El pri
riable depE
en el de In
En eete
la edad. de.
con ciertas
men09 rectd,
EI modelo de
La ecuac
(1)
a = interce
b p"ndien
'1 n"llIbrl!'
todo. f.n r
Jo homhre.
dlll_ men!")!'!
medIa. est.
10 normolj,
odes, con
Lon (nino)
'pone de 8
numero de
a variable
tn cJ ':0.
tal (T/ e.
to de con-
Ie x?
mdencia. 0
'Cu61 .. 1a
:guinea de
hay entre
nero de co-
que tiene
del primer
'elo con el
ulil es el
1 diagnos-
e es capaz
expresion
de muchas
observaciones y su aplicaci6n. Por ultimo, precisar que existe una asocia-
cion y expresarlo cllcmtitativamente es muchas veces un paso previo a formu-
lar hipotesis sobre su causa.
EI grafico y su descripcion
El primer paso en este tipo de problema 'es haver un grafico con 10 va-
riable dependiente en el eje de 10. ordenodo. y 10 variable independiente
en e1 de las abscisQs.
capacidad
v; tal
En eete ejemplo. el grafico muestra que la capacidad vital aumenta con
la edad. desde 0.79 a los 4 an09 de edad hasta 1.99 a los 11 anos. Aunque
con ciertas irreqularidades. lOB puntos tienden a seguir una linea mas 0
menos recta. UsaremoB. pues. el mOdelo de regresion lineal,
EI modelo de regreslon lineal
La ecuaclon general de una linea recta as:
(1) y = a + bx Siendo
a = Intercepto = valor de y pnra x = 0
b pendiente cambio en y por unidad de cambio en x.
a &J noebre de derlva de Uoa de Jos prl.eras opJleaeiones del .e-
todo. en un estudlo de 10 relae16n entre 10 deJ padre y del hI.
Jo hombre. S9 encontro que los Jd}os de padres lI.uy altos eran. en proll._
dIo, J'lenos alto.'!!!, y que 105 hlJos de padre$ llIuy baJos alcanzaban. en
medio, estaturas mas 01 tos que sus padres. Esto es. hat regreslon a
10 normalldad en sucesivas
105
!
., I
'I: .. 'i .. '
. r:
, .
;
Ft-
, .
!
I
y
I
I
I
I
I
,
,
,
,
I
I
I
I
I
I
,
I
,
I
I
,
I
t
I
I
I
_. a + bx
x
tC6mo Be oplico este modelo en ,,1 campo multivorioble de 10 medicina?
9upuestos 0 condiciones. Be ""epta 01 aplicar lo? LC6mo se interpretan
los parametros de 10 ecuacion? .
51 hubleramo8 examinano un numero de ninos. no habriamo8 obtenido
para coda edad exact<lmente 1a capacldad detnminooaen .. 1 pequeno grupo de
e observaciones. Poe ejemplo . para 10 edad 5 anos (x == 5). habr!amo8 obte-
nido capacidodes vitales variableA aunque mas 0 menoa cercona. a y = 0.93.
Por ello, en e1. modelo se ocepta que existe una familia de poblacione8, ca-
do una determinada por un valor fijo y conocido de x. Coda una de e8tas
poblaciones tiene una distribucion normal. definida por un promedio y una
distribucion standard que designaremos:
I" v/x = promedio de los yalores de y para x dooo
u y/x =. desviaciob standard de 109 volores de y para x dena
En el ejemplo. esto .ignifica que paro 10 edod 5 afios (x = 5). el pro-
medio de las vitales es = 5. Y 10 dispersion para este va-
lor puede expresarse por ay/.x = 5. En un grafico tridimensional 10 repre-
sentacion es 10 siguiente:
106
De acuard
tribuciones s
(2)
a 0 promedio
ra edod 0
f3= cambio er.
ejemplo.
Finalment
ciOn standard
0-
y/x e.
En el eje
dual en 10 co
En 10 apl
mar la atenci
1. Se acepto
plo anoli
ano de ed
9ioo. per
tervo-los
pacidod v
vida hume
2. Si 10 cap
fica que
Por 10 to
x. Si Ie
taL pare
toncea a
y
nee de pr
rio. que
Es te car l
fuentes '1
bx
-
x
.edicina?
;erpretan
obtenido
grupo de
nos obte-
I = 0,93.
ones, -"I-
de e ..... _-'s
lia y una
f el pro-
este va-
10 repre-
1(1/1)
8 7 8 8 18 "
II dId
De acuerdo al modelo de regreslon lineal. los promedios de f)stos
tribuciones se disponen en una linea recta, cuya ec:uaci6n es:
(2) fly/x = a.
+ f3 x dande
a.:: promedio de y para x = 0 (en este ejemplo, capacidad vi tal 'ja ..
ra edad 0, es deelr, at nacimiento).
cambia en e1 prantedio de Y clIando x (Iumenta .in una unidad. (Ell " s t ,
ejemplo. aumento de la capacidcd vital pl'omedio pOl' ano de edad)
Finalmente. es necesario aceptor que, .para coda valor de x, 10 dat1v\IJ -
oion standard de 10 dletrlbuclon de y e8 10 miema. E8 deeir,
0-
y/x e8 constante para todo x
En el ejemplo presente. esta condicion dice que 10 variabilidad indivi .
dual en 10 capaeidad vital es para todas las edodes.
En la apHeaeLon de un modelo matemaUeode esta espeCie conviene .1.1., ..
mar 10 atencion sabre los siguientes hechos:
I 1. Se aeepta que el cambio de y es constante pOl' unidad de x; en el eje", .
plo cmalizado. que e1 aumento en 10 capacidad vital f:rS igu01 por cad":!
af\o d. edad oUillplldo. Esta.1 tUClc16n no ell habitual en el orea h1010
gica. perc e1 supuesto es <r:eptable muchas veces para determinadoli in
tervalos en e1 eje de las x. En e1 caso que -se discute. aunque 10 Cu'"
pacidad vi tal no fuera una funcian lineal de 10 edod a 10 largo de J.1
vida humano. podria serlo en las edodes consideradas.
2. Si 10 capacidad vital es variable en sujetos de igual edad. esto signi-
fica que esta determinada ADH'AS por otros faelores qu.e no sQn 10 edad.
Por 10 tanto, 0y/x expresa una variacion de y que es independiente de
x. Sl 10 edad tllera e1 unlcc factor que determinara la capacidad vi-
tal, para una edad deteminada habria una capacldad vital uniea. En-
tonce. = 0 y todo. 108 puntos correeponderlan exactamente a 10 li-
nea de promedios. La habitual en el ern,po biologieo es, por e1 eontra-
rio. que 10 variable y dependa no solo de x sino de multiples factores.
Eate coracter multifactoriul y los errores de medieion son las dos
fuentes que expliccm 10 variccion residual alrE!dedor de 10 linea de re-
107
..
'J
;1' '.,
; ~ ' !
;, p
, .
f '
:i i
,
gresi6"n. Tratandose de una muestra, Veremos maB adelante que e1 error
de muestreo es otra causa de esta dispersion.
Tocla 10 disdlsion anterior se refiere a los datos de 10 poblacion del
universe de ninos. Lo cierto es que solo disponemos de datos de una peque-
no muestra de B medicionee de 10 capacidad vital, una para cada edad entre
4 y 11 anos. "COmo podemos estimar los va10res desconocidos de a y de ~ ,
que definen 1a linea recta que expresa 10 capacidad vital como funcion li-
neal de 10 edad?
Aj us Ie de una I fnea recta por el metodo de los cuadrados mfnimos
Para referirnos a 10 recta ajustada a los datos disponibles (0 10 mues-
tra) usaremos 10 simbologfa:
Hay multiples lineas rectos que pueden ajustarse a los datos de este
ejemplo, as ,decir, multiplp.B valoref:! dp. a y de h. DefIJde luego, coda par de
puntos define ':Ina recta: 10 recta, por otra parte, pqede no pasar por los
puntos observados. El mejor ajuste se obtiene por e1 criterio de cuadrados
minimos! es 1a recta que hace minima 10 surna de las diferencias cuadraticos
entre cada volor de Yi y el valor predicho en Xi por 10 linea de regresion.
Es decir:
I (y. y.)2 minimo
1 1
En e1 grofieo siguiente se muestran cada una de estas diferencias como
un trazo vertical:
YI
1.00
1,80
1.80
Y
1.40
1. 1(1
1,00
0.80
0.60
0.40
0.10
108
1.5
..
10 II
E. te oj
cada conjun
tante. a y
/3. reapeoti
Los val
mos se obti
llamada. EC
pecto 0 a
Las ecu
no +
b
Esta ul
decir. por
y =
Para el
guiente:
x
11
1
61
Ie e1 error
.lacion del
una peque ..
edad entre
, a y de /3.
Funci6n 11-
(a la mues-
too Q ...... .:3.te
"ada par de
sar por los
e cucdrados
cuadraticas
. regreolon.
encial como
--Xi
.'.
Eate ajuBte de cuadrado. Minimo. tlene laB propiedade. de deflnir para
cada conjunto de puntos observados una linea unica y de hacer que 10. cons-
tante. a y b de la mueetra sean la mejor eetimacion de 10. parametros a y
~ , respectivamente.
Lo. va1ore. de a y b que .atiafocen 10. condiciones de cuodrodoa mini-
mOl ee obtlenen por 1a reloluclon 11mult6nea de las ecuaclon aiquientea,
llamadas ECUACIONES NORMALES Y que reBultan de la derivQcion parcial res-
pecto a 0 y b de 1a funcion.
Las ecuaciones normales son:
=
b =
a =
y
Esta ultima eCUaClon muestra que 1a recta pasa por e1 punto (x.y). es
j dO";o ~ ' :' " ' , ~ 100 doo "'''''''''''_0
0
_.,. "".
Para e1 ejemp10 de la capacidad vi tal. el ca1culo del ajuste"es e1 si-
guiente:
Xi
Yi xiYi xi
2
4 D.7S 3.16 16
5 0.93 4.86 25
6 1.15 6.90 36
7 1.29 9.03 49
8 1.47 11.76 64
9 1.71 15.39 81
10 1.87 18.70 100
11 1.99 2i.S9 121
60 11.20 91.48 492
109
J
,
J
d
" !
I '
1
"
j .,
) ,
I.'
i'
ij'!
n = 8
L X.Y i
91.48
=
. 1
2
Lx.
= 60 2: xi
492
1 =
2
60
2
L y.
= 11.20
(L x. )
= =
3.600
1 1
n L X.y. L x. ? y. 8 (91. 48)
- 60
(11. 20)
1 1 1 1
b= =
=
n L Xi
2
(Lx.) 2
8 (492) (60) 2
1
731, 84 672 59.84
=
=
- - --
=
0.18
3936 36CO 336
a
=
y bx - 11.20 (0.18) 60 =1.40
-
0.18 (7.5)
8 8
=
1.40 1.35
=
0.05
Y
1
= 0.05
+
0. 18 Xi
De acuerdo a esta funcion. por coda anD de &dad la capacidad vital Ie
incrementa en 0.18 unidades entre las edades de 4 y 11 anos. Extrapolando,
la capacidad vital media para el nacimIento seria 0.05. La ecuaci6n permi-
te predecir 10 capacidad vital promedio para cualquier valor de x. Por
ejemplo. para los 5 aDos y medio seria:'
y
5.5
=
O.OS
+
(0.18) 5.5
=
1.04
El resumen de 10 regresl on en dos constantes permite tamblen compara-
clones ent re grupos. Por ejemplo, 5i se estuviera estudiando 10 capaci dad
vital en funcion de 10 edad en tre grupos raciales. la' comparacion de inte r ..
ceptos permitiran 51 hay diferencies en 10 capacidad vital 01
nacimiento entre lOB diversoB grupos, y 10 camparacion de las constant es b
haria posible analizar si 10 raza tiene algun efecto en determinor un
rente incremento de 10 copacidod , vital per ano de edod.
La variabilidad alrededor de la linea de regresian
Hemo. dicho que la dispersion de puntos respecto a la linea de regre-
sion puede expresor que y "depende de otros factores edemas de x, que hay
errores en 10 medicion y que los datos de 10 mue stra difieren accidental-
mente de la verdadera dis tri bucion en 10 poblacion 0 universo de origen.
110
' Por a.ta. y ,
En 1a ap
de los va.
promedio
Los valO1
nea de regre:
DARD DF. I.A r"
n = numf=
ObaerveSf
descripcion (
Las difel
1. Las difel
promedio
coda x.,
2. Se divia,
es conver.
En el ej.
0.79
0.93
1.15
1. 29
1.47
1. 71
1.87
1.99
... :.--_ .. . _- . .... . .... . - . .. --.. .....
=
5)
,d vi tal ae
trapolando,
016n perml.
d. x Por
'--
In compara-
, capacidad
1 de inter ..
,d vital a1
.nstantes b
]r Un diCe-
: de regre-
x. que hoy
:cciden to 1.
de odgen.
I
Por estos y otros razones. intereso muchos veces medir eata variabilidad.
En 10 aplicaci6n del modelo lineal se ha aceptado que para cada valor
de los valores de y tienen una distribucion normal con
promedio
= Ily/x
desviacion standard
_ 0
- y/x
Los valoree de 11. I eon estJmoclos por lOB correspondientes Y i de 10 II.
nea de regresi 6n . estimar u
y
/
x
de modo s,imllar por e1 [RROR STAN ..
DARD DE LA ESTIMACI0N.
s
y/x
.----- y.) 2
1 1
n 2
n = numero de pares de observaciones.
Observese que 5 he tiene tIna estructura semejante a Sx utilizado en 10
descripcion de 10 vXrlabilidad de una serie de meqidas:
s
x
LaB diferenalas Bon las elguientea:
1. Las diferencios cuadraticas de coda valor observado no se refieren al
promedio fijo del grupo observado, sino a un promedio que varia para
cada x . . y que est a dado por la linea de regresion (Y.).
2. Se par (0 - 2) en vez de (n - 1). por razones teoricas que no
es cooveniente explicor aqui.
En e1 ejemp10 desarro11odo. e1 calcu10 de S I es el siguiente
y l<
J
1
Y
i
(Y. - Y. ) (y.
_ Y ) 2
1 1 1 1
0.79 0.77 + 0.02 0.CXD4
0.93 0.95 - 0.02 0.CW4
L1s 1.13 + 0.02 0.CW4
1.29 1.31 - 0.02
0.CW4
1.47 1.49 - 0.02 0.CW4
1. 71 1.G7 + 0.04 O.mlG
1.87 1.85 + 0.02 0.CXD4
1.99 2.03 - 0.04 O.mlG
111
I
s
y/x
= \ 0Y
i
- Y
i
) 2 =Vo.
OOS6
Y-n-2 6
112
=
0.0056
=
0.03
El analis
variahle:;. F
variables en '
vacion. POl
mide A 1 p e ~ : ; o
de la tempera
se cuen to e J
frutos.
Simbolizo
objetivo del,
res de "x" er.
estas unidade
si . hombres COl
server si a1 I
aumento; obse
dio de lOA fr
Presentacion
I) Tabla:
SegUn el I
a) IIna Ii
b) una ta
0) La li.ta .
lor de ca
Ejemplo:
Rel .
Fami 1 i
1
2
3
4
5
6
7
B
9
10
l.l
En este
Be idp.n t.i fj co
cuol de las f
llamar "x" a
las hermanas.
b) La tabla
r os en I e
cion que corr'
, .'- . ""
CORRElACllJI
El an61isis de correlacion estudia el de dos
variables. Para peder hacerlo es necesario medir simultaneamente las dos
variables en coda uno de los elementos de un conjunto de unidades de obser-
vacion. Por ejemp.lo, en cada individuo de un grupo de hombres odultos se
nide el peso y 10 estat. llrn, en coda enfermo de un grupo de pacientes mi ..
de 10 temperatura axilar y 10 presion sistolica. en cada arhol de un huerto
.se cuento e1 numero de (rutes Y He det.ermine e1 promedlo de tamano de las
'frutas.
Simbolizaremos por "x" a uno de las variables y por "yO a 10 otra. El
objetivo del estudio de 10 correlacion es determinar 8i 01 varier los valo-
res de "x' en determinado sentido en las unidades de observacion. "y" en
estos unidades aumenta. disminuye 0 mantiene i ,gnal . Ejemplos: observer
5i, hombres con mayor estaturn pescm mas que hombres con men or estat ..... a: ob-
servor si 01" haber mayor temperatura corppral. 10 presion sist61ica tamb1en
- aumenta: observar s1 a mayor numero de frutas en e1 arbol el tamano prome-
dib de la8 frutas disminuye.
Presentacion de los datos
1) Tabla:
SegUn e1 de observaciones puede -ser:
a) una 'lista
b) una tabla de datos agrupados
a) La lista consiste en colocar frente a coda unidod de observacion e1
lor de cac.l'c una d'; las variables medidas.
Ejemplo:
Relacion entre estatura de herman os y hermartas
Familia
1
2
3
4
5
6
7
8
9
10
11
Hermmlos
X
1.71
1.68
1.66
1.67
1.70
1.71
1.70
1. 73
1.72
1.65
1.66
Hermanae
y
1.69
1.64
1.65
1,63
1.65
1,62
1.65
1.64
1,66
1.59
1,62
En este ej emplo 10 unidad de observacion es 10 familia. Coda familia
se Identific6 arbitrariamente por un numero. En eate ca80 8S indlferente a
eual de las estaturos desiqnemos por "x" y a cual .'y". Deeidimos
. llamar "x" a las estaturas de los hermanos y Ilamar "y" a 10 estatura de
las hermanas.
bl La tabla de datos agrupados 0 tabla de correlacion dispone de casille-
ros en los cuales quedan ubi c adas las diferentes unidades de observa-
cion que corresponden a ellos. Este tipo de labIa permite 10 visualizacion
113
I
,
I
1&
Inmedlata de la r"lad6n exhtent" entre las varlable8 en eatudlo.
Ejernplo:
Con sumo de 2
(Centros de
closes y)
150
170
190
210
230
250
270
290
310
330
Total
Con sumo de 02(cc. por min.) y peso en 136
individuos nonnales
Peso corporal (Centro de clases xl
1---
-
35 45 5$ 65 75 85 95 105
1
1 1
3 3 1
1 23 9 1
1 13 23 4 2
3 13 6 1
2 11 1 1
4 1 4
1
1
1 6 43 52 24 8 1 1
Total
1
2
7
34
43
23
15
9
1
1
136
Se aprecia facilmente que a medidn que aumenta e1 peso de los indivi-
duos aurnenta tambi;;n"l consurno de
2
,
2) .
La manera mas sencilla de presentar y analizar.la relocian entre dos
variables es e1 grafieo de correlacion.
La tecnica para construir eate grofieo es 10 slguiente: en cada uno de
los ejes perpendiculares se coleca una de las variables estudiadas. La va
riable cmotada en e1 eje horizontal se denomina "x" y 10 del eje vertical
"y". La escala de variables 'en cdda eje flucbJO entre e1 valor minimo y el
maximo de 10 serie. sin necesidad de comenzar en O. Se proporcionaran las
escalas de manera que ambos ejes tenqan igual longitud.
Una: vez trazados los ejes y sus escalas se procede a inscribir cada
unidad observada, representandola por un punto en la interseccion de per.
pendiculares imagi nar ias levan tadas en los valores que Ie corresponden a1
ir'1;viduo para cada variable. 5e rogra asi 11n grafieo de puntos euya dis ..
f 1 'cIon nos inforrno sobre 1a existencia 0 no de correlacion. El grCifico
puede hacerse ry partir de una 1ista de los individuos. no de una tabla
de COI relacion.
Ej amplo:
En 19 alumnos de primer ano de una escuela 5e ha hecho un entudio de
corre1acion entre e1 test que mide e1 coeficiente intelectual (CI) y las
notas obtenida,s, P.T1 los examenes de primer ano. Los datos son los siguien-
tes:
CI
x
107
120
114
Examen
y
59
60
Examen
90
eo
70
80
50
40
30
20
70 80
En 10 tabla es
riables. el grafic
ilas notas son tambj
11 E1 9r6 fico de F
nen en una nube ell
l
puede ser positivcr
,rresponden valoree
.01 tos de y. Es ne,
I
idisminuyen.
La auseneia de
':cion circular. hori
I
i
... 14 ........... "' ...... " .... - "" .. "'*"Jl"" .. ......... ...... ......_ ..:.. . :, . ) . "-'_ ."-'-'-0,:.,., . " .... ::...., "_., ',.
I
indivi-
ntre do.
a uno de
La va_
vertical
limo y e1
oran las
blr _,Ja
de per-
,onden a1
:uya dis-
, grafico
ma tabla
,tudio de
:1) y las
siguien ...
Examen
90
80
70
80
50
40
30
20
70 80
90
77
136
111
140
97
117
126
92
90
110
123
110
103
96
133
102
100
110 120
26
80
66
66
SO
68
67
31
40
41
57
50
44
43
72
32
130
140 150
CI
En 10 tabla es muy diffeil ver 10 relacion que existe entre ambos va-
riables. e1 grafico en cambio, nOB muestra inmediatamente que a mayor CI
las notall son tambien mayores y viceversa. ,
E1 gr6fico de puntos nos revela correlacion cuando los puntos se dispo ...
nen en una nube eliptica y ohIieua con respecto a los eje's. La correlacion
puede ser positivQ 0 negativa. Es positiva cuando a valores bajos de x co-
rresponden valores bajos de y. y a valores altos de x corresponden valores
altos de y. Es negatlva s1 a1 aumentar los valores de x los valoree de y
disminuyen.
La ausencia de correlacion se manifiesta en el grafico por una disposi-
cion circular, horizontal 0 vertical de los puntos.
115
.;
II
I
ii
III
I
y
Laa imogene a de loa aituaciones descritas son:
correlacion
pullin
X
..
. .
. .
cOlreiacion
n'Katin
X
., .
. .
. .
. .
. .
. .
X X
. . .
. .
. ... .
U I n C I I d. CDr r I I c I Ii n
Contam08 lue,?
;en dOB cuadran tes
!a 10 que se encue
I Podemps resUll)
asociacion. En [
'de 10 medicma Biu
!guiente tabla:
i
Notas de
ex amen
-!
Altos
Boias
El grado de co rre lacion se revela en el qrafico por 10 mayor 0 menor
dispersion de los puntos alrededor del eje mayor de la elipse.
La correlacion perfecta se revelarte por una disposicion lineal de 108
puntas.
Cuando es dificil veT si existe correlacion. es una ayuda trazar per-
pendicularea a los ajas en 108 valora. correspondientee a loa medianae de
las variables. En el grafico del presente ejemplo. trazamos una linea ver-
tical que deje 9 puntos a su izquierda y 9 a Sll derecha con 10 que obtene-
mos 10 mediana del cr. luego trazamos una horizontal _que deje 9 puntes
orr iba y 9 abajo dando mediana de las notas de examen. En este coso
particular 10 aa y 10 lOa observacion ordenada segun CI eston ambos frente
01 valor HO y por 10 tanto 10 vertical pas oro por ambos puntos. Adjudiea-
remos dos mitades hacia la izquierda de 10 vertical y dos mitades hacia la
derecho.
Exama"
80
8
70
60
,
50
40
6
30
20
-.-
,
10 80 90 100 110
120 130 140 150
116
!
Total
Se observa 1.
:ambas mediciones
EI coaficlanta dE
Tan to el ana:
nas solo apl
'falta de correIa!
sis. Par el coO'
tamos alguna ,med
clente de correl
!RaQU lal tOI para
I. Para que el
, flO que:
ia) La correl act,
ib) aaa una (
I El primer re
18umible en una 1
i El rE "aita
I
'de corre. lc.. ... l.on F
Se va en esc
cad a valor de p<
,
lesbozo se per fee
. En general s
ble verificarlo
dos "no pqrametr
. ,
CIon
Calculo de r
:"0 formula p
l - - --. c . - ... - .' . . _ _ ...... . . , . _.". __ " .
-,1_., '''_
.,,, .,-.. -.--." .,... -,- '
Ia'h-' ""W,,,u"W...,..'V.I .. ... .... ..l'''''''''.... ..... .. , .. _ .....
.
.
.
.
.
.
.
x
c i 6 n
r 0 menor
,
Contamos luego los puntes en cada uno de los obtenidos. Si
!n dos cuadrantes diagonalmente 10 ccmtidad de puntos es superior
10 que se encuentra en el otro septido decimos que hay correlacion.
Podemps e1 resu1taclo del rn1alisis por medicmas en una tabla de
osociacion. En nuestro ejemplo definiremos los valores a uno u otro lado
de Ie mecliana simplemente como altos 0 bajos con 10 que' ohtencll-etnos 10 .i ..
guiente tabla:
He locicn en t re CI y notas de examen
------ --------_._._-_ . .
Notas de
ex amen
Altas
BaJas
Total
Nivel de CI
Bajo Alto
1 8
8 1
---_._---_.-
9 9
Tot a I
9
9
. -. ,-, -,--_._---_._._------_.---.- ----
18
al de los
Se observa 10 mayor frecuencia de inclivicluos en los casilleros en que
azar per- ambos mediciones coinciden 10 que nos revelo correlacion positivd.
dianas de
.inea ver ..
,e obtene-
9 puntos
"ete ca80
las frente
Adjudica-
I hacia la
EI coeficienle de correlacion Hr"
Tanto e1 analisis del grafico como e1 del trazaclo de las media-
nas son solo aproxlmados para medir e1 grado de correlaci6n. Cuando 10
(alta de correlacion es evidente no se justifica seguir adelante e1 on6:1i ...
sis. Por e1 contrario, si estos metodos sugieren una cprrelacion. necesi-
tamos alguna medida para apreciar su magnitud y esta medida es el coefi-
ciente de correlacion r.
ReQuisitos para el calculo de r.
Para que e1 coefioiente de correlacion sea una buena meclida'es necesa-
rio que: .
a) La correlaoi6n taorica sea una linearecla.
b) sea una diatribuci6n bivariable. normal.
El primer requisita se cumple coda vez que 1a nube de puntas fuera re-
sumible en una linea recta.
El requisito de ser normal bivariante. se puede exp1icar can la tabla
de correlacion para peso corporal y consumo de oxigeno en 10 pagina 2.
Sa ve en esa tabla que hay un esbozo de distribucion normal frente a
cada valor de peso y 10 mlBmo frente a cada ,valor de c:onsumo de 02' Eats
el!lbozo se per feccionClTla a medida que fuera aumentando el numero de obeer ..
vaciones.
En general se supone que estos requisi tos se cumplen ya que no es posi ..
hIe verificarlo. Si evidentemente no se cumplen. hay olros metodos llama-
dos "no parametricos" que pueden utilizarse para medir el grado de corre1a-
cion.
Calculo de r
,
formula para e1 ca1culo de res:
117
I
I
'1
I
,
'-.
I
,j
J
r
I
:j
".
j
,
,
1
<
1
,
.,:
de
r :::
1
El valor de r
k r se obtiene al
I
Parct obtener las cantidades necesarias necesitamos las columnas indica- 7
dos a contlnuaclon.
Para nuestro ejemplo: .
Xi
Yi xi Yi
x.2 y
i
2
1
L(X -
107 59 6.313 11.449 3.481 r =
V fi,(x
120 60 7.200 14.400 3.600
- x)
77 26 2.cx:Y2 5. 929 676
136 80 10.880 18.496 6.400
111 66 7.326 12.321 4.356
Ii
140 66 9.240 19.600 4.356
97 50 4.850 9.409 2.5(0
117 68 7.956 13.689 4.624
126 67 8.442 15.876 4.489
92 31 2. 852 8.464 961
00 40 3.600 8.100 1.600
110 41 4.510 12.100 1.681
123 57 7.011 15.129 3.249
110 50 5.500 12.100 2.500
103 44 4.532 10.609 1.936
!
96 43 4.128 9.216 1.849
L
En 10. cuadrar
133 72 9.576 17 .689 5.184
los cuadrantes
102 32 3.264 10.404 1.024
3el numerador sera
hayor. menor 0 ig'
1.900 952 109.182 224.980 54.466
H 0 O.
i La correlaci6n
De esta II'Onera:
I
- 1 ::: correIa
I
n
:::
18
L x.
2 :::
224.980
1
0= ausenci
1
I
+ 1 ::: correlc
L Xi
:::
1.900 L Yi
2
= 54.466
(L x.) 2
I. . . .-
L Yi
:::
952
:::
3.960.100 I gn I , Ie ac Ion
1 .I
L x.y.
:::
109.182
(2 y.) 2
:::
906.304 I
1 1 1
I Para poder de
rignifi c ativo. es
que:
18 (109)
-
(1.900) (952)
1 Ho: p': 0
r
::: au
Vfl.8 (224.980.98:) - (54.666)
-
J HI: p l' a ex
!
Donde p e. el
La di.tribuci[
r
::: 70.706
:::
0.869
trada en p ::: a y
81.444.42
r
:::
0.87
118
!
de r
El valor de r puede variar entre -1 y +1. Una vi sualizacion del valor
,e r se obtiene 01 analizar otro formula para r en pre sencia de un qr6:fico .
as i ndica- :
y.2
1
3. ""-'
3,0-... .J
676
6. 400
4.356
4.356
2.500
4.624
4.489
r
Signos de l os pr oduc tos (x-x) (y- y)
y
II I
( - ) +
(y-y 0
- x) (y - y)
=
V U:(X - ;)3 li(y -
y
III IV
( + )
( - )
(y_y) < O
x
(x-x) < 0
x
(x-x 0
En los cuadrantes I y III los productos (x _ x) (Y . - y ) Bon positivos.
961
1.681
3.249
2.500
1.936
1.849
5.184
1.024
In los cuadrante. II y IV 80n negatlvo.. Asi podemoe entender que la suma
tel numerador sera (+" (-) 00 aegun si el numero de s umandos es
menor 0 igual 01 de sumandos negativos. 10 que hara que r sea (+).
54.466
(-) 0 O.
La correlaci6n 8S mas estrecha mlentraa mas cercano a -1 0 a +1 este r.
--------'-' le est a monera:
24.980
54.466
60.100
:xl.304
-
1
0
+
1
=
=
=
correlacion inversa 0 negat i va perfecta,
ausenc ia abs oluta de correlacion
corre lac i on directa 0 positivQ pe rfe cta.
Ii gni Ii cacion
Para pade r determinar si e l valor de r encontrado es estadistic amen te
significativo, es necesario hac er una prueba de significacion e stadist ica
lue:
Ho :P 0 ausencia de correlacion
HI :p 1 0 existenc ia de corre1acion
Donde p e8 e1 coef iciente de correlacion poblacionaL
La distrlbucion muestral de r e! aproximodamente una curva normal cen
trada en p = 0 y con error standard.
es deci r
119
i
J
I
i
"
;'
!
,
!
i
\
\.
\
i-'r = a
Sr =
I
I
3 )
I
,'0.
I
E1 azar ne
mani fiesta
Con 10 cllal podemos Construl'r 1
a estadis tica
Conclusion
I
genl
rv,,-:-;
; 1 _ r2
que tiene una distribuci.on t de Student con n _ 2 grados de l.i.bertad.
Del. eieml'la unteIior tenema .. :
r '" 0.87
n = 18
en es te caso t =
0.87 Vl6
V 1- 0.87
2
= 7.059
!
La pr-:!senc.
automat j camen t
'tener o1"mpre J
l El hecho
\ ion Bean de t
er
,la corte laciot
'pale .. eB util
'V di.sti.ntoB I
pna!' que
'les dan
Can 16 grados de 1ibertad. Las tobIas de 10 t de Student muestran los
val ores para diferentes percentiles de la diotribuc16n. 'S1 a fuera
0.05 tratandose de una pr'ueba de siqnificaclon bilateral. debemo8 buscor ef
valor de t correspondiente 01 percentll 97,5 0 como aparece en 10 ta-
bla . para .975 10 que nos do t = 2.120. Para a" 0.01 buscaremos bajo 995
10 que do t = 2.921.
Interpretacion de la existencia de correlaclon
i
Una vez que hayamos concluido que existe correlacion .debf.!m08 hacer unOl
en terminoB del problema que analizamos.
Las siguientes' circunstanciae pueden provocar la correlacion entre' dos'
variables : 1
1) Una voriabJe causa de 10 otra. Por ejemplo: 10 correlacic5n entre
aumento de peso y cantidad de calodas ingeridas pueden se;- de <' ste ti- '
po.
2) Ambos son consecuencia de una tercera. Pbr ejemplo: 10 co.\
rrelacion entre mortalidad infcmtil y porcentaje de nHios matriculodos
ell In eRcuela difl:-nmtes paises tiene una correlacion inverso explicada
p.; t que ambos :-.:: on consecuencia de un hajo nivel de vi.da.
3) La r:ortf> 1 (lei ,':,,.., hn producido por uzor. Esto pueda suceoP,r scbre todo
cuanda pi : , ( r. t ' 1' " de ' ,\hservaciones as escaso.
lie 'Ia Rllsencia de correlaclon
1) No hay C('lTi !)], ".iQn p.ntre las variables
2) Hay corrf'lor.: i.6n pero esta encubierta por una variable que tiene corre
lcrci on o p ue!Jlo . Por ejemplo; 1<:1 ve1ocidoo desarrollada en una carrera
y e1 numero d.e por minuto deberion estar correlacionoooB direc
tamentR pc!ro es pORihle qllP. mas veloces sean atletas . que se vean men os I
afectados po r e l esfuel'7.o f lS1CO y por 10 tanto reaCClonen como egcaso '
aumento del numero df" pl.J 1 saciones.
120
.--_. - -_._----- -
J) El azar nos he presentado oquellos casos en que 10 correlacion no se
manifiesta. Esto puede suceder 3i el numero de observaciones es
I ,
Conclusion general
rtad.
uestran los
a fuera
'8 buscar ei
!8 en 10 ta-
OB bajo 995
La presencia a ausencia de oorrelacion entre dos variables no significa
lutomat!camente 1a exiatencia 0 no de una relacion cauaa-efecto. Debemoa
tftner siempre presente loa otras exp1ioaciones que hamos senalado.
El hecho de que las conclusiones que sacomos a partir de una correla-
,ion .ean de tipo inductivo no Ie re.ta importancia al metodo. Hay mucha.
situaciones en que el unico estudio posible. en una primera etopa es el de
La correlacion. Asi por ejemplo. en 10 investigacion de causes de enferme-
es util estudiar 10 correlacion entre 10 frecuencia de 10 enfermedad
y distintos factore.s arnbientales. Asl. S8 puede descu:brir importantes he-
chos que pueden comprobors8 posteriormente con procedimientoB experlmenta-
1es que dan mayor seguridad en la interpretacion.
IS hacer una;
In entre'dos
;
aci6ri- -entre,
de <'ste ti
.pio: In co-
!Iatr iculcidos
,a explicadd
10.
r sobre todo
tiene corre-!
una carrerai
nados direc. :
vean men os ;
como escoso
I
121
I
,
I
I
,
;
L
I
GRADDS
4,
OE
LI8ERTAO
(IS
(m
1 . IGB
D1STRIBUCION NORMAL (UNA COLA). IIROPORCION
2 . H2
DEL AREA QUE QUEDA A LA DERECHA DE LA ORDENADA MAS ALLA
3 . 137
DE Z = +(x - ,.)/,,'
4 .134
5 .132
Z 0.00 o.ot 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
6 . 131
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.480\ 0.476\ 0.472\ 0.468\ 0.464\
7 . 130
0.1 0.4602 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
8 . 130
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 9
. 12Q
0.3 0.3821 0.3783 0.3745 0.3707 0.3869 0.3832 0.3594 0.5557 0.3520 0.3483
10 129
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 $.3156 0.3121
11 . 129
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776 12 . 128
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2546 0.25\4 0. 2483 0.245\
13 . 12R
0.7 0.2420 0.2389 0.2358 0.2327 0.2297 0.2266 0.2236 0.2206 0.2177 0.2148
14 128
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1 977 0. 1949 0.1922 0.1894 0. 1867
0.9 0. \841 0.\814 0.\ 788 0.\762 0.\ 736 0.1711 0.\685 0.\660 0.\635 0. \611 15 . 128
1.0 0.1587 0.1562 ' 0. \.539 0. \515 0.1492 0.1469 0.1446 0.1423 0.1401 0. 1379
16 .128
1.1 0. \357 0.1335 0. \3\4 0. \292 0. \271 0.1251 0.1230 0. \2\0 . 0.1190 O. \170
17 . 123
1.2 O. \15\ 0.1131 0. 11\2 0.1093 0. 1075 0. 1056 0.\038 0. 1020 0. 1003 0.0985 18 .127
1.3 0.0968 0.0951 0.0934 0.0918 0.090\ 0.0885 0.0869 0.0853 0.0838 0.0823
19 . 121
1'.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694
20 . 127
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559 21 . 127
\.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
22 . 127
J.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.040\ 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.035\ 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.030\ 0.0294
23 . 127
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233 24 . 127
2.0 0.0228 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
. 25
127
2. 1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0\50 0.0146 0.0\43
26 127
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110 27 . 127
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
28 . 127
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
29 . 127
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.004n 30 . 127
2.6 0.0047 0.0045 O.OOH 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
.,
126
2. 7 0.0035 0.003'1 0.0013 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.00\9
.2.9 0.0019 0.0018 O.OOIR 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 00\3 o.oon 0.0013 0.0012 0.0012 0.0012 0.0011 0.0011 0.00\0 0.0010
j
,1
I
:1
1
,_ . . .-_ .. -____ ._._._ L
i
)
L
-.---..
RCION
: ALL'
0.09
0,464\
0.4247
0.3859
0.3483
0.3121
0,2776
0:2451
0,2148
0,1867
0.161\
I 0,\379
) 0.1170
! 0.0985
I 0.0823
I 0.0681
I 0.0559
I 0.0455
I o.r
I
1 0.0233
I 0.0183
! 0.0143
! 0.0110
7 0.0084
0.0064
j 0.0048
7 0,0036
7 0.0026
0.0019
I 0.0014
0.0010
GRADOS
DE
LIBEATAo
(n)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
}6
17
18
19
20
21
22
23
24
25
26
27
28
29
30
DISTRIBUCIDN DE STUDENT (I)
l,u t.eo t,1II t. 10 t.n t,to ,I.. (.0 t... t,l1e (u I. .. , t ... u
.158 325.510.7271.001.38 1963086.3112731.863.7637
. H2 .289 .445 .617 .816 I. 06 I. 39 I. 89 2.92 .\.. 30 6.96 9.92 31. 6
.137 .277 .424 .58,1 .765 .9781.251.612.353:184.515.8412.9
.134 .271 .414 .569 .741 .941 1.19 1.53 2.13 2.783.754.608.61
.132 .267 .408 .559 .727 .9201.161.482.012.573.364.036.86
.131 .265 .40,1 .553 .718 .9061.131.441.942.453.143.71 5.96
.130 .263 .402 .519 .711 .8961,)2) ,42) .902.36 a.oo a.50 5,40
.130 .262 ,399 .516 .706 .8891.11 1.40 1.862.312.903.365.01
.129 .261 .398 .543 .703 .8831.101.381.832.262.1123.254.78
.129 .26(1.397 .5,12 .700 .8791.091.371.812,232.763.17 4.59
.129 .260 .396 .540 .697 .8761.09 1.36 1.802 20 2 72 3.11 4.4-1
.128 .259 .395 .539 .695 .8731.081.361.782.182683064.32
.128 .259 .391 .538 .691 .8701.081.351.772.162.653.014.22
.128 .258 393 .537 .692 .8681.081.341.762.142.622.984.14
.128 .258 .393 .536 .691 .8661.071.341.752.132.602.954.07
,128 .258 .392 .535 .690 .8651.071.341.752 '122.582,924.02
.128 .257 .392 .534 .689 .8631.071.331.742.11 2.572.903.96
.127' .257 .392 .534 .688 .8621.071.331.732.102.552.88 3.92
.127 .257 .391 .533 .688 .861 1.07 1.33 1. 732.092.54 2.863.88
.127 .257 .391 .533 .687 .8601.061.321.722.092.532.843.85
.127 .257 .391 .532 .686 .8591.061.321.722 .. 082.522.833.82
.127 .256 .390 .532 .686 .8581.061.321.722.072.51 2.823.79
.127 .256 .390 .532 .685 .8581.061.321.712.072.502.81 '3.77
.127 .256 .390 .531 .685 .8571.061.321.712.062.492.803.74
.127 .256 .390 .531 .684 .8561.061.321.712.,062,482,793.72
.127 .256 .390 .531 .684 .8561.061.321.71 2.b6 2.482.783.71
.127 .256 .389 .531 .684 .8551.061.31 1.702.052.472.773.69
.127 .256 .389 .530 .683 .8551.061.31 1.702.052.472.763.67
.127 .256 .389 .530 .683 .854 1.05 l.31 I. 70 2.M 2.46 2.763.66
.127 .256 .389 .530 .683 .854 \,05 1.31 1.702,042.462.753.65
.
. - - : - - ~ ..... ~ - ~ . - ~ - - - - - - . .
...
'"
....
A
i ,-
j '. I:.
--: 6'_:;J
2
X
2
;t
X a.
GRA De s
DISTRffiUCION DE x'.
DE
L I 9E i1 , .. i) a. ($)
-------
in) 99.5 99 9"., 95 90 75 50 25 10 5 2.5 I 05 0. 1 n
1 O.Dl6 0. 102 0.455 1.32 2.71 3.84 5.02 6.63 7.88 10.8 1
2 0.010 0.020 0051 0.103 0.211 0.575 1.39 2..77 4.61 5.99 7.38 9.2 1 10.6 13.8 2
3 . . 0.072 O.IJ5 0. 216 0.352 0.584 1.21 2.37 . 4. 11 . 6.25 7.81 9.35 11.3 12.8 lbT 3 .
~ 0.207 0.297 0.434 0.7 11 1.06 1.92 3.36 5.39 7. 78 9.49 11.1 13.3 14.9 18.5 4
5 0.412 0.554- 0.831 U5 1.61 2.67 4.35 6.63 9. 24 11.1 12.8 15.1 16. 7 20.5 5
6 0.676 0.872 1.24 1.64 2.20 3.45 5.35 7.84 10.6 12.6 14.4 16.8 18.5 22.5 6
i 0.989 1.24- 1.69 2.17 2.83 4.25 6.35 9.04 12.0 14.1 16.0' 18.5 20.3 24.3 7
8 1.34 1.65 2.1 8 2. 73 3.49 5.07 7.34 10.2 13.4 15.5 17:5 20.1 22.0 26.1 8
9 1.73 2.09 2.iO 3. 33 4. 17 5.90 8.34 11.4 14. 7 16.9 19.0 21.7 23. 6 27.9
!l
I
10 2. 16 2.56 3.25 3.94 4.87 6.74 9.34 12.5 16.0 18.3 ZO. 5 23.2 25.2 29.6 10
11 2.60 3.05 3.82 4.57 5.58 7.58 10.3 13.7 17.3 19.7 21.9 24.7 26.8 31.3 11
I
12 3.07 3.57 4.40 5.23 6.30 8.44 11.3 14.8 18.5 21.0 23.3 26. 2 28.3 32.9 12
13 357 4. 11 5.01 5.89 7.04 9.30 12.3 16.0 19.8 22.4 24.7 27.7 29.8 3+.5 13
I
14 4.07 4.66 5.63 6.57 7.79 10.2 13.3 17. 1 21.1 23.7 !!!i. 1 29. 1 31.3 36. 1 14
I
15 4.60 5.23 6.26 7.26 8.55 11.0 14.3 11.2 22.3 25.0 27.5 30. 6 32.8 37.2 15
16 5.14 . 5.81 6.91 7.96 9.31 11.9 15.3 1M 23.5 26.3 28.8 32.0 34.3 39.3 16
i
17 5.70 6.41 7.56 8.67 10.1 12.8 16.3 ZO.5 24.8 27.6 30.2 33. 4 35.7 40.8 17
18 6.26' 7.01 8.23 9.39 10.9 13.7 17.3 21.6 26.0 28.9 31.5 34.8 37.2 42.3 18
19 6.84 7.63 8.9 1 10. 1 11.7 14.6 18 ..3 22.7 27.2' 30.1 32.9 36.2 38.6 43.8 19
I
20 7.43 8.26 9.59 10.9 12.4 15.5 19.3 23.8 28.4 3 1.4 3+.2 37.6 40.0 45.3 20
21 8.03 8.90 10.3 U.6 13.2 16.3 20.3 24.9 29.6 32.7 35.5 38.9 41.4 46.8 21
. ,
22 8.64 9.54 11.0 12,3 14.0 17.2 21.3 !!!i.0 '30.8 33.9 36.8 40.3 42.8 43.3 22
I
I
23 9.26 10.2 11.7 13.1 I .... 18. 1 22.3 27.1 32.0 35.2 38.1 4 1.6 44. 2 49.7 23
24 9.89 10.9 1 =.4 13.8 1S.7 19.0 23.3 28.2 33.2 36.4 39.4 43.0 45.6 51.2 24
-; ~
I
25 10.5 l1.l 13. 1 14.6 16..5 19.9 24.3 29.3 34.4 37.7 40.6 44.3 46.9 12.6 25
26 11.2 12.2 13.8 15.4 17.3 20.8 25.3 30.+ 35.6 38.9 41.9 45.6 48.3 54. 1 26
27 . 11.8 1%.9 j 4.6 16.2 18.1 21. 7 26.3 31.5 36.7 40.1 43.2 47.0 49.6 SS.5 27
I
28 12.5 13.6 15.3 16.9 18.9 22.7 27.3 32.6 37.9 41.3 44.5 48.3 51.0 56.9 28
29 13.1 14.3 16.0 17.7 19.8 23.6 28.3 3S.7 39. 1 42.6 45. 7 49.6 52.3 58.3 29
30 13.8 15.0 16.8 18.5 ZO.6 24..5 29.3 34.8 40.3 43.8 47.0 50.9 53.7 59.7 30
---
--
. _-- .. _-- _ . ._ - -,-
~ -
.. "