You are on page 1of 17

La dIstrIbucIon

t
t de student
D lo que es lo mIsmo:
La relacIon entre la cerveza y los estudIos de estadistIca
La dIstrIbucIon t de student fue descubIerta por WIllIam S. Cosset en 1908.
Cosset era un estadistIco empleado por la compaia de cerveza CuInness con
quIen tenia un contrato que estIpulaba que no podia usar su nombre en sus
publIcacIones. l recurrIo al sobrenombre de "Student" que es como ahora
conocemos el tIpo de estadistIca que desarrollo.
Lo Interesante del caso es que su trabajo estaba enfocado al control de calIdad
de la cerveza. En el pasado otros InvestIgadores de la compaia CuInness habian
publIcado articulos en los que se dIvulgaban secretos o InformacIon confIdencIal
sobre el proceso de la cerveza y por eso se oblIgo a Cosset a aceptar la clusula.
0e acuerdo al Teorema del LimIte Central, la dIstrIbucIon muestral de una
estadistIca (como la medIa de la muestra) seguIr una dIstrIbucIon normal,
sIempre y cuando el tamao de la muestra sea sufIcIentemente grande sufIcIentemente grande.
Entonces cuando conocemos la desvIacIon estndar de la poblacIon
podemos calcular un valor o calIfIcacI valor o calIfIcacIo on z n z y emplear la dIstrIbucIon normal
para evaluar probabIlIdades sobre la medIa de la muestra.
SIn embargo, muchas veces los tamaos de las muestras son muy pequeos,
y frecuentemente no conocemos la desvIacIon estndar de la poblacIon.
Cuando estos problemas ocurren, en estadistIca se recurre a una
dIstrIbucIon conocIda como la "t de t de student student" " cuyos valores estn dados
por:
n
s
x
t

Diferencia a probar
Desviacin estndar de
la diferencia
Podemos ver que la ecuacIon es prctIcamente Igual a la utIlIzada para la
dIstrIbucIon muestral de medIas, pero reemplazando la desvIacIon
estndar de la poblacIon por la desvIacIon estndar de la muestra.
0e manera sImIlar al caso de la dIstrIbucIon muestral de medIas para el
caso de que n J0, en donde usamos la dIstrIbucIon normal, podemos
encontrar la dIstrIbucIon de los valores t de t de student student pcrc cquellos ccsos pcrc cquellos ccsos
cucndo n cucndo n J0 J0.
SIn embargo, otra dIferencIa en su uso es el empleo de tablas de
dIstrIbucIon para valores t en lugar de las tablas para valor Z.
Para derIvar la ecuacIon de esta dIstrIbucIon, Cosset supuso que las
muestras se seleccIonan de una poblacIon normal. Aunque esto pareceria
una suposIcIon muy restrIctIva, se puede mostrar que las poblacIones no
normales que poseen dIstrIbucIones en forma casI de campana tambIn
proporcIonan valores de t que se aproxIman muy de cerca a la dIstrIbucIon
t.
La dIstrIbucIon t dIfIere de la de Z en que la vcrcnzc vcrcnzc de de t t no no es es yucl yucl c 1 c 1
como como en lc de Z en lc de Z, sIno que depende depende del del tama tama o o de la de la muestra muestra y sIempre es
mayor a uno. UnIcamente cuando el tamao de la muestra tIende a InfInIto
las dos dIstrIbucIones sern las mIsmas.
Dtra dIferencIa con la dIstrIbucIon normal, es que lc ]ormc de lc dstrbuc lc ]ormc de lc dstrbuco on t n t
de de student student depende de un pcr depende de un pcrc cmetro llcmcdo el n metro llcmcdo el n mero de yrcdos de lbertcd mero de yrcdos de lbertcd.
El numero de grados de lIbertad es Igual al tamao de la muestra (numero de
observacIones IndependIentes) menos 1.
6l = = n - 1
Notc: cucndo usemos so]twcre es posble que el nmero de yrcdos de lbertcd
se denomne como d] o 0F ("deyrees o] ]reedom").
Las curvas muestran la forma que puede tomar la dIstrIbucIon t de student la
cual depende del n depende del nu umero de grados de lIbertad mero de grados de lIbertad. Como se puede aprecIar se
parece mucho a la dIstrIbucIon normal. ncluso, para un n para un nu umero grande de mero grande de
grados de lIbertad (es decIr de n grados de lIbertad (es decIr de nu umero de datos en la muestra) las dos mero de datos en la muestra) las dos
dIstrIbucIones son Iguales dIstrIbucIones son Iguales.
1 grado de libertad
ms de 25 grados de libertad
Aunque parece una dIstrIbucIon normal, la dIstrIbucIon t tIene un poco ms de
rea en los extremos y menos en el centro.
Dtro punto a notar es que la dIstrIbucIon t es ms bIen una coleccI coleccIo on de n de
dIstrIbucIones, una para cada n dIstrIbucIones, una para cada nu umero de grados de lIbertad mero de grados de lIbertad.
El concepto de grados de lIbertad se puede vIsualIzar hacIendo referencIa a la
varIanza muestral que es Igual a:
1
) (
2
2

n
x x
s
n
i
Esta frmula puede verse como un promedio sobre n-1 datos .
La terminologa de grados de libertad resulta del hecho de que si bien !
"
considera n cantidades, slo n 1 de ellas pueden determinarse libremente.
Por ejemplo, si tenemos n = 4 entonces tenemos cuatro diferencias
Pero sabemos que la suma de ellas es = 0, por lo que si conocemos, por ejemplo:
entonces
Lo que indica que slo 3 de las diferencias (n 1) son "libres y la otra queda
definida por las dems.
x x
i

3 , 2 , 4
4 2 1
x x x x x x
3
5 # #
La dIstrIbucIon t t de student tIene las sIguIentes propIedades:
-La media de la distribucin es igual a 0
-La varianza es igual a donde es el nmero de grados de libertad
-La varianza es siempre mayor que 1, aunque es muy cercana a 1 cuando se
tienen muchos grados de libertad.
-Con infinitos grados de libertad la distribucin t t es igual a la normal.
La dIstrIbucIon t t de student se puede usar cuando cualquIera cualquIera de las sIguIentes
condIcIones se cumplen:
- -La dIstrIbucI La dIstrIbucIo on de la poblacI n de la poblacIo on es normal n es normal
- -La dIstrIbucI La dIstrIbucIo on de la muestra es sIm n de la muestra es sIm trIca, unImodal, sIn puntos dIspersos y trIca, unImodal, sIn puntos dIspersos y
alejados ( alejados (outlIers outlIers) y el tama ) y el tama o de la muestra es de 15 o menos o de la muestra es de 15 o menos
- -La dIstrIbucI La dIstrIbucIo on de la muestra es moderadamente asIm n de la muestra es moderadamente asIm trIca, unImodal, sIn trIca, unImodal, sIn
puntos dIspersos ( puntos dIspersos (outlIers outlIers) y el tama ) y el tama o de la muestra est o de la muestra est entre 16 y J0 entre 16 y J0
- -El tama El tama o de la muestra es mayor de J0, sIn puntos dIspersos (aunque en o de la muestra es mayor de J0, sIn puntos dIspersos (aunque en este este
caso tambI caso tambI n se puede usar la dIstrIbucI n se puede usar la dIstrIbucIo on normal). n normal).
Cuando se extrae una muestra de una poblacIon con dIstrIbucIon normal (o casI
normal), la medIa de la muestra puede compararse con la medIa de la
poblacIon usando una vclor t vclor t calculado por medIo de la ecuacIon anterIor. El
valor t puede entonces asocIarse con una probabIlIdad acumulada unIca que
representa la posIbIlIdad posIbIlIdad de que, dada una muestra aleatorIamente extraida de
la poblacIon de tamao n, la medIa de la muestra sea la medIa de la muestra sea CUAL, |ENDF o |AYDF CUAL, |ENDF o |AYDF a a
la medIa de la poblacI la medIa de la poblacIo on n,
La probabIlIdad acumulada para una ccl]cccon t se puede calcular en la sIguIente lIga:
http://stattrek.com/Tables/T.aspx
Ejemplo 1
La compaia USALUZ produce focos. El presIdente de la Cia. dIce que uno de sus
focos dura J00 dias. Entonces la competencIa va a varIos (notese) supermercados y
compra 15 focos para probar. Los focos de la muestra duran en promedIo 290 dias con
una desvIacIon estndar de 50 dias. Entonces, sI quIeren desmentIr al presIdente de
USALUZ necesIta saber c cu ul l es es la la probabIlIdad probabIlIdad de de que que 15 15 focos focos seleccIonados seleccIonados al al azar azar
tengan tengan una una vIda vIda promedIo promedIo no mayor de 290 no mayor de 290 d di ias as.
La solucIon de este tIpo de problemas requIere calcular el valor t basado en los datos
y despus usar una tabla de dIstrIbucIon t para encontrar la probabIlIdad de forma
sImIlar a lo que hIcImos con la dIstrIbucIon normal. ExIste sIn embargo software con
el que podemos hacer ms sImple el proceso.
SolucIon
PrImero necesItamos calcular el valor t usando nuestra formula
t = ( 290 - 300 ) / [ 50 / ( 15) ] = -10 / 12.909945 = - 0.7745966
0onde # es la medIa de la muestra, la medIa de la poblacIon, ! es la desvIacIon
estndar de la muestra y n el tamao de la muestra.
DK qu nos dIce este valor:
Ahora podemos usar una tabla o bIen calculadoras como la T 0IstrIbutIon Calculator T 0IstrIbutIon Calculator
(http://stattrek.com/Tables/T.aspx).
Usando sta ultIma, como sabemos el score t, seleccIonamos T score del menu de
"random varIable" e IntroducImos los datos:
* Crados de lIbertad (): 15 1 = 14.
* El valor t que obtuvImos = - 0.7745966.
El resultado nos da: 0.2257. Esto sIgnIfIca que sI la verdadera vIda de un foco es de
J00 dias, hay una probabIlIdad de 22.6 de que la vIda promedIo de 15 focos
seleccIonados al azar sea menor menor o o igual igual a 290 dias y nosotros ha sabriamos a qu
atenernos sI queremos poner en rIdiculo al PresIdente o Jefe.
Nota: PIensas que 22 de probabIlIdades de que
pase algo es mucho o poco:
Ejemplo 2
Supongamos que las calIfIcacIones de una prueba estn dIstrIbuidos normalmente
con una medIa de 100. Ahora supongamos que seleccIonamos 20 estudIantes y les
hacemos un exmen. La desvIacIon estndar de la muestra es de 15. Cul es la
probabIlIdad de que el promedIo en el grupo de muestra sea cuando ms 110:
SolucIon:
PrImero calculamos el valor t como en el caso anterIor ya sea en tablas o con ayuda
de herramIentas tIpo |InItab, Excel, etc. Nuestros datos son:
Numero de grados de lIbertad: n1 = 20 1 = 19
La medIa de la poblacIon es Igual a 100
La medIa de la muestra es Igual a 110
La desvIacIon estndar de la muestra es Igual a 15
El valor t es
t = ( 110 - 100 ) / [ 15 / ( 20) ] = 2.9814
Usando estos valores en el Calculador de valor t Calculador de valor t nos da un resultado de
probabIlIdad acumulada de 0.996. Esto ImplIca que hay una probabIlIdad de 99.6
de que el promedIo en la muestra sea no mayor de 110.
Ejemplo 2
Supongamos que las calIfIcacIones de una prueba estn dIstrIbuidos normalmente
con una medIa de 100. Ahora supongamos que seleccIonamos 20 estudIantes y les
hacemos un exmen. La desvIacIon estndar de la muestra es de 15.
Cu Cu l l es es la la probabIlIdad probabIlIdad de de que que el el promedIo promedIo en el en el grupo grupo de de muestra muestra sea sea cuando cuando m m s s
110: 110:
Notar que usando la opcIon del manu de "random varIable" y ponIendo "sample mean"
(medIa de la muestra), nos podemos ahorrar el paso de calcular el score t.
SolucIon:
0e la tabla encontramos que t
0.05
para 24 grados de lIbertad es 1.711. Por tanto, el
fabrIcante queda satIsfecho con esta afIrmacIon sI una muestra de 25 lotes rInde un
valor t entre -1.711 y 1.711.
Se procede a calcular el valor de t:
Este es un valor muy por arrIba de 1.711, por lo que el fabrIcante dIria que no est en
el rango buscado. SIn embargo, sI se encuentra la probabIlIdad de obtener un valor de t
con 24 grados de lIbertad Igual o mayor a 2.25 se busca en la tabla y es
aproxImadamente de 0.02. 0e aqui que es probable que el fabrIcante concluya que el
proceso produce un mejor producto del que pIensa.
25 . 2
25
40
500 518

t
Ejemplo 3:
Un IngenIero quimIco afIrma que el rendImIento medIo de la poblacIon de cIerto
proceso en lotes es 500 gramos por mIlimetro de materIa prIma. Para verIfIcar esta
afIrmacIon toma una muestra de 25 lotes cada mes.
SI el valor de t calculado cae entre -t
0.05
y t
0.05
, aceptaria su afIrmacIon (con 90 de
confIanza). Qu conclusIon extraeria de una muestra que tIene una medIa de 518
gramos por mIlimetro y una desvIacIon estndar de 40 gramos: Suponga que la
dIstrIbucIon de rendImIentos es aproxImadamente normal.
Distribucin de probabilidad para t de student
-1.711 1.711
90% del rea
El valor de
t = 2.25 caera
en esta zona
de la
distribucin

You might also like