Professional Documents
Culture Documents
ALVARO GUIZA
SIMULACION
UNIVERSIDAD COOPERATIVA DE COLOMBIA
La distribución t student fue descubierta por William S. Gosset en 1908. Gosset era un
estadístico empleado por la compañía de cerveza Guinnes con quien tenía un contrato que
estipulaba que no podía usar su nombre en sus publicaciones. El recurrió al sobrenombre
de “student” que es como ahora conocemos el tipo de estadística que desarrollo.
Lo interesante del caso es que su trabajo estaba enfocado al control de calidad de la
cerveza.
Problemas que tienen que ver con inferencia acerca de la media de la población o en
problemas que implican muestras comparativas (es decir, en casos donde se trata de
determinar si las medias de dos muestras son significativamente diferentes).
Aplicación en investigaciones relacionada a la especialidad. Registrar y proyectar
datos del sector turismo en el tiempo.
TABLA DE LA DISTRIBUCION t - Student
La tabla da áreas 1 - a , para valores menores o iguales a t y n g.l, se construyó con Excel.
1–a
n 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
¥ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576
Es importante resaltar que al ser una distribución simétrica al tener información sobre un
valor positivo, se obtiene el dato para el mismo valor con signo negativo.
Por último, se puede afirmar, la distribución t es útil para realizar inferencias acerca de la
media poblacional cuando no se conoce s y la población es normal, independiente del n, no
obstante, aún cuando la distribución sea un tanto sesgada, la t sigue siendo apropiada, esto
se conoce como una distribución robusta, es decir, a cambios moderados de los supuestos,
el modelo sigue siendo valido. Como en el caso de la distribución normal, ésta distribución
también usa valores tabulados, tal como se aprecian en la tabla precedente, teniendo en
cuenta, que a medida que los g.l aumenten los valores tienden a ser igual a los encontrados
en la tabla Z.
Ejemplo 1: Los valores de las matriculas de estudiantes en una universidad privada tienen
un comportamiento aproximadamente normal, donde el promedio es de 2.100.000. Se
seleccionan 8 liquidaciones, siendo los valores los siguientes: 1.950.000, 2.100.000,
2.250.000, 1.890.000, 2.250.000, 1.950.000, 2.050.000, 2.350.000. Determine la
probabilidad de que:
Solución manual:
m = 2.100.000 ; s = ?
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
La probabilidad se encuentra entre 0.9 y 0.95, según la tabla T que se encuentra más
adelante, no obstante, al t ser negativo, la probabilidad está entre 0.1 y 0.05, es decir, los
valores complementarios..
Para buscar en la tabla, se tiene en cuenta la fila con 7 g.l y se ubica el 1.677, el cual se
encuentra entre los valores mencionados. De ahí que sea importante utilizar el Excel, que
nos permite calcular la probabilidad exacta.
Dado que el valor de 6.70 es mucho mayor que el ubicado en la tabla de 3.49 y corresponde
a 0.995, es claro, entonces, que para valores mayores de 3.49, la probabilidad será de 1.
Solución Excel:
a) P( <2.000.000)=P( <2.000.000)
P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)
Como se dijo utilizando la tabla, la probabilidad está entre 0.1 y 0.05. La probabilidad exacta
es de 0.0687. Es decir, la probabilidad de que el promedio de matrícula que pagan los
estudiantes sea menor de 2.000.000 es baja.
=DISTR.T(1.677;7;1)= 0.0687
Los resultados son similares a los ya presentados. Por la forma de calcular el Excel las
probabilidades, se resta a uno la probabilidad de 3.35, es decir, el programa calcula la cola
de la derecha.
Se observa fácil, que el Excel permite calcular las probabilidades de manera más exactas
que las usadas comúnmente (tablas). Esto es importante tenerlo en cuenta, ya que cuando
se tienen poblaciones muy grandes, esas pequeñas diferencias se convierten en
significativas.
= .
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las
medias de muestras de dos distribuciones normales se distribuye también normalmente, la
distribución t puede usarse para examinar si esa diferencia puede razonablemente
suponerse igual a cero.
para efectos prácticos el valor esperado y la varianza son:
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3
FÓRMULAS PARA LA ESTIMACIÓN POR INTERVALO DE CONFIANZA
una desviación típica dada por la siguiente expresión: . Esto se representa como
Así:
Obsérvese que el intervalo de confianza viene dado por la media muestral ± el producto