You are on page 1of 8

YURY KARINA GUERRERO EULEGELO

ALVARO GUIZA
SIMULACION
UNIVERSIDAD COOPERATIVA DE COLOMBIA

INICIO DE LA DISTRIBUCION T STUDENT

La distribución t student fue descubierta por William S. Gosset en 1908. Gosset era un
estadístico empleado por la compañía de cerveza Guinnes con quien tenía un contrato que
estipulaba que no podía usar su nombre en sus publicaciones. El recurrió al sobrenombre
de “student” que es como ahora conocemos el tipo de estadística que desarrollo.
Lo interesante del caso es que su trabajo estaba enfocado al control de calidad de la
cerveza.

PROPIEDADES DE DISTRIBUCION T STUDENT.

 Cada curva t tiene forma de campana con centro en 0.


 Cada curva t, está más dispersa que la curva normal
estándar z.
 A medida que aumenta, la dispersión de la curva
t correspondiente disminuye.
 A medida que , la secuencia de curvas t se
aproxima a la curva normal estándar, por lo que la
curva z recibe a veces el nombre de curva t con gl
=

La distribución t se usa de manera extensa en:

 Problemas que tienen que ver con inferencia acerca de la media de la población o en
problemas que implican muestras comparativas (es decir, en casos donde se trata de
determinar si las medias de dos muestras son significativamente diferentes).
 Aplicación en investigaciones relacionada a la especialidad. Registrar y proyectar
datos del sector turismo en el tiempo.
TABLA DE LA DISTRIBUCION t - Student

La tabla da áreas 1 - a , para valores menores o iguales a t y n g.l, se construyó con Excel.
1–a
n 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
¥ 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576

Es importante resaltar que al ser una distribución simétrica al tener información sobre un
valor positivo, se obtiene el dato para el mismo valor con signo negativo.

Un hecho de relevancia significativa, es que se utiliza para calcular probabilidades con


respecto al promedio, en estos casos, el divisor al estandarizar los valores se divide sobre
S/ Ö n, término que se conoce como el error estándar de la media y mide la variabilidad de
la media entre muestra y muestra. A mayor tamaño de muestra, menor es el error estándar
de la media.

Por último, se puede afirmar, la distribución t es útil para realizar inferencias acerca de la
media poblacional cuando no se conoce s y la población es normal, independiente del n, no
obstante, aún cuando la distribución sea un tanto sesgada, la t sigue siendo apropiada, esto
se conoce como una distribución robusta, es decir, a cambios moderados de los supuestos,
el modelo sigue siendo valido. Como en el caso de la distribución normal, ésta distribución
también usa valores tabulados, tal como se aprecian en la tabla precedente, teniendo en
cuenta, que a medida que los g.l aumenten los valores tienden a ser igual a los encontrados
en la tabla Z.

Ejemplo 1: Los valores de las matriculas de estudiantes en una universidad privada tienen
un comportamiento aproximadamente normal, donde el promedio es de 2.100.000. Se
seleccionan 8 liquidaciones, siendo los valores los siguientes: 1.950.000, 2.100.000,
2.250.000, 1.890.000, 2.250.000, 1.950.000, 2.050.000, 2.350.000. Determine la
probabilidad de que:

· El promedio sea menor de 2.000.000.

· El promedio se encuentre entre 2.000.000 y 2.200.000

· El promedio sea mayor o igual a 2.500.000

Solución manual:

Sea X = Liquidación matriculas.

m = 2.100.000 ; s = ?

=2.098.750 s=168.644.8085 n=8

a) P( <2.000.000)=P( <2.000.000)

P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)

La probabilidad se encuentra entre 0.9 y 0.95, según la tabla T que se encuentra más
adelante, no obstante, al t ser negativo, la probabilidad está entre 0.1 y 0.05, es decir, los
valores complementarios..

Para buscar en la tabla, se tiene en cuenta la fila con 7 g.l y se ubica el 1.677, el cual se
encuentra entre los valores mencionados. De ahí que sea importante utilizar el Excel, que
nos permite calcular la probabilidad exacta.

b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( £ 2.000.000).

Luego de tipificar, se tiene:

P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92


Existe una alta probabilidad de que el promedio de las matriculas se encuentre entre
2.000.000 y 2.200.000.

c) P( >2.500.000)= P(t> 6.70) = 1- P(t< 6.70)= 1-1=0

Dado que el valor de 6.70 es mucho mayor que el ubicado en la tabla de 3.49 y corresponde
a 0.995, es claro, entonces, que para valores mayores de 3.49, la probabilidad será de 1.

Por lo tanto, la probabilidad de que el promedio de matrícula sea superiora a 2.500.000 es


cero.

Solución Excel:

a) P( <2.000.000)=P( <2.000.000)

P(t<(2.000.000-2.100.000)/(168644.8085/2.8284)= P(t<-1.677)

Como se dijo utilizando la tabla, la probabilidad está entre 0.1 y 0.05. La probabilidad exacta
es de 0.0687. Es decir, la probabilidad de que el promedio de matrícula que pagan los
estudiantes sea menor de 2.000.000 es baja.

=DISTR.T(1.677;7;1)= 0.0687

b) P (2.000.000 < < 2.200.000)= P( <2.200.000) ? P( £ 2.000.000).

Luego de tipificar, se tiene:

P(t<3.35) ? P(t<-1.677) = 0.995 ?0.075= 0.92

(1- =DISTR.T(3.35;7;1) - =DISTR.T(1.677;7;1)= ?

(1- 0.006125) ? 0.06872 = 0.9251

Los resultados son similares a los ya presentados. Por la forma de calcular el Excel las
probabilidades, se resta a uno la probabilidad de 3.35, es decir, el programa calcula la cola
de la derecha.

c) P( >2.500.000)= P(t> 6.70) = =DISTR.T(6.7;7;1) = 0.00013

Se observa fácil, que el Excel permite calcular las probabilidades de manera más exactas
que las usadas comúnmente (tablas). Esto es importante tenerlo en cuenta, ya que cuando
se tienen poblaciones muy grandes, esas pequeñas diferencias se convierten en
significativas.

¿QUE SON LOS INTERVALOS DE CONFIANZA ESTADÍSTICOS?

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango


de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del
parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo
construido se denomina nivel de confianza, y se denota 1- . La probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%). Menos frecuentes
son los intervalos con =10% o =1%.

Para construir un intervalo de confianza, se puede comprobar que la distribución Normal


Estándar cumple 1:

P(-1.96 < z < 1.96) = 0.95

(lo anterior se puede comprobar con una tabla de probabilidades o un programa


computacional que calcule probabilidades normales).

Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se


cumple:

Despejando en la ecuación se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo


de confianza al 95% para la media cuando la variable X es normal y es conocido.

INTERVALOS DE CONFIANZA DERIVADOS DE LA DISTRIBUCIÓN T DE STUDENT

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student


consiste en estimar la desviación típica de los datos S y calcular el error estándar de la

media , siendo entonces el intervalo de confianza para la media

= .
Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las
medias de muestras de dos distribuciones normales se distribuye también normalmente, la
distribución t puede usarse para examinar si esa diferencia puede razonablemente
suponerse igual a cero.
para efectos prácticos el valor esperado y la varianza son:
E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3
FÓRMULAS PARA LA ESTIMACIÓN POR INTERVALO DE CONFIANZA

EJEMPLO DE INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN


De una población de media y desviación típica se pueden
tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media ( ).
Se puede demostrar que la media de todas las medias muestrales coincide con la media
poblacional:3
Pero además, si el tamaño de las muestras es lo suficientemente grande,4 la distribución de
medias muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y

una desviación típica dada por la siguiente expresión: . Esto se representa como

sigue: . Si estandarizamos, se sigue que:


En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual
caigan un determinado porcentaje de las observaciones, esto es, es sencillo
hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado .
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el intervalo de confianza donde se
encontrará la media poblacional si sólo se conoce una media muestral ( ), con una
confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por
ciento. A este valor se le llamará (debido a que es el error que se cometerá, un
término opuesto).

Para ello se necesita calcular el punto —o, mejor dicho, su versión


estandarizada o valor crítico— junto con su "opuesto en la distribución" . Estos
puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:
Dicho punto es el número tal que:

Y en la versión estandarizada se cumple que:

Así:

Haciendo operaciones es posible despejar para obtener el intervalo:

De lo cual se obtendrá el intervalo de confianza:

Obsérvese que el intervalo de confianza viene dado por la media muestral ± el producto

del valor crítico por el error estándar .


Si no se conoce y n es grande (habitualmente se toma n ≥ 30):5

, donde s es la desviación típica de una muestra.


Aproximaciones para el valor para los niveles de confianza estándar son 1,96
para y 2,576 para .6
Inicio de la distribución T student.
Propiedades.
Tabla de distribución T student.
Ejemplo de distribución T student en Excel
Importancia de la distribución T studen en la simulación
Software´s que simulan la distribución T studen.
¿Que son los intervalos de confianza estadísticos?
Formulas del intervalo de confianza
Aplicación en la vida real y en simulación
Ejemplo de intervalos de confianza en Excel

You might also like