You are on page 1of 14

MATERIA:

ESTADISTICA INFERENCIAL I

UNIDAD 1:
INFERENCIA ESTADISTICA: ESTIMACION

PRESENTA:
MA. SABINA MARTINEZ GONZALEZ

CATEDRATICO:
RAUL JIMENEZ SALINAS

MODALIDAD ABIERTA:
ING. EN GESTION EMPRESARIAL

SEMESTRE: 4 GRUPO: NICO



SAN PEDRO COMITANCILLO, OAXACA. A 2 MARZO DEL 2013.


2. INFERENCIA ESTADSTICA
2.1 CONCEPTOS BSICOS
Ms especialmente, podemos decir que la inferencia estadstica consiste en el proceso
de seleccin y utilizacin de un estadstico muestral, mediante el cual, utilizando la
informacin que nos proporciona una muestra aleatoria, nos permite sacar
conclusiones sobre caractersticas poblacionales. Es decir, supngase que se tiene
una poblacin, la cual se representa por su funcin de distribucin y el parmetro
poblacional se denota por , que toma valores dentro del espacio paramtrico , el
parmetro puede ser cualquiera, por ejemplo, la media , la varianza 2 , o la
proporcione poblacional . Seleccionamos una funcin de las variables aleatorias
maestrales X1, X2, ..., Xn, que la denotaremos por = g(X1, X2, ..., Xn) y la
utilizaremos para obtener la inferencia sobre el valor del parmetro .

Las inferencias sobre el valor de un parmetro poblacional se pueden
obtener bsicamente de dos maneras: a partir de estimacin o bien a partir
de la prueba de hiptesis.
En la estimacin, basta seleccionar un estadstico muestral cuyo valor se utilizara
como estimador del valor del parmetro poblacional.
En la prueba de hiptesis, se hace una hiptesis sobre el valor del parametro y
se utiliza la informacin proporcionada por la muestra.

2.2 DISTRIBUCIONES DE MUESTREO
El Muestreo es el Proceso de seleccin de muestras, se utiliza cuando no es
posible contar o medir todos los elementos de la poblacin objeto de estudio
Existen dos mtodos para seleccionar muestras de poblaciones entre estos estn
el Muestreo no aleatorio o de juicio Se emplea el conocimiento y la opinin
personal para identificar aquellos elementos de la poblacin que deben incluirse
en la muestra, el Muestreo aleatorio o de probabilidad es en el cual todos los
elementos de la poblacin tienen la oportunidad de ser escogidos para la muestra
Dentro de este tipo de muestreo se encuentran Muestreo aleatorio simple el cual
es un mtodo de seleccin de muestras que permite que cada muestra posible
pueda ser elegida con la misma probabilidad Por su parte cada elemento de la
poblacin tiene la misma oportunidad igual de ser incluido en la muestra, Muestreo
sistemtico mtodo en el cual los elementos que se muestrearn se seleccionan
de la poblacin en un intervalo uniforme que se mide con respecto al tiempo, al
orden o al espacio, Muestreo estratificado, mtodo en el que la poblacin se
divide en grupos homogneos o estratos y despus se toma una muestra aleatoria
simple de cada estrato, Aqu la variabilidad dentro de cada grupo es pequea y
entre los grupos es grande, Muestreo de racimo mtodo en el que la poblacin se
divide en grupos o racimos de elementos, y luego se selecciona una muestra
aleatoria de estos racimos. La variabilidad dentro de cada grupo es grande y entre
los grupos es pequea; es como si cada racimo fuese un pequea representacin
de la poblacin en si mima de la distribucin muestral que realiza una lista de
todos los valores posibles de un estadstico y la probabilidad asociada a cada
valor. Se considerarn la distribucin muestral de medias y la de proporciones. en
estos experimentos pueden existir error muestral que hace la diferencia entre el
parmetro de la poblacin y el estadstico de la muestra utilizado para estimar el
parmetro.

Cada muestra de tamao n que podemos extraer de una poblacin proporciona
una media. Si consideramos cada una de estas medias como valores de una
variable aleatoria podemos estudiar su distribucin que llamaremos distribucin
muestral de medias.

Si tenemos una poblacin normal N y extraemos de ella muestras de tamao n, la
distribucin muestral de medias sigue tambin una distribucin normal. Si la
poblacin no sigue una distribucin normal pero n>30, aplicando el llamado
Teorema central del limite la distribucin muestral de medias se aproxima tambin
a la normal anterior. Consideremos todas las posibles muestras de tamao n en
una poblacin. Para cada muestra podemos calcular un estadstico (media y la
desviacin tpica, proporcin) que variar de una a otra. As obtenemos una
distribucin del estadstico que se llama distribucin muestral.
Las dos medidas fundamentales de esta distribucin son la media y la desviacin
tpica, tambin denominada error tpico. Hay que hacer notar que si el tamao de
la muestra es lo suficientemente grande las distribuciones mustrales son
normales y en esto se basarn todos los resultados que alcancemos. El teorema
de central del lmite dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribucin (cualesquiera
que ste sea), la suma de ellas se distribuye segn una distribucin normal.

El teorema del lmite central o teorema central del lmite indica que, en condiciones
muy generales, si Sn es la suma de n variables aleatorias independientes,
entonces la funcin de distribucin de Sn se aproxima bien a una distribucin
normal (tambin llamada distribucin gaussiana, curva de Gauss o campana de
Gauss). As pues, el teorema asegura que esto ocurre cuando la suma de estas
variables aleatorias e independientes es lo suficientemente grande.


2.3 ESTIMACIN PUNTUAL
Una estimacin es puntual cuando se usa un solo valor extrado de la muestra
para estimar el parmetro desconocido de la poblacin. Al valor usado se le
llama estimador.
La media de la poblacin se puede estimar puntualmente mediante la media de
la muestra:
La proporcin de la poblacin se puede estimar puntualmente mediante la
proporcin de la muestra:
La desviacin tpica de la poblacin se puede estimar puntualmente mediante la
desviacin tpica de la muestra, aunque hay mejores estimadores:

2.4 ESTIMACIN DE INTERVALOS
Con la estimacin puntual se estima el valor del parmetro poblacional
desconocido, a partir de una muestra. Para cada muestra se tendr un valor que
estima el parmetro. Esta estimacin no es muy til si desconocemos el grado de
aproximacin de la estimacin al parmetro. Es deseable conocer un mtodo que
nos permita saber dnde se encuentra el parmetro con un cierto grado de
certeza. Este mtodo va a ser la determinacin de un intervalo donde estar el
parmetro con un nivel de confianza.

El intervalo se construye a partir de una muestra, entonces, para cada muestra se
tendr un intervalo distinto. Llamaremos a al error que se permite al dar el
intervalo y el nivel de confianza ser 1-. Un intervalo tiene un nivel de confianza 1-
cuando el 100 (1-)% de los intervalos que se construyen para el parmetro lo
contienen.

Es deseable para un intervalo de confianza que tenga la menor amplitud posible,
esta amplitud depender de:
El tamao de la muestra, mientras mayor sea el tamao mejor ser la estimacin,
aunque se incurre en un aumento de costes.

2.5 INTERVALO DE CONFIANZA PARA LA MEDIA

En la realidad, normalmente no se conoce cmo es una poblacin ( se conoce
o
,
pero no se conoce

). Sin embargo, se puede estudiar una muestra de esa


poblacin y del conocimiento de la muestra sacar conclusiones sobre la
poblacin.

Si de una poblacin se conoce su desviacin tpica
o
y buscamos un intervalo en
el que est la media

con un nivel de confianza del


( ) o 1
%, el intervalo es:
|
|
.
|

\
|

n
z X
n
z X
o o
o o
2 2
,
Siempre que la poblacin de partida sea Normal o el
tamao de la muestra
. 30 > n


Error mximo admisible:
Error =
n
z
o
o

2


Ejemplo: Si conocemos que la desviacin tpica para la altura de las chicas de 18
aos en Aragn es 10 cm. Supongamos que hemos tomado una muestra de 100
chicas sale que la altura media de la muestra:
X
=170.
a) Hallar los intervalos de confianza para la altura media de las chicas de
18 aos en Aragn para un nivel de confianza del 90%, 95% y 99% y el
error mximo en cada caso:

Nivel de conf.del 90%:
645 , 1
100
10
170 (
,
) 645 , 1
100
10
170 +
= (168,355 , 171,645)

100
10
645 , 1 = Error
= 1,645
Nivel de conf.del 95%:
96 , 1
100
10
170 (
,
) 96 , 1
100
10
170 +
= (168,04, 171,96)

100
10
96 , 1 = Error
= 1,96

Nivel de conf.del 99%:
575 , 2
100
10
170 (
,
) 575 , 2
100
10
170 +
= (167,425 ,
172,575)

100
10
575 , 2 = Error
= 2,575

b) Para un nivel de confianza del 95% Cul debe ser el tamao de la
muestra para que el error mximo admisible sea menor que 1 cm.?

1
10
96 , 1 < =
n
Error
, despejado n queda: 19,6<
n

2
) 6 , 19 ( > n

16 , 384 > n
es
decir, el tamao de la muestra debe ser 385 o ms.


2.6 INTERVALOS DE CONFIANZA PARA DIFERENCIA ENTRE MEDIAS

Intervalo de confianza para la media de una poblacin
De una poblacin de media y desviacin tpica se pueden tomar muestras de n
elementos. Cada una de estas muestras tiene a su vez una media (). Se puede
demostrar que la media de todas las medias mustrales coincide con la media
poblacional:

Pero adems, si el tamao de las muestras es lo suficientemente grande,3 la
distribucin de medias maestrales es, prcticamente, una distribucin normal (o
gaussiana) con media y una desviacin tpica dada por la siguiente expresin: .
Esto se representa como sigue: Si estandarizamos, se sigue que:
En una distribucin Z ~ N (0, 1) puede calcularse fcilmente un intervalo dentro del
cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo
hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje
deseado (vase el uso de las tablas en una distribucin normal).
Se desea obtener una expresin tal que
En esta distribucin normal de medias se puede calcular el intervalo de confianza
donde se encontrar la media poblacional si slo se conoce una media muestral (),
con una confianza determinada. Habitualmente se manejan valores de confianza
del 95 y del 99 por ciento. A este valor se le llamar 1 (debido a que es el
error que se cometer, un trmino opuesto).
Para ello se necesita calcular el punto X / 2 o, mejor dicho, su versin
estandarizada Z / 2 junto con su "opuesto en la distribucin" X / 2. Estos
puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente
imagen:

Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:
z / 2 = z / 2
As:

Haciendo operaciones es posible despejar para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Si no se conoce y n es grande (habitualmente se toma n 30):4
, donde s es la desviacin tpica de una muestra.
Aproximaciones para el valor z / 2 para los niveles de confianza estndar son
1,96 para 1 = 95% y 2,576 para 1 = 99%.

2.7 INTERVALOS DE CONFIANZA PARA PROPORCIONES.
Se le llama intervalo de confianza a un par o varios pares de nmeros entre los
cuales se estima que estar cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que
se calcula a partir de datos de una muestra, y el valor desconocido es un
parmetro poblacional. La probabilidad de xito en la estimacin se representa
con 1 - y se denomina nivel de confianza. En estas circunstancias, es el
llamado error aleatorio o nivel de significacin, esto es, una medida de las
posibilidades de fallar en la estimacin mediante tal intervalo.[1]
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma
que un intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de
confianza), mientras que para un intervalo ms pequeo, que ofrece una
estimacin ms precisa, aumentan sus posibilidades de error.
Para la construccin de un determinado intervalo de confianza es necesario
conocer la distribucin terica que sigue el parmetro a estimar, . Es habitual que
el parmetro presente una distribucin normal. Tambin pueden construirse
intervalos de confianza con la desigualdad de Chebyshev.
En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un
parmetro poblacional que sigue una determinada distribucin de probabilidad,
es una expresin del tipo [1, 2] tal que P[1 2] = 1 - , donde P es la
funcin de distribucin de probabilidad de .

2.8 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE
PROPORCIONES
Los lmites para el intervalo de una diferencia de proporciones correspondientes a
dos muestras independientes son:

Donde el smbolo z
/2
es el mismo valor crtico que antes, prob(Z > z
/2
) = /2, y
corresponde a un intervalo de confianza 1 %.
Este intervalo puede utilizarse de manera alternativa al contraste de hiptesis para
decidir (con nivel de significacin %) si hay igualdad de los dos grupos. Se
decidir por la igualdad de los grupos si el valor 0 queda incluido en cualquier
posicin en el intervalo.
Aunque se haga el contraste de dos proporciones, en primer lugar, es aconsejable
obtener el intervalo de confianza de la diferencia de medias, si ste ha resultado
significativo, puesto que ayudar a interpretar si existe significacin aplicada
adems de la estadstica.
Si se dispone de alguna informacin previa y slo quiere calcularse alguno de los
dos intervalos unilaterales, bastar sustituir z
/2
por z

y descartar el lmite superior
o inferior del intervalo segn el caso. Por ejemplo, el intervalo unilateral derecho
corresponde a:



2.9 INTERVALOS DE CONFIANZA PARA VARIANZA
De una poblacin con distribucin normal con media m y varianza s 2 se
obtiene una muestra aleatoria de tamao n. Para obtener el intervalo de
confianza para la varianza ( s 2 ) se parte de la expresin (1.4):

Se divide por ns
2
:

Se invierte:

Reescribiendo:
(2.6)
Donde y pertenecen a una distribucin chi-cuadrado con (n-1) grado
de libertad, por lo tanto, y son diferentes y < .
Ejemplo
La varianza de la resistencia a la rotura de 30 cables probados fue de
32.000 lbs
2
. Halle un intervalo de confianza del 90 por ciento, para la
varianza de la resistencia de todos los cables de sta marca.
Solucin. Se utiliza la expresin 2.6. Los valores de y pertenecen a
una distribucin chi-cuadrado con 29 grados de libertad. como puede
observarse en la figura 2.3 el rea que hay por debajo de Z a /2 es 0,05,
por lo tanto =17,71 y el rea que hay por debajo de es 0,95, por lo
tanto =42,56

Figura 2.3 Percentiles de la distribucin chi-cuadrado
Reemplazando en la expresin 2.6 se obtiene:

Por razones de utilidad se halla el intervalo de confianza para la desviacin
estndar, sacando la raz cuadrada de los lmites, por lo tanto:

Interpretacin. El promedio de variacin o de dispersin de la rotura de los
cables de dicha marca, est entre 150 y 233 lbs . Con una confiabilidad del
90 por ciento.
2.10 INTERVALOS DE CONFIANZA PARA RAZONES DE DOS VARIANZAS

Cuando se desea hacer inferencias acerca de las varianzas de dos poblaciones,
es necesario colocarlas en forma de razn. Si las varianzas son iguales, entonces
el cociente es igual a 1, en caso de que sean diferentes, su cociente tambin se
alejar de 1. Como por lo general no se conocen las varianzas de las poblaciones
de inters, cualquier comparacin que se desee, tendr que estar basada en las
varianzas muestrales y , las cuales debern ser de muestras independientes
y extradas de poblaciones normales.

Entonces, es un estimador insesgado de y tendr una distribucin
con n
1
1 grados de libertad.
2
1
s
2
2
s
2
1
s
2
1
o
2
1
2
1 1
) 1 (
o
s n
2
_

De manera similar ser un estimador de y tendr una distribucin
con n
2
1 grados de libertad.
La razn de estos dos estimadores: sigue una distribucin F de Fisher, o
simplemente distribucin F que posee las siguientes propiedades:
1. 1. La distribucin F depende de dos valores de grados de libertad, uno
correspondiente al numerador y otro al denominador, a los cuales nos
referiremos como grados de libertad del numerador (gl
num
= v
1
= n
1
1) y
grados de libertad del denominador (gl
den
= v
2
= n
2
1).
2. 2. La densidad de la variable F viene dada por:

3. 3. La distribucin F para cada par de valores de grados de libertad v
1
y v
2
.
4. 4. Hay una distribucin F para cada par de valores de grados de libertad.
5. 5. Como la distribucin , una distribucin F es positivamente asimtrica, pero
su asimetra se reduce con los aumentos de los grados de libertad.
6. 6. Si X tiene densidad , entonces tendr una distribucin , esto
es

7. 7. La distribucin muestral usada para hacer inferencias entre dos varianzas es
la F de Fisher:
2
2
s
2
2
o
2
2
2
2 2
) 1 (
o
s n
2
_
F
s
s
=
2
2
2
2
2
1
2
1
o
o
2
2
1
2
2
2
1
2 1
2 1
2 1
1
1
1
1
2 2
2
) (
v v
v
v
v v
v
v v
v v
+

|
.
|

\
|

(

+
|
|
.
|

\
|
(
(
(
(

|
.
|

\
|
I |
.
|

\
|
I
|
.
|

\
| +
I
=
F
F F f
2
_
2 1
,v v
F
X
Y
1
=
1 2
,v v
F
1 2
2 1
, ,
2
1
, ,
2
1
v v
o
v v
o

=
F
F

con n
1
1 y n
2
1 grados de libertad en el numerador y denominador,
respectivamente.



El intervalo de confianza para el cociente de varianzas est dado por:


Despejando se tiene:


NOTA: El valor de cola izquierda de la distribucin F de Fisher est dado por:
, donde v
1
= n
1
1 y v
2
= n
2
1



Ejemplo 14: Las siguientes son las calificaciones obtenidas en un examen de
personalidad por 2 muestras de 9 mujeres casadas y 9 mujeres solteras:

Solteras 88 68 77 82 63 80 78 71 72
F
s
s
s
s
s
s R
= = =
1
2
1
2
2
2
2
2
1
2
2
2 1
2
2
2
1
2
2
2
0
o
o
o
o
F F F
o o / / 2 1 2
< <

F
s
s
F
o o
o
o
/ /
/
/
2
1
2
1
2
2
2
2
2 1 2
< <

2
2
2
1
/ o o
s
s F
s
s F
1
2
2
2
1 2
1
2
2
2
1
2
2
2
2
< <
o o
o
o
/ /
F
F
o v v
o v v
/ , ,
/ . ,
2
1 2
1 2
2 1
1
=

Casadas 73 77 67 74 74 64 71 71 72

Suponiendo que estos datos se pueden considerar como muestras aleatorias
independientes tomadas de dos poblaciones normales, pruebe la hiptesis de que
la varianza de las calificaciones de las mujeres solteras es diferente de la varianza
de las calificaciones de las mujeres casadas con o = 0.05.

1) Se supone que las muestras son aleatorias independientes y extradas de
poblaciones normalmente distribuidas.

2) H
0
:
H
a
:

3) o = 0.05
4) Estadstico de contraste


5) Valores crticos: , (tabla T-7)

1
2
2
2
1 2
2
2
1
= =
o
o
o o
1
2
2
2
1 2
2
2
1
= =
o
o
o o
F
s
s R
=
1
2
2
2
0
F
0 025 8 8
023
. , ,
. = 43 . 4
8 , 8 , 975 . 0
= F

6) Valor calculado de F
c
= 3.8636 ya que

7) Como 0.23 < 3.8636 < 4.43, No se rechaza H
0
.

8) Las varianzas de las calificaciones de las solteras y de las casadas no son
significativamente diferentes.





s y s
1
2
2
2
59 027 1527 = = . .

You might also like