Estadística Inferencial

Estadstica Inferencial
El presente documento es una gua para el curso de inferencia
estadstica impartido en el Instituto Nacional de Estadstica
Geografa e Informtica (INEGI), en el edificio de capacitacin;
y no tiene ms que esa finalidad. La seccin de ejercicios ser
presentada por el instructor de acuerdo a su preferencia,
adems de agregar los temas que l considere pertinentes.
La parte inicial es una ubicacin terica que presenta algunos
de los conceptos ms importantes y resultados que sern
utilizados en la parte formal. En ningn momento deber
seguirse al pie de la letra la secuencia de exposicin, el
instructor tomar la secuencia que considere trascendental en
su imparticin.
La segunda parte es todo el curso que se debe impartir, y se
tocan los temas pero desde un punto de vista ms informal, y
el tema de estimacin ya nada ms se revisa en su formalidad
detallada en la primera parte.
La razn de la estructura de este documento es que
normalmente la persona que lo elabor1, imparte la parte terica
para generalizar el objetivo y la ubicacin de la inferencia
estadstica y resultados importantes que sern formalmente
utilizados por aquellos interesados en la formulacin
estadstica- matemtica.
Ernesto Cervantes Lpez, INEGI
PARTE UNO
El objetivo de la estadstica es hacer inferencia con respecto a
la poblacin basndose en la informacin contenida en una
muestra.
Las poblaciones se describen mediante medidas numricas
denominadas parmetros y el objetivo de la mayora de las
investigaciones estadsticas es hacer inferencia con respecto a
uno o ms parmetros de la poblacin.
El proceso de obtener un resultado observado de un fenmeno
fsico es denominado un experimento.
Suponga que el resultado de un experimento es una variable
aleatoria x, y )
f (representa
x,
la funcin de densidad la cual
refleja la distribucin de las medidas de los individuos en la
poblacin.
Aunque el experimento no permite especificar completamente a
f (, xy, esto
) es posible si se puede asumir que )
f (es
x, un
miembro de alguna familia conocida de distribucin y que es

un parmetro no conocido tal como la media o la varianza de la
poblacin. El objetivo de la estimacin puntual es asignar un
valor apropiado a
basado sobre las observaciones de la
poblacin, es decir, se asume que un conjunto de n variables
independientes n
un conjunto de datos n
como
f (=x1 , x2 ,..., xn : )
x1,,...,
x con )
f (observada
x,
de
2xcada una
x1,,...,
2xel cualxpuede representarse
f (x1 , ) f ( x2 , )... f ( xn , )
Se asume que la distribucin de la poblacin de inters puede

ser representada por un miembro de alguna familia especifica
conocida )
f ,( xindexada
,
por el parmetro . En algunos
casos el parmetro puede ser un vector y se denota por T .
Se denotara por como el espacio paramtrico que denota el
conjunto de todos los posibles valores que el parmetro
puede asumir. Si T es un vector entonces ser un
subconjunto del espacio euclidiano de la misma dimensin y la
dimensin de va a corresponder al nmero de par metros
reales no conocidos.
Se asume que n
x ,,...,
x aleatoria de )
2x muestra
1 es
una
f (yx,
que )t (es una funcin de .
Definicin
Un estadstico
) T es (usada
= que
para
x estimar el
2x1 n, x ...
valor det es
) (denominado un estimador de )t y un valor(
observado de el estadstico ) t = es
, x ,..., x
(x
2 1denominado
n
una estimacin de ) t .(
Equivalentemente se puede abusar y decir que un estimador

es
una regla que establece cmo calcular una estimacin basada
en las mediciones contenidas en una muestra.
Es posible obtener varios estimadores (reglas para la
estimacin) diferentes para un mismo parmetro poblacional.
Esto nos lleva a tratar de definir cuales son buenos o malos
en
Definicin.
la aproximacin.
g Sea
una )funcin
,...,las
Y variables aleatorias
(Y
21 n, Y de
Y ,,...,
2Y
Yn
1 que tienen una funcin de probabilidad

Para ello debemos
recordar
algunos
tericos
que
se
p(.2yEntonces
, y ,..., yel) valor
esperadoconceptos
de )
g( Y
Y
Y
2es,,...,
utilizaran.
1n
1n
E ( g (Y1 , Y2 ,..., Yn )) =
...
yyyy
nn
g( y1 , y2 ,..., yn ) p( y1 , y 2,...,y)n
- 1 21
Y ,,...,
Y
2Y continuas
1 son variables aleatorias
con la funcin
Si n
de densidad conjunta )
f ( entonces
2y1 n, y ,..., y
E ( g (Y1 , Y2 ,..., Yn )) =
...
y ny nyy- 121
g (y1 , y2 ,..., yn ) f ( y1 , y2 ,...,dy

ydy
...
)
n 21n-1n
Teorema
Sea c una constante entonces c
E(=)
c
Teorema
Sean )g (una
Y
21 ,Y
funcin de las variables aleatorias 2
sea c una constante. Entonces
E (=
cg (Y1 ,YY2 ))
Y1,,Yy
cE( g (Y1 , 2 ))
Teorema
Y1 dos
, Y variables aleatorias con la funcin de densidad
conjunta ) f ( y2y1sea
,y
g1 (Y1 , Y2 ), g 2 (Y1 , Y2 )...g k(Yfunciones
, Y2 )
1
Sea 2
de 2 Y1. , Entonces
Y
E ( g1 (Y1 , Y2 ) + g 2 (Y1 , Y2 ) + ... + g k (Y1 , Y2 )) =

E ( g1 (Y1 , Y2 )) + E ( g2 (Y1 ,Y2 )) + ... + E( g k (Y1 , Y2 ))
Propiedades de los estimadores

Estimador Insesgado
Definicin
Un estimador T es un estimador insesgado de )
t (s
t
E (Tpara
) = todo
( )
, de otra manera se dice que T es
un estimador sesgado de ) t .(
Ejemplo
Considere una muestra aleatoria de una distribucin )
f (, xT,
con )T , donde
= ( 2, s y 2
s son la media y la varianza de la
poblacin.
Ahora bien la media muestral es un estadstico con la funcin
t ( x1 , x2 ,..., xn ) = (x1 + x2 + ... +x n ) /n y este estadstico
xi
que se usa como una
n
i=1
estimacin de la media poblacional ) , para
= E (x
X1,...,
n
, 2X
variables aleatorias, y la funcin
usualmente se denota con-x= n
t ( x1 , x2 ,..., xn ) = (( x1 - x)+ (x 2 - x)+ ... + ( x n - x)) / n - 1
n
Permite obtener 1 S2 -=
ambos y 2
(x1 - x )
i=1como estimador de 2
s,y
s.
Ejercicio: Verificar que son insesgados.

-)
1.
E( x =
s2 ) =
2. 2 E ( S
Despus de verificar la afirmacin se tiene que los parmetros
son insesgados , el espacio paramtrico asociado es un
subconjunto de dos dimensiones del espacio euclidiano. En
particular es el producto cartesiano )
y 2s
x =, para
(-8
8 , 8 ) (0 ,
En pocas palabras nos gustara que la media del valor

esperado de la distribucin de las estimaciones fuera igual al
punto estimado, es decir,
E ( =)
Definicin
El sesgo B de un estimador puntual est dado por
B .= )E( -
(a)
(b)
La adecuada sera (b) ya que una menor varianza garantiza que

en el muestreo repetitivo una mayor fraccin de valores de
quede cerca de , es decir que la varianza )
V sea mnima.
(
Dados dos estimadores insesgados de un parmetro
seleccionamos el estimador con la menor varianza,
permaneciendo constante en todas las condiciones restantes.
Algo que se utiliza en lugar del sesgo y la varianza para
describir la bondad de un estimador puntual es el valor
esperado de 2
( - . )
Definicin
Sea n
X 1,...,
X aleatoria de tamao n de
, 2X
una muestra
x; estimador
)
f .(Un
*
T de ) t (es denominado un estimador

insesgado uniforme de mnima varianza de )
t (s
1. *T es insesgado para ) t (
2. Para cualquier otro estimador insesgado T de )
t ,(
Var (=T* Tpara
) Var
todo
( )
En algunos casos la cota inferior puede ser derivada de la
varianza de un estimador insesgado. Si T es un estimador
insesgado de )
t ,( entonces la cota inferior Cramer- Rao
basada sobre una muestra aleatoria es
(t (' ))
Var ( T
2 ) = asumiendo la condicin de
nE ( ln f ( x; ))
diferenciabilidad, se puede obtener dicha expresin.

Definicin
La media del cuadrado del error de un estimador puntual y se
define como el valor esperado de 2
( - , es decir,
)
La media del cuadrado del error de un estimador , )
E (. -
MCE ( es
una funcin al mismo tiempo de su varianza y sesgo

2
) = V ( )
MCE (+B
Enseguida se muestran algunos estimadores de parmetros

poblacionales.
Parmetro
objetivo
Tamao de La(s)
muestra(s)
Estimador
puntual
Es( 2)
n
pn
-1 1
p1- p 1 2
Y
p =p
n
2
Y 1- Y2
p1-p 2
pq
n
2
s -+
11sn2
n 12
qpn212
pp-1+
p
n 12
2
s son las
de2 las poblaciones 1 y 2
s 1varianzas
y
2
respectivamente.
La manera de evaluar la bondad de cualquier procedimiento de
estimacin puntual estriba en trminos de la distancia entre las
estimaciones generadoras y el parmetro objetivo.
Definicin
El error de estimacin e es la distancia entre un estimador y
su parmetro objetivo, es decir, |
e -=| .
Eficiencia relativa
Definicin
Dados dos estimadores insesgados 1
, con varianzas V( 1
, de un parmetro
), respectivamente, entonces la
con respecto de 2
se define como la
) y V( 2
eficiencia relativa de 1
razn eficiencia = )
V (. )
V( 1
2
Consistencia
Definicin
es un estimador consistente de si para
cualquier nmero positivo e se tiene que
lim =P(| on -
El estimador n
en forma equivalente
lim =P(| n -
|= e)
|= e)
Suele utilizar el siguiente resultado para probar la consistencia

de un estimador
Teorema
El estimador insesgado n
para es un estimador consistente
de s 0 lim =V( )
n n8
Suficiencia
En seguida se presentan algunos mtodos para encontrar
estadsticos que en cierto sentido resumen toda la informacin
en una muestra con respecto a un parmetr o objetivo, y tales
estadsticos tienen la propiedad de la suficiencia.
Definicin
y1,,...,
y
2yobservaciones
muestrales para las variables
Y1,,...,
Y
Y
aleatorias correspondientes n
.2Entonces si n
son variables aleatorias discretas, la verosimilitud (factibilidad)
de la muestra, )
y1,,...,
L=
se
y( 2ydefine
,...,
como
y variables
Y
la probabilidad
1,,...,
son
aleatorias
conjunta de n
.2y
Si
n L
2Y
1 n, y Y
Sean n
10
Y1,,...,
Y
2
continuas, la verosimilitud ) L ( se
y ,..., ycomo la
2y1 n,define
y1,,...,
y
densidad conjunta evaluada en n
.2y
El siguiente teorema relaciona la propiedad de suficiencia

con la
verosimilitud.
Teorema
Sea U un estadstico basado en una muestra aleatoria
Y ,,...,
Yn
2Y estadstico
1 . Entonces U es
un
suficiente para la
estimacin de un parmetro si y slo si la verosimilitud L se
puede factorizar en dos funciones no negativas
L ( y1 , y2 ,..., yn ) = g (u , )h( y1 , y2 ,..., yn ) en donde
g es) una
(u ,
funcin solamente de u y , y h) no es
, y ,...,
funcin
y
( 2y1una
n
de .
En general se desea encontrar un estadstico suficiente que
reduzca los datos en la muestra hasta donde sea posible. Los
estadsticos que cumplen con se objetivo se denominan
estadsticos de mnima suficiencia.
Suficien cia mnima y estimacin in sesgada de mnima
varianza
Tales estadsticos fueron desarrollados por Lehmann y Scheff.
Suponga que n
Y ,,...,
Y
2Y
1 representa una muestra aleatoria de
una funcin de probabilidad

p , o una funcin
) de
( ydensidad
f(y) con un parmetro desconocido . El conjunto de variables
Y ,,...,
Yvalores,
2Y
1 puede tomar
varios
supongamos que
n
yn
x ,...,
x
,,...,
2yy ndos conjuntos
, 2xde valores
1y1son
posibles,
el mtodo utiliza la razn de verosimilitudes evaluadas en esto

(x , x 2es
,...,posible
xn ) encontrar
1 . VariasLveces
dos puntos
L( y1 , y2 ,..., yn )n
una funcin
g tal) que
x ,...,
razn
x mencionada no
( 2x1 n,la
presente el parmetro desconocido s y slo s
g(=x1 ,. xSi
,...,
se puede
xn )y gencontrar
( y1 , y2 ,..., taln )funcin
2
g, entonces ) g ( Y
,Y
un,...,
estadstico
Y
de mnima
2es
1n
suficiencia para .
11
Mtodo de los momentos
Ya que el mtodo de anterior no siempre es aplicable, el
siguiente mtodo es uno de los ms antiguos, aunque el ms
sofisticado el de mxima verosimilitud.
Para ello recuerde que el k-simo momento de una variable
aleatoria, tomando con respecto al origen, es )
' k,k Yel= E (

correspondiente k-simo momento de la muestra es el
promediom'k 1Y=.n
n i= 1
Mtodo de los momentos: Elija estimaciones aquellos valores

de los parmetros que son soluciones de las ecuaciones
'
' k, m
con
= k=1,2,...,t
en donde t es igual al nmero de
k
parmetros.
Mtodo de la mxima verosimilitud.

El mtodo implica determinar alguna funcin de un estadstico
de mnima suficiencia que sea un estimador insesgado del
parmetro objetivo. El mtodo de los momentos generalmente
no lleva a mejores estimadores, contrario al de mxima
verosimilitud.
Mtodo de la mxima verosimilitud: Escoja como
estimaciones aquellos valores de los parmetros que
maximizan la verosimilitud.
12
PARTE DOS
1. Introduccin
Todas las herramientas estadsticas con las que se cuenta
hasta ahora, tales como tablas, grficos y clculo de medidas
descriptivas se podran englobar en el trmino Estadstica
Descriptiva, puesto que ellas esencialmente permiten describir,
presentar y resumir informacin que ha sido recolectada de
alguna forma.
Sin embargo las tcnicas de la Estadstica Descriptiva no
permiten responder interrogantes que pueden surgir cuando no
se dispone de la informacin sobre todos los individuos de la
poblacin de inters sino slo de una parte de ella, es decir,
que los datos provienen de una muestra de individuos de la
poblacin bajo estudio. Ejemplos de esta situacin son:
Si se conoce que la ganancia promedio de ventas de
una muestra de 50 automviles nuevos es de $935,

qu se puede decir sobre la ganancia media de
todas las ventas de automviles nuevos?
Si se encontr que una curso de capacitacin ayuda a
encontrar trabajo a 16 de 20 jvenes de una ciudad,

qu porcentaje de todos los jvenes que buscan
trabajo se puede esperar que encuentren trabajo
despus de tomar el curso?
Para responder este tipo de preguntas la Estadstica dispone de
una gran cantidad de mtodos que se engloban dentro de la
llamada Estadstica Inferencial, los cuales se usan
esencialmente para determinar la probabilidad de que una
conclusin sacada a partir de los datos de una muestra sea
cierta en la poblacin muestreada.
Las poblaciones pueden ser ventas, personal de una empresa,
consumidores de un producto, etc.
El proceso conocido como inferencia estadstica, requiere
consideraciones de cmo fue seleccionada la muestra y cunto
varan las observaciones de una muestra a otra. De esta
manera, los mtodos de seleccin de los individuos que se
usarn en la investigacin son de considerable importancia para
la obtencin de resultados y conclusiones vlidas.
El requisito fundamental
de unaque
buena
muestra
es que sea
representativa
de la poblacin
se trata
de describir
13
(Poblacin Objetivo Figura 1). Hay, por supuesto muchas
formas de obtener una muestra no representativa. Una obvia
falta de representatividad ocurre cuando la muestra se toma de
la poblacin equivocada. Por ejemplo, se quiere conocer la
proporcin de personas que consumen un determinado
producto y la muestra se obtiene de los clientes de un solo
supermercado.
An cuando se est seguro que la muestra se obtiene de la
apropiada poblacin, otra fuente potencial de error en el
muestreo, especialmente en las encuestas de opinin son las
respuestas sesgadas. Cuestionarios mal redactados o
tcnicas de entrevistas inadecuadas pueden dar lugar a
respuestas que no reflejan la realidad que se quiere evaluar.
Por otra parte, en muchas ocasiones no es posible obtener la
muestra a partir de todos los individuos que definen la poblacin
objetivo, sino slo a partir de una subpoblacin que es
accesible al investigador en el momento de hacer la seleccin
de los individuos de la muestra y ella recibe el nombre de
poblacin muestreada (Figura 1).
Poblacin objetivo
Se requiere sentido comn para

hacer inferencias del muestreo a
la poblacin objetivo
Poblacin muestreada
Para hacer inferencias estadsticas
de la muestra a la poblacin
muestreada se requiere que la
muestra sea aleatoria
Muestra
Figura 1: Alcances de las inferencias

realizadas de una muestra.
Consideremos, por ejemplo, un sondeo telefnico que realiz la
cadena de televisin ABC inmediatamente antes de las
14
elecciones de 1980 entre Carter y Reagan. La ABC invit a sus
televidentes a llamar (por larga distancia) para dar a conocer
sus preferencias presidenciales. En vez de lograr una muestra
del sentir real de los electores, la ABC obtuvo una muestra de
las preferencias de los votantes que estaban suficientemente
interesados en desviar el resultado del sondeo como para
invertir en las llamadas telefnicas de larga distancia. Es claro
que la ABC no realiz un muestreo aleatorio de la poblacin de
posibles votantes. Ms demcratas hicieron las llamadas de
larga distancia, y la ABC pronostic as una victoria electoral de
Carter. Antes de extender cualquier conclusin, es necesario
evaluar qu factores selectivos y sesgos distinguen a la
poblacin realmente muestreada (todos los votantes que
hicieron las llamadas de larga distancia) de la poblacin objetivo
(todos los posibles votantes).
Los mtodos de la Inferencia Estadstica permiten generalizar
los resultados de la muestra slo a los individuos que
componen la poblacin muestreada y la generalizacin hacia la
poblacin objetivo est fuera del alcance de la Estadstica. Sin
embargo, si es posible suponer que la poblacin muestreada es
similar a la poblacin objetivo no se cometera un error grande
en generalizar los resultados hacia la poblacin objetivo.
An cuando se est seguro que la muestra se obtiene de la
poblacin apropiada, es igualmente importante que la muestra
se saque de una manera objetiva e insesgada.
Muestras casuales o muestras seleccionadas sobre la base de
que es fcil de recolectar, son raramente representativas de la
poblacin. Hay varios mtodos adecuados para seleccionar una
muestra que permiten evitar los sesgos, y la mayora tiene
como base el concepto de muestra aleatoria o probabilstica,
en la cual cada individuo en la poblacin de inters es
seleccionado (o no) a travs del uso de mecanismos aleatorios
descriptos claramente. Por ejemplo, el caso ms simple, es el
denominado esquema de muestreo aleatorio simple en el
cual cada posible muestra es igualmente probable, lo que
implica que cada individuo tiene igual probabilidad de ser
seleccionado para pertenecer a la muestra. Ms adelante se
tratar con ms detalle los distinto tipos de muestreo.
En cualquier estudio, los investigadores deben escribir de
manera completamente explcita la manera en la cual las
muestras han sido elegidas y cuando se escribe o se lee
cualquier trabajo de investigacin uno debera hacerse las
siguientes preguntas:
15
El autor define claramente la poblacin muestreada?
El autor discute similitudes y posibles diferencias
entre la poblacin muestreada y la poblacin objetivo?

El autor describe claramente el mecanismo de
muestreo que us?
El mecanismo de muestreo es aleatorio? (Si no lo es,
porque?).
Los mtodos de anlisis de datos son adecuados
para el esquema de seleccin usado?

Qu ocurre si el investigador no ha usado un muestreo
aleatorio para seleccionar los individuos de la muestra?
Supongamos por ejemplo que l simplemente us los datos de
los clientes de un supermercado para evaluar las preferencias
de los consumidores respecto a distintas marcas de un
producto. Muchos, sino la mayora, de los estudios son de este
tipo. Los datos son analizados luego, como si ellos hubieran
surgido a partir de una muestra aleatoria de consumidores. El
problema aqu es que estamos perdiendo la vital vinculacin
entre un esquema de muestreo aleatorio y el apropiado mtodo
de inferencia estadstica, el cual supone siempre que hubo una
seleccin aleatoria de la muestra.
En estas circunstancia, se debera entonces abandonar la
inferencia estadstica? Probablemente no, pero deberamos
siempre estar muy preocupados de tomar estos resultados muy
seriamente. Las bases de la inferencia, en este caso, han sido
severamente debilitadas (destruida, diran algunos). En rigor
de verdad, deberamos decir: si pretendemos que tenemos una
muestra aleatoria, entonces . La palabra pretender ha sido
usada deliberadamente ya que no es una suposicin, puesto
que nosotros sabemos que la muestra no es aleatoria. Al final,
nosotros deberamos aceptar que estamos usando la inferencia
estadstica slo como una gua, como una manera de ayudar a
que los datos tengan algn sentido, por todo esto, nuestra
inferencia en estos casos debera estar basada ms en el
sentido comn que en la teora estadstica.
En las Unidades anteriores se estudi las reglas bsicas de
probabilidad y distintas distribuciones de probabilidad como la
binomial, Poisson, Normal y exponencial. En esta unidad se
usarn estas reglas de probabilidad junto con el conocimiento
de las distribuciones de probabilidad para analizar cmo ciertas
16
medidas (media, proporcin) pueden usarse para hacer
inferencias respecto a los parmetros poblacionales.
La inferencia estadstica involucra dos reas principales:
Estimacin y Prueba de Hiptesis, pero antes de tratar estos
importantes temas es necesario manejar el concepto de
Distribucin en el Muestreo o Distribucin Muestral que es la
base para comprender los mtodos y herramientas de la
inferencia estadstica.
1. Distribucin muestral
Un objetivo que se presenta frecuentemente en las
investigaciones de diferentes reas es conocer el promedio de
alguna caracterstica cuantitativa o la proporcin de individuos
que poseen determinada caracterstica cualitativa. Por ejemplo,
la edad media de las mujeres de una dada regin que usan
determinado servicio (Poblacin Objetivo); o la proporcin de
egresados universitarios de un pas (Poblacin Objetivo) que
hacen una carrera de postgrado. En general, las caractersticas
de inters en un estudio se denominan parmetros
poblacionales. En los ejemplos dados los parmetros
poblacionales son la media y la proporcin y generalmente se
denotan con
a la media y con a la proporcin.
Para determinar los parmetros poblacionales se requiere
conocer los valores de la variable para todos los individuos de
la poblacin, por ejemplo para determinar la edad media se
requiere conocer la edad de todas las mujeres que usan el
servicio. Sin embargo, no siempre es posible obtener la
informacin de todos los individuos que componen la poblacin
por razones de costo en tiempo y dinero, y cuando eso ocurre
se hace necesario recurrir a una muestra de la poblacin.
Luego, a partir de los datos de la muestra se busca una manera
de combinar la informacin de la muestra para obtener la
caracterstica de inters.
En el ejemplo donde el parmetro de inters es la edad media,
se toma una muestra de n (tamao de la muestra) mujeres de
la poblacin y se calcula el promedio de las edades en la
muestra. Surge entonces el interrogante a cerca de cual medida
de promedio se usar (media aritmtica o mediana). Cualquiera
sea la medida que se use, cada una de ellas recibe el nombre
de estimador o estadstico. Si se conviene en usar la media
17
aritmtica, o sea, la media muestral x , ella es en este caso el
estimador de la media poblacional
Se debe observar que para obtener el valor de x se debe
combinar los valores observados en la muestra (suma de los
datos divida en el nmero de observaciones) y esto ocurre con
cualquier estadstico o estimador de una parmetro, de manera
que formalmente se puede dar la siguiente definicin:
Definicin 1: Un estadstico o estimador es una funcin de
los valores observados en los individuos que componen la
muestra, es decir, es la expresin matemtica que indica la
forma de combinar los datos.
La Tabla 1 muestra los smbolos de los parmetros y sus
respectivos estimadores de uso ms frecuentemente.
Tabla 1: Smbolos usuales para parmetros y estadsticos
Caractersticas Smbolo del parmetro Smbolo del Estadstico
Media
x
Desviacin
s
s
estndar
s2
s
2
Varianza
r
Correlacin
p
p
Proporcin
El valor que toma el estimador para una particular muestra se
denomina una estimacin del parmetro poblacional. Por
ejemplo, si en una muestra de 100 mujeres se calcula el valor
de la media aritmtica de las edades y se obtiene x = 25.5
aos, entonces 25.5 representa un particular valor de x , es
decir es una estimacin del estimador. Obviamente con cada
posible muestra se tendra un valor diferente del estimador, es
decir, se obtendra una estimacin diferente para el parmetro
de inters. Por lo tanto, un estimador toma diferentes valores
para cada muestra, es decir, vara de muestra en muestra.
Teniendo en cuenta este aspecto de un estimador se puede dar
una segunda definicin de estimador:
Definicin 2: Un estadstico o estimador es una variable que
toma diferentes valores para cada muestra seleccionada.
18
De esta manera, las estimaciones dependen de la particular
muestra con que estemos trabajando.
En resumen, Si se est interesado en conocer algn parmetro
de una poblacin de inters (media, proporcin, coeficiente de
correlacin, etc.), y no es posible observar o medir a todos los
individuos de la poblacin para obtener el valor de dicho
parmetro, entonces, una posibilidad es obtener una muestra
de tamao n y conseguir una estimacin de parmetro usando
un estimador del parmetro.
Por otra parte, si se pudiera extraer todas las posibles muestras
del mismo tamao (n) de la poblacin de inters y con cada una
de ellas se calcula el valor del estimador o estadstico
correspondiente, se obtendra todas las estimaciones posibles
del parmetro. Luego a partir de ellos se podra construir la
distribucin de probabilidad del estadstico, tal distribucin
de probabilidad que recibe el nombre de distribucin muestral
del estadstico de inters.
Cabe preguntarse por qu es tan importante el concepto de
distribucin muestral, la respuesta es simple, cuando se quiere
estimar un parmetro poblacional (caracterstica de la
poblacin) a partir de una muestra surgen otros interrogantes
como:
Qu tan buena es la estimacin obtenida?
Se puede llegar a la conclusin de que el parmetro
de la poblacin es idntico al estadstico de la

muestra o es probable que exista algn error?.
Si es as, qu tan grande es dicho error?
Para responder a estas preguntas se debe comparar los

resultados obtenidos a partir de las muestras con los
resultados esperados. Los resultados esperados surgen
justamente a partir de la distribucin muestral del estadstico y
de all la importancia de ella.
Surge ahora otro problema, es ms costoso (y a veces
imposible) obtener todas las muestras aleatorias de tamao n
para construir la distribucin muestral del estadstico o
estimador, que observar a todos los individuos de la poblacin.
De manera que se plantean ahora nuevos interrogantes: cmo
obtener la distribucin muestral si se tiene slo una muestra de
19
la poblacin? Para responder esta pregunta se debe tener en
cuenta que la distribucin muestral del estadstico depende de:
La distribucin de la poblacin, es decir, de la distribucin
de probabilidad de la variable de inters (por ejemplo

edad de las mujeres que usan un servicio)
Del parmetro de inters (media, variabilidad)

Del estadstico que se elija para estimar el parmetro
(media aritmtica o mediana, desviacin estndar

muestral)
De la forma de seleccin aleatoria de la muestra.

Del tamao de la muestra.
La relacin existente entre la distribucin de probabilidad de la

poblacin y distribucin muestral del estimador) es la que nos
permite hacer afirmaciones sobre el parmetro poblacional y
cuantificar el error de dichas afirmaciones.
En efecto, la teora estadstica inferencial provee de
herramientas que permiten conocer, aunque sea
aproximadamente, la distribucin muestral del estadstico, y
luego, como ya se dijo, a partir de ella conocer el valor
esperado del estadstico. De esta manera, es posible evaluar la
precisin de la estimacin obtenida con la muestra y cuantificar
el error de las afirmaciones que se hagan sobre el parmetro
poblacional.
Para clarificar estos conceptos, se considera el caso en que el
parmetro poblacional es la media
estimarla es la media aritmtica x , obtenida a partir de una
y el estadstico para
muestra de tamao n de la poblacin.
Como ya se dijo, si se quiere obtener la distribucin muestral de
x, extrayendo todas las muestras de tamao n, esto consumira
ms tiempo que el requerido para tomar la informacin de toda
la poblacin y, en consecuencia, sera poco prctico. En su
lugar, es posible usar la teora estadstica para determinar la
distribucin muestral de la media aritmtica en cualquier
situacin particular, siempre que se cumplan algunas
condiciones para la distribucin de probabilidad de la variable
que
se est1:estudiando
(Ver Figura
2).
Ejemplo
En una planta
embotelladora
de bebida se
20
encuentra que la mquina embotelladora est presentando una
notable variabilidad en el llenado. Para analizar este problema
se lleva a cabo un estudio donde se define que la variable de
inters X ser la cantidad de bebida que contienen las botellas.
Supongamos que la distribucin de probabilidad de X es tal que
la media poblacional es
desviacin
ss
estndar s
desconoce esta informacin
y se
estimar
media
s = 0,2
litros.
quiere
= 1,2
Supongamos
litros delabebida,
ahora, con
que un
se
poblacional
de la poblacin de botellas. La media aritmtica calculada a
partir de la muestra
dio un
x =1,22
litros.de tamao n=100
tomando
unavalor
muestra
aleatoria
Para hacer afirmaciones sobre la precisin de la estimacin que
d algn grado de confianza en el valor encontrado a travs de
la muestra, se necesita conocer la distribucin muestral de x.
Las propiedades de la distribucin muestral de x son la base
para uno de los teoremas ms importantes de la teora
estadstica, llamado Teorema del Lmite Central, que se
enuncia a continuacin sin mucha formalidad.
Dada una poblacin con media
(finita), la distribucin muestral de la media basada en muestras
x ylas
desviacin
aleatorias repetidas de tamao n (grande) tiene
siguientesestndar s
propiedades:
1. La media de la distribucin muestral de x, es decir,

= E( xx)
el valor esperado
de la distribucin de
probabilidad de x, es igual a la media x
de la
distribucin de probabilidad de la variable X.

2. La desviacin estndar en la distribucin muestral de
s . Esta cantidad es denominada error
x es igual a
n
estndar de la media (SEM).
3. Con muestras de tamao grande, la distribucin
muestral de x sigue un modelo terico denominado
modelo de distribucin normal, sin importar la forma
de la distribucin de la poblacin original, siempre que
se cumplan las condiciones mencionadas.
Otra manera de expresar este resultado y que resulta til para
expresar los resultados de los mtodos de inferencia es la
siguiente:
21
Teorema del lmite central:
Independiente de la distribucin que tenga la variable aleatoria
X, siempre que tenga media y varianza s2 finitas, al hacerse
lo bastante grande el tamao de muestra n, entonces la
distribucin del estadstico
-
Z =X
(1)
s/ n
es Normal con media 0 y varianza 1, es decir, N(0, 1).
D IS TR I BU CI N MUE ST RA L D E LA MEDI A A RI TMT IC A (X )
D IS TR IBU CI N DE L A POBL AC IN
M ED I A
DE
D IS TRI BUC I N DE L A POB LA CI N
CO N
DE
M ED IA
DESVO
E S TN D AR s
D ESV O
ES T N D AR n
E R RO R ES T N D AR
x1
M1
x2
M2
x3
/
+
...
.
M4
s/
s
x4
M3
X
xm
Mm
POBL AC IN DE
POB LAC IN DE X
MU ES TRA S D E TAMA O
Figura 2: Distribucin muestral de la media aritmtica

(estadstico).
El resultado enunciado da la base para toda la inferencia
estadstica sobre la media.
Observacin:
Aunque siempre hay excepciones, tamaos de muestras de n =
30, o ms, en la gran mayora de los casos aseguran la validez
del teorema del lmite central, es decir, la distribucin muestral
22
N OR MAL CO N
para x tendr aproximadamente una distribucin normal para n
= 30 si s es conocido.
En el ejemplo, y de acuerdo a lo enunciado, la distribucin
muestral de x ser aproximadamente normal con media x =
1,20 litros y con un error estndar dado por
SE( x) = SEM = n
s = 1000 .=
2 0.2/10 = 0.02.
La importancia del SEM y del resultado enunciado radica en

que a partir de l se puede hacer la siguiente afirmacin: si el
tamao de muestra es grande aproximadamente el 95% de
las muestras daran valores de x en un intervalo que va
desde
del 95% de que el valor calculado de x se encuentre dentro
+2SEM, es
-2SEM
decir,aexiste
una probabilidad
de ese intervalo.
Obviamente, en la prctica siempre se desconoce el valor de
y casi siempre el valor de s, de manera que esto es slo el
respaldo terico de toda la inferencia estadstica, como se ver
en las secciones subsiguientes.
Ejemplo 2: En el ejemplo anterior si y s son conocidos,
entonces se puede afirmar que aproximadamente el 95% de
las muestran de tamao n = 100 daran valores de x entre 1,2 0.04 y 1,2 + 0.04, es decir entre 1,16 litros y 1,24 litros, o bien
que existe una probabilidad del 95% que el valor encontrado
para x se encuentre dentro de ese intervalo.
Como ya se dijo, la distribucin muestral del estimador depende
del estadstico elegido para estimar el parmetro poblacional,
por ejemplo, si el estimador elegido para estimar la media
poblacional no es x sino la mediana, entonces el clculo de su
error estndar y su distribucin muestral no sigue exactamente
lo enunciado para el caso de x. La teora que permite
establecer la distribucin muestral de la mediana est fuera del
alcance de este curso, de manera que no ser tratada aqu.
Del mismo modo que la media poblacional , por lo general, es
desconocida, es probable que la desviacin estndar de la
poblacin s, tampoco sea conocido.
23
En el caso en que s
usando los datos de la muestra. Un estimador razonable para s,
desconocido, l debe ser estimado
como ya se vio en las unidades previas, es lasea
desviacin
estndar de la muestra
n
S= = i
xi
(2)
n- 1
Reemplazar s por S en (1) resulta razonable ya que se puede

demostrar que S2 es un estimador insesgado de s2, es decir,
E[S2] = s2. Sin embargo, la distribucin muestral del estadstico
que resulta de esa sustitucin, es decir,
-
t=
XS/ n
ya no es N(0,1) debido a que se usa una estimacin para s y en

consecuencia se introduce en la expresin (3) una variabilidad
adicional. En efecto, el estadstico t definido en (3) posee una
distribucin denominada t de Student, la cual tiene una
apariencia similar a la distribucin normal, simtricas y en forma
de campana, pero la distribucin t es ms dispersa. El nico
parmetro de la distribucin t de Student es el denominado
grados de libertad y que en este caso se encuentra relacionado
al tamao de muestra n, y ello se expresa diciendo que el
estadstico t dado en la expresin (3) tiene distribucin t de
Student con (n 1) grados de libertad.
2. Estimacin
En esta Seccin se dar algunas propiedades que debera
cumplir un estimador para conseguir estimaciones confiables
del parmetro de inters. Se considerar diferentes formas de
estimacin y se estudiar una manera de medir la precisin en
la estimacin.
3.1. Estimacin puntual
El valor obtenido del estadstico o estimador a partir de una

muestra, recibe tambin el nombre de Estimacin Puntual.
24
(3)
En el ejemplo de la embotelladora es claro que el inters no
es
conocer la cantidad de bebida promedio en el grupo
particular
de botellas que pertenecen a la muestra, sino en toda la
poblacin. Por otra parte, la media calculada a partir de los
datos de la muestra es slo una estimacin de la cantidad
de bebida media en la poblacin de botellas. Cabe
preguntarse
ahora cules son las propiedades de que debera tener un
estimador (media, mediana) para que sea considerado como
bueno y que nos facilite la eleccin entre un estadstico y
otro.
Es claro que al obtener una estimacin puntual su valor
1. Insesgado: Informalmente
estoque
significa
ausencia
de error
depender
de la muestra
se haya
seleccionado
y que el
sistemtico. De una manera ms formal, un estadstico
valor
encontrado puede cambiar de muestra en muestra. De
cualquiera q se dice insesgado si la media de su
estacorrespondiente
manera, lasdistribucin
propiedades
muestraldeseables
es igual al parmetro
seran que cada
de inters Q, es decir, E[q] = Q.
estimacin no se encuentre muy alejada del verdadero valor
2. Eficiente: Significa que las estimaciones obtenidas para
del
distintas muestras varan poco entre ellas. De una manera
parmetro,
por ms
otraeficiente
parte,
ms formal, elyestimador
dentroque
de un no haya demasiada
conjunto
de
estimadores
insesgado
ser
aquel
que tiene la
variabilidad
menor varianza.
entre
los valores del estadstico, obtenidos de muestra en
3. Consistente: Informalmente, un estadstico Q se dice
muestra.
Esto
puede
definiendo
consistente
si suse
variabilidad
disminuye
cuando
aumenta el esalgunas
Se puede
demostrar
queformalizar
la media
aritmtica
un estimador
tamao
de
muestra.
propiedades
a tener endecuenta
de los
estadstico, a saber:
insesgado y eficiente
la media
poblacional.
Si la variabilidad de las estimaciones se mide a travs de la
desviacin estndar, sta desviacin estndar recibe el
nombre
de error estndar del estimador (SE).
25
Observaciones:
1. No debe confundirse desviacin estndar de la distribucin
de la poblacin (variabilidad entre los individuos) con error
estndar del estimador que es la desviacin estndar de la
distribucin muestral (variabilidad entre las estimaciones de
las muestras).
2. Es muy probable que el estadstico insesgado ms eficiente
no estime el parmetro poblacional con exactitud, esto se
debe a que en realidad cuando realizamos la estimacin
slo tomamos una muestra, y obtenemos uno de los
posibles valores del estadstico que en general no tiene
porque coincidir con el valor del parmetro que se quiere
estimar.
3.2. Estimacin por intervalos

Si bien la precisin se incrementa con muestras grandes no hay
razn para esperar que la estimacin puntual de una muestra
dada deba ser exactamente igual al parmetro poblacional que
se supone estima. Entonces, existen muchas situaciones en las
cuales es preferible determinar un intervalo dentro del cual se
esperara encontrar el valor del parmetro, tal metodologa se
conoce como estimacin por intervalos y el intervalo se
denomina Intervalo de Confianza
Los Intervalos del Confianza son intervalos aleatorios obtenidos
a partir de los datos y en los cuales hay un grado de confianza
prefijado (medido en %) de que dicho intervalo contenga al
verdadero valor del parmetro que se quiere estimar.
El grado de confianza se denomina nivel de confianza y se lo
denota como 100(1-a)%, donde a se considera a menudo como
la probabilidad de cometer un error, ya que indica la proporcin
de veces en que uno se equivoca o comete un error al suponer
que el intervalo contiene al parmetro poblacional. De esta
manera, 1-a ser la proporcin de veces que los distintos
intervalos de confianza contienen al parmetro. Usualmente el
valor 100 (1- a)% se lo fija en el 95%, lo que llevara a
establecer que en promedio slo en el 5% de los casos se
cometera error al suponer que el intervalo contiene al
verdadero valor del parmetro.
26
Para encontrar estos intervalos debemos conocer la distribucin
muestral de cada estimador, que como ya se vio esto depende
del parmetro de inters y del estadstico que se elija para
estimar dicho parmetro. Sin embargo es posible dar la forma
general que adopta un intervalo de confianza en cualquier caso.
En general, si que se quiere estimar un parmetro Q de la
poblacin a travs del estadstico q, y si el error estndar de la
distribucin de q, que se lo denotar con SE(q), entonces un
intervalo de confianza para Q con una confianza del 95%
(IC95%) viene dado por la expresin:
IC95% = [q k1SE(q) , q + k2SE(q)] (4)
donde k1 y k2 dependen de la forma de la distribucin muestral

de q.
Ejemplo 3: En el ejemplo de la embotelladora un intervalo de
confianza para el parmetro poblacional Q = , con una
confianza del 95%, correspondiente a una estimacin de
q = x = 1.22 litros,
calculada a partir de la muestra de tamao n = 100, y
suponiendo que se conoce la desviacin estndar de la
poblacin, es decir, s = 0.2 litros, est dado por:
IC95% = [ x k1SE( x) , x + k2SE( x)]
s = 0.02 y k1 = k2 = 1.96 se obtienen a
donde SE( x) = SEM = n
X-
partir de la distribucin muestral
, que como
de n se vio en
s/
la Seccin anterior ella N(0, 1). Por lo tanto,
IC95% = [1.22 1.96x0.02 ; 1.22 + 1.96x0.02] = [1.1808 ; 1.2592]
Otra manera alternativa de expresar los IC para la media

poblacional cuando se usa a la media aritmtica como
estimador es la siguiente:
x s
ss
2n s
27
(5)
o bien
x-
z a2 +
n
= =x
donde
zaa
a n
z = valor de z tal que el rea debajo de la
curva de la funcin de densidad de una

distribucin normal correspondiente al intervalo
[2
z , 8) es igual a/2 si n es grande (este valor
es 1.96).
n = tamao de la muestra
s = desviacin estndar de al poblacin
muestreada
Ejemplo 4: Una corporacin quiere emitir algunos pagars a

corto plazo y espera que los intereses que tendr que pagar no
sean mayores a 11,5%. Para obtener cierta informacin acerca
de la tasa media de inters que habra que pagar, la
corporacin pone a la venta 40 pagars, uno a travs de cada
una de 40 firmas de corretaje. Los valores del inters se
suponen que tienen una distribucin normal con media y
varianza s2 conocida, tal que s = 0,31%. A partir de la muestra
de tamao n = 40, se obtiene una estimacin de , dada por x =
10,3%. Luego, usando la expresin (2) el IC del 100(1-a)%
para la media poblacional de una distribucin normal es:
1.96 x 0.31
10.31
, obien,
40
1.96 x0.31
+
10.31
=
40
= 10. 31
1.96 x0.31
40
Haciendo los clculos se obtiene que:

10.21 = = 10.41
De mismo modo que la media de la poblacin es desconocida,
por lo general tambin se desconoce el valor real de la
desviacin estndar y, por lo tanto, se necesita estimar dicho
parmetro a partir de los datos de la muestra utilizando el
28
(6)
estadstico S. En este caso la primera expresin de (6) adopta
la forma
x n2
t( a- 1), a/ S
(7)
a
donde se reemplaza s por S y z(a
crtico de la distribucin t con n-1 grado de libertad.
aa
a/2) por t(n-1), a
/2 que es el valor
Ejemplo 5: Si en el estudio de tasa principal de bancos s es

desconocido y se tiene una muestra de tamao 50 y el valor
obtenido de x = 9,1% y como estimador de s se usa
n =50
i i , dando
=1 en este caso el valor S = 0,24,
S=
n- 1
entonces, reemplazando este valor en la expresin (7), donde

adems se reemplaza z(a
aa
estimado del error estndar ser,

a/2. Luego, el valor
/2) por t(n-1), a
S
0 .=
24
SE ()x 034
=n =
50
0.
y el valor de t(n-1),a/2 = 2.01. Luego, el intervalo de confianza para

la media poblacional con una confianza del 95% est dado por:
IC95% = [9.1 2.01x0.034; 9.1 + 2.01x0.034] = [8.96; 9.10]
Observaciones:
1. El valor de kiSE(q) del intervalo de confianza para el
parmetro q se lo puede entender como cota para el error

de estimacin. En el ltimo ejemplo se tiene entonces, que
esta cota es 1.96x0.034=0,07. Esto se interpreta como que
la probabilidad de que el error sea menor a 0,07 es 0,95.
As, la cota para el error de estimacin, 7%, proporciona una
medida de la exactitud para la estimacin efectuada por la
empresa de investigaron de mercado.
29
Actividad 2:
1. Se relaciona muchas veces un incremento en la proporcin
de ahorros de los consumidores a una falta de la confianza
en la economa, y se dice que ello es un indicador de una
tendencia de recesin econmica. Una muestra aleatoria de
n=200 cuentas de ahorro en una comunidad local, mostr un
incremento medio en los valores de las cuentas de 7,2% en
los ltimos 12 meses y una desviacin estndar de 5,6%.
a) Estime el intervalo de confianza para el aumento
porcentual promedio en las cuentas de ahorro en lo
ltimos 12 meses, para ahorradores de la comunidad.
b) Obtenga una cota para su error de estimacin.
2. Escriba la expresin para el IC para el parmetro de la
distribucin binomial cuando n es mayor de 30.
3.3. Test de hiptesis estadstica

En la seccin anterior tratamos la estimacin y precisin de los
estimadores, que conforman una de las dos reas principales
de la Inferencia estadstica. En esta seccin presentaremos una
forma diferente de obtener inferencia acerca de parmetros
poblacionales, probando hiptesis respecto a sus valores.
Un test de hiptesis es una metodologa o procedimiento que
permite cuantificar la probabilidad del error que se cometera
cuando se hace una afirmacin sobre la poblacin bajo estudio,
es decir, nos permite medir la fuerza de la evidencia que tienen
los datos a favor o en contra de alguna hiptesis de inters
sobre la poblacin.
Se introducir la idea de tests de hiptesis a travs de un
ejemplo hipottico.
Ejemplo 6: Una industria usa como uno de los componentes de
las mquinas de produccin una lmpara especial importada
que debe satisfacer algunas exigencias. Una de esas
exigencias est relacionada a su vida til en horas. Esas
lmparas son fabricadas por dos pases y las especificaciones
tcnicas varan de pas a pas. Por ejemplo el catlogo del
producto americano afirma que la vida til media de sus
lmparas es de 15500 horas, con un SD de 1200. Mientr as que
30
para el producto europeo la media es de 16500, y el SD es de
2000.
Un lote de esas lmparas de origen desconocido es ofrecido a
un precio muy conveniente. Para que la industria sepa si hace o
no una oferta ella necesita saber cual es el pas que produjo
tales lmparas. El comercio que ofrece tales lmparas afirma
que ser divulgada la vida til media de una muestra de 25
lmparas del lote antes de la oferta. Que regla de decisin
deben usar los responsables de la industria para decir que las
lmparas son de procedencia americana o europea?.
Una respuesta que surge inmediatamente es la de considerar
como pas productor aquel en la cual la media de la muestra se
aproxima ms a la media de la poblacin. As, la decisin sera
si 16000
x (el punto medio entre =15500 y 16500) diremos que
es de pr ocedencia americana; en caso contrario diremos que es
de procedencia europea.
Suponga que en el da de la licitacin se inform que, de
acuerdo con la regla de decisin diramos que las lmparas son
de origen americano. Podemos estar herrados en esa
conclusin?. O en otras palabras, es posible que una muestra
de 25 lmparas de origen europeo presente una media de
15800? Si, es posible. Entonces, para un mejor entendimiento
de la regla de decisin adoptada, es interesante estudiar los
tipos de errores que podemos cometer y las respectivas
probabilidades de cometer esos errores.
Los tests de hiptesis consisten en confrontar dos hiptesis,
una llamada hiptesis nula que denotamos con Ho y otra
llamada hiptesis alternativa denotada con H1. En el ejemplo
las hiptesis que se plantean son:
En el ejemplo las hiptesis consideradas son
Ho Las lmparas son de origen europeo, esto equivale a
decir que la vida til X de cada lmpara sigue una
distribucin con media =16500 horas y un SD=2000
horas.
H1; Las lmparas son de origen americano, es decir la
media poblacional = 15500 horas con un SD=1200
horas.
31
Bajo este planteo un test de hiptesis estadstica no es otra
cosa que un procedimiento para tomar una decisin, bajo
incertidumbre, sobre la validez de la hiptesis nula usando la
evidencia de los datos. Puesto que trabajamos bajo
incertidumbre es claro que cualquiera sea la decisin que
tomemos siempre existe una probabilidad de cometer error. A
fin de clarificar esto podemos presentar el siguiente esquema:
Tabla 2. Esquema del procedimiento

Decisin Cierta Falsa
Rechazar Ho Error Tipo I Decisin correcta
Realidad sobre Ho
No rechazar Ho Decisin correcta Error Tipo II
Como se puede ver en el esquema, con cada tipo de decisin

que se tome hay asociado una posibilidad de cometer un error.
Un procedimiento de este tipo sera ptimo cuando las
probabilidades de cometer un error, cualquiera sea la decisin
que se adopte, sean pequeas. Lamentablemente, en la
mayora de los tests de hiptesis slo es posible controlar una
de ellas, con la circunstancia agravante de que estos errores
son competitivos, es decir, cuando se disminuye mucho la
probabilidad de uno aumenta la probabilidad del otro.
Puesto que, el inters generalmente es rechazar Ho la
probabilidad de error que se controla durante este
procedimiento, es justamente el error asociado a esta decisin
(Probabilidad del Error Tipo I), es decir, la probabilidad de
rechazar Ho cuando es cierta. La mxima probabilidad de error
tipo I se denota con a
a
significacin del test y l debe ser prefijado de antemano. La
probabilidad de Error Tipo II se denota conay recibe el nombre de nivel
de
encontrar la bondad del test que se mide en trminos de la
cantidad 1-
y es til para
que corresponde a un 5% en trmino de porcentaje.
nivel adeindicar
significacin
se
usa generalmente es a
Retomando el ejemploElvamos
por RCque
una
regin
denominada
Poder
del Test.
determinada por los valores de X menores que 16000, es decir
=0.05 lo
32
RC={X = 16000}. El valor 16000 se denomina punto crtico y
se denotar como xc.
10000
12000
14000
Regin de Aceptacin de H0
16000
18000
20
Regin de Rechazo
H0
Figura 3: Valores posibles del estadstico del test
Con las notaciones indicadas arriba, la probabilidad de cometer
cada uno de los errores puede ser escrita del siguiente modo:
P[Error Tipo I] = P[ X pertenezca a RC | H0 es
verdadera] = a a
a. | H0 es
P[Error Tipo II] = P[ X no pertenezca a RC
falsa ] =
Ejemplo 7: En el ejemplo 6, cuando H0 es verdadera, es decir,

las lmparas son de origen europea, sabemos del teorema
central del lmite que x , o sea la media de las muestras de
tamao 25, tendrn distribucin aproximadamente normal con
2000 = , es decir X ~ N( 2
media 16500 y s = 400
25
,s
).
Entonces,
P[Error Tipo I] = P[ X
RC | H0 es verdadera] =
= P[ X = 16000 | X ~ N(16500, 16000)] = P[ Z =

(16000 16500)/ 400]
= P[ Z = -1.25] = 0.106 = 10.6%.
Para cada regla de decisin adoptada, es decir, para cada valor
crtico xc se obtiene un valor de probabilidad de error tipo 1. Por
otra parte, si xc se elige menor que 15000 a disminuye pero
aumenta.
Sin embargo, se puede proceder de manera inversa, es decir,
fijado a encontramos la regla de decisin que corresponder a
una probabilidad de error 1 igual a a.
33
Ejemplo 8: Si se toma a = 5%, y se procede a encontrar la
regla de decisin correspondiente:
5%= P[Error Tipo I]= P[ X = xc | X ~ N(16500, 16000)] =
P[Z < -1.645],
pero se sabe que, para una distribucin normal estndar
- c1.-645 =
16500
400
de donde xc = 15842 horas. Entonces, la regla de decisin ser
Si X fuera inferior a 15842 se dice que el lote es

americano, en caso contrario se dice que es europeo.
Con esta regla la probabilidad de error tipo II ser
P[Error Tipo II] = P[ X > 15842 | X ~ N(15500, 15842)] =
= P[Z > 1.425] = 7.93%
34
AMERICANO EUROPEO
5%
7.93%
15500 15842 16500
Figura 4: Distribucin muestral de X para el caso de la

procedencia de lote de lmparas
Procedimiento general de un test de hiptesis basado en la
regin de rechazo
Se da ahora una secuencia de pasos que puede ser
usada sistemticamente para cualquier test de hiptesis.
1) Iniciar el procedimiento estableciendo, de manera
clara y explcita, cul es la hiptesis nula, es decir, H0.
2) Usar la teora estadstica para construir un indicador

de concor dancia entre los datos y la hiptesis nula.
Este indicador denominado estadstico del test ser
usado para juzgar la hiptesis H0.
3) Fijar el nivel de significacin deseado a, que es el

mximo error aceptable cuando se rechaza H0, y usar
este valor para construir la regin crtica.
4) Calcular el valor del estadstico a partir de la muestra.
5) Si el valor del estadstico pertenece a la regin crtica,
entonces rechazar H0. En caso contrario, lo que se
puede afirmar es que no hay suficiente evidencia para
rechazar H0.
6) Si se dispone de una hiptesis alternativa y de la

distribucin del estadstico del test bajo la suposicin
que vale la hiptesis alternativa, se puede calcular la
probabilidad de error Tipo II.
Procedimiento general de un test de hiptesis basado en el
Otro
procedimiento general de un test de hiptesis ms usado
P-value
en la actualidad debido a la disponibilidad de paquetes de
programas estadsticos, consiste en tomar la decisin a partir
35
de la probabilidad del error Tipo I que brindan las salidas de
tales paquetes de programas, denominado P-value o
simplemente P. Este procedimiento lo podemos resumir en los
siguientes pasos:
1. Suponer que Ho es cierta.
2. Para confrontar esta suposicin con la informacin
(parcial) que proveen los datos sobre la realidad de
Ho, se forma una especie de indicador de
concordancia, denominado estadstico del test, el
cual es funcin del de los datos.
3. Como el estadstico depende de la informacin de los
datos, con cada muestra posible hay asociado un
valor de este estadstico y en consecuencia se genera
una nueva variable aleatoria. Asociada a esta variable
hay una cierta distribucin de probabilidad, a partir de
la cual se determina la probabilidad de que la
informacin de los datos concuerde con la hiptesis
nula, denominado P-value. De esta maner a, el Pvalue representara la probabilidad de cometer un
error cuando se toma la decisin de rechazar Ho.
4. Es claro que si de antemano se fija que la mxima

probabilidad de error al rechazar Ho debe ser igual a
a, otra manera de tomar la decisin es comparar el

valor del P- value con a.
Si P = a entonces la decisin es Rechazamos Ho
Si P > a la decisin es No hay evidencia

suficiente para rechazar Ho
3.3.2. Pruebas de hiptesis unilaterales y

Las pruebas
o test de hiptesis se relacionan con los
bilaterales
parmetros poblacionales (medias o proporciones, etc.). Se

puede utilizar los estimadores puntuales de los parmetros
poblacionales como estadstico del test en cuestin.
Supongamos, como ilustracin que se utiliza el smbolo para
denotar el parmetro poblacional de inters, por ejemplo,
puede ser , (1- 2), p (p1-p2), y el smbolo para denotar el
estimador puntual insesgado correspondiente.
36
Desde el punto de vista prctico se puede tener inters en
contrastar la hiptesis nula H0:
que el parmetro poblacional es mayor que 0, o sea H1:
0, contra
En esta situacin, se rechazar H0 cuando sea grande,
o sea la
cuando el estadstico del test sea mayor que un cierto valor
llamado valor crtico, que separa las regiones de rechazo y no
rechazo del test (Ver Figura 3).
La probabilidad de rechazar la hiptesis nula cuando es cierta
ser igual al rea bajo la curva de la distribucin muestral del
estadstico del test sobre la regin de rechazo. En el caso que
estemos trabajando con una distribucin normal, y un a = 0,05,
se rechaza la hiptesis nula cuando se encuentre a ms de
1,645
alternativa
=
de
> 0.
s a la derecha de 0. De esta manera, se puede definir
como
Una prueba estadstica de una cola o unilateral es
aquella en la que la regin de rechazo se localiza
solamente en una cola o extremo de la distribucin
muestral del estadstico del test.
Para detectar > 0, se sita la regin de rechazo en la
extremidad de valores superiores a . Para detectar < 0 se
ubica la regin de rechazo en la extremidad izquierda de la
distribucin de , o sea para valores inferiores a .
Si hay que detectar diferencias mayores o menores de 0, la
hiptesis alternativa ser
H1: 0
es decir
> 0
o bien
< 0
En este caso la probabilidad de error Tipo I a

entre las dos colas de la distribucin muestral del
estadstico, y se rechazar H0 para valores de mayores se repartir
que un valor crtico (
se llama prueba estadstica bilateral o de dos colas
0 + C)0o menor
queprueba
(
C). Esta
37
3.3.3. Casos particulares de pruebas de hiptesis
1) Caso 1: Prueba de hiptesis para la media de una
poblacin
Sea una poblacin con media y desviacin estndar s, y se
tiene inters de ver si la media poblacional es un dado valor
0. Se toma una muestra aleatoria de tamao n de esta
poblacin. Por lo que el procedimiento a seguir ser:
a) Hiptesis nula H0: = 0
b) Estimador puntual de la media poblacional x . Por el
teorema del lmite central, el cual, en esencia, establece
que bajo ciertas condiciones, cualquiera la distribucin de
X, la variable aleatoria X tiene una distribucin
aproximadamente normal con media y desviacin
estndar n
para el tamao de muestra grande.
c) Hiptesis alternativa
Prueba de una cola Prueba de dos
colas
H1: > 0 (o bien <
0)
H1: 0
d) Si la poblacin tiene una distribucin normal, o estamos

trabajando con un tamao de muestra grande (mayor a
30), y la desviacin estndar es conocida, entonces el
estadstico del test ser
x - 00- x
z=,
=
xs
(11)
n
Este estadstico tiene distribucin normal con media 0 y

desviacin estndar 1, bajo la hiptesis nula.
e) Si la poblacin es normal y no se conoce la desviacin
estndar, se utiliza su estimacin puntual s, en cuyo caso
el estadstico del test tiene la forma
38
t 0=
x-
s n
(12)
que tiene una distribucin ta,(n-1) con (n-1) grados de
libertad, bajo la hiptesis nula.
f) Regin de rechazo
Prueba de una cola Prueba de dos colas
En el caso del apartado
d)
z > za (o bien z <- za)
e)
t > ta,(n-1) (o bien t <- ta,(n1))

d)
z -> za 2z a o z <

e)
t a> t a
() ()
, n-1
2-
Ejemplo 9: La produccin diaria en una planta industrial

qumica registrada durante n = 50 das, tiene una media
muestral x = 871 toneladas. Se quiere probar la hiptesis de
que el promedio de la produccin diaria del producto qumico
es = 880 toneladas por da, contra la alternativa de que la
media es distinta de 880 toneladas diarias. Supongamos que se
conoce que la desviacin estndar de la poblacin es s = 21
toneladas diarias.
La hiptesis nula es
H0: =880 toneladas
Contra la alternativa
H1: 880
toneladas
La estimacin puntual para la media poblacional es x , por lo
tanto , el estadstico del test est dado por la expresin (11)
z s=
x - 0 - 871 - 880
=
= 3 .03
21
n
50
Para un a = 0,05, la regin de rechazo es z > 1,96 o

z < -1,96.
39
o t<- t
1,n
2
Observacin:
1. Si el estadstico del test es Z como el definido en (1) y donde
= 0, entonces, si Z es menor que 1,96, entonces
decimos que se rechaza la hiptesis nula al nivel del 5%.
2. El intervalo de confianza de 100(1-a)% del parmetro
(parmetro poblacional de inters), est relacionado con una
prueba de hiptesis estadstica, de dos colas, del parmetro
poblacional, con nivel a. En el ejemplo, el intervalo
x s 1nes
,96
de tal manera
871 que
5,82en un
muestreo repetitivo, el 100(1-a)% = 95% de los intervalos
contendrn al verdadero valor de la media poblacional.
Como el valor 880 no cae dentro de este intervalo, entonces
nos inclinamos a rechazar la hiptesis de que = 880.
Actividad 3:
Un vendedor de coches nuevos calcula que su compaa tiene
un 4,8% de ganancias promedio en la venta de los autos
nuevos asignados. El gerente de venta aprob los precios para
producir ese porcentaje de ganancias. El dueo de la compaa
quiere estar razonablemente seguro de que la decisin es
correcta, para ello se toma una muestra aleatoria de 30 coches
en la cual se obtiene una media y una desviacin estndar del
porcentaje de ganancia de 4,5% y 3,9% respectivamente.
a) Examine los datos y utilizando solamente la intuicin
Cree que ellos apoyan la hiptesis del gerente de venta?
b) Para realizar un test de hiptesis estadstica en este caso
usara el estadstico t o z. Explique su respuesta.
c) Usando el procedimiento de un test de hiptesis para la
ganancia media, aportan los datos evidencia suficiente
que indique que la poltica del gerente de ventas al
aprobar los precios genera una ganancia media de 4,8%
por coche al nivel del 5%?. (Sugerencia: use uno de estos
valores para el estadstico seleccionado Z(0.025) = 1.96 y
2.
t 01 = () 045
.025
30- )
seguro de que la decisin
es ,correcta
y para lograrlo, l
quiere contrastard)laEl
hiptesis
dueo de
nula
la compaa
con a = 0,01.
quiere estar razonablemente
40
(Sugerencia: use uno de estos valores para el estadstico
seleccionado Z(0.005) = 2.58 y () 7564
t1
0. =
005, 30 - )
e) Obtenga la regin de rechazo para la prueba del apartado

c)
2) Caso 2: Test de hiptesis para la diferencia de las
medias de dos poblaciones.
Supongamos tener dos poblaciones con medias 1 y 2 y
con desviaciones estndares s1 y s2 respectivamente. Se
quiere realizar un test de hiptesis para la diferencia (1 -
2) basado en muestras independientes de tamao n1 y

n2 observaciones. Por lo que el procedimiento a seguir
sera
a) Hiptesis nula
H0: (1- 2) = D0,
donde D0 es alguna diferencia especificada que se
quiere probar. En muchos casos se desear probar la
hiptesis de que no hay diferencias entre las medias
de las poblaciones, en cuyo caso D0 ser 0 (cero).
b) Estimador puntual de la diferencia de las medias

poblacionales ) ( 21
x -x
c) Hiptesis alternativa
Test de una cola Test de dos colas
H1: (1-2) > D0
(o H0: (1-2) < D0)
H1: ()0
1 D- 2
d) Si las poblaciones tienen distribucin normal, o

estamos trabajando con tamaos de muestra grande
(mayor a 30), y las desviaciones estndares de las dos
poblaciones son:
1. Conocidos y diferentes, entonces el estadstico del
test ser
41
2.
()
x -
z=
x2 - D0
x()- x2 - D0
= 1
,
2
s+
s 12
()x1 s-nx2
2
n1
2
(13)
donde z tiene una distribucin normal con media 0

y desviacin estndar 1, bajo la hiptesis nula.
2. Conocidas e iguales, entonces el estadstico del
test ser
z=
()x1 1-
x2 - D0
1
s
+
n1
n2
(14)
donde z tiene una distribucin normal con media 0

y desviacin estndar 1, bajo la hiptesis nula.
3. En el caso de que las desviaciones poblacionales
sean desconocidos e iguales entonces se utiliza el
estimador
2sp =
()()
n - 1 s12 + n2 - 1 s2
n1
2
n1 + 2 2
(15)
Entonces, el estadstico del test toma la forma

t=
()x1 1-
x2 - D0
1
sp+
n1 n2
que tiene una distribucin t con (n1+n2-2) grados

de libertad, bajo la hiptesis nula.
Observacin:
suposicin de que las dos poblaciones con varianzas

1. En
la situacin
en quelanoprueba
se puede
no se desea hacer la
iguales tengan
distribucin
normal,
t deovarianzas
iguales es robusta (es decir, no sensible) con respecto a las
violaciones moderadas de la suposicin de normalidad,
siempre y cuando el tamao de muestra sea grande. En tal
situacin, el test t de varianza conjunta puede utilizarse sin
que se vea seriamente afectado en su potencia. Por otro
42
(16)
lado, si el tamao de muestra es pequeo y no se puede o
no se desea hacer la suposicin de normalidad de las
poblaciones, se tiene dos alternativas: (a) llevar a cabo
alguna transformacin normalizante de los datos, por
ejemplo tomar el logaritmo de los datos, y luego aplicar el
test t a los datos transformados; (b) o bien aplicar a los
datos originales un test de distribucin libre o test no
paramtrico como por ejemplo el test de rangos de
Wilcoxon.
4. En el caso en que no se pueda o no se desee
hacer la suposicin de que las poblaciones,
normalmente distribuidas, tienen varianzas iguales
y si las desviaciones estndares son
desconocidos, entonces el estadstico del test
tiene la forma
t ' ,=
()
x - x
1
- D0
s1
s2
+ 2
n1 n2
(17)
donde t tiene una distribucin t con ( ) grados de

libertad bajo la hiptesis nula, y est dado por
=
()
s n
()()
s n
2
1
2
1
1
2
n1 - 1 2
+s22 n2
s2 n 2
+ 2 2
n -1
(18)
43
d) Regin de rechazo
Prueba de una cola Prueba de dos colas
Para los casos 1 y 2
z > za (o bien z <- za)
Para el caso 3
t > ta (o bien t <- ta).
Para el caso 4
t > ta (o bien t <- ta).
Para los casos 1 y 2

z -> za 2z a o z <
Para el caso 3
t>
- ta 2t a o t <
Para el caso 4
t '-> ta 2t a o t ' <
Observaciones:
1. El uso del estadstico t y t requiere que las muestras sean
independientes y tengan distribucin normal
2. El uso del estadstico t requiere que las poblaciones
tengan distribucin normal.
3. Un intervalo de confianza del 100(1-a)% para ()

caso 1 est dado por
IC95% = ()
x1 - x2 za 2
s 12
n1
s2
2
(19)
n2
+ caso 3 est dado por

1
1
IC9 5% = ()
x1 - x2 t a 2 s p
+
n1
n2
con los respectivos grados de libertad para t
44
1- en2 el
1- en2 el
(20)
caso 4 est dado por
IC 95a% =
()x1 - x2 t ' 2
- en el 1 2
s1
n1
(21)
n2
con los respectivos grados de libertads2para t.
+
6. De las ltimas observaciones se puede inferir, sin mayores

dificultades, que un IC con una confianza del (1 - a)100%
es equivalente a un test de hiptesis de nivel a. De tal
manera que si el IC no contiene al valor del parmetro
indicado en la hiptesis nula, entonces se puede rechazar
dicha hiptesis.
7. Si se quiere evaluar las diferencias entre los parmetros de
ms de dos grupos, por ejemplo la durabilidad de distintos
tipos de cubiertas, no es correcto realizar tales evaluaciones
usando el test de diferencias de medias tomando los
diferentes pares de medias por razones cuya explicacin
formal est fuera del alcance del curso. Para solucionar este
problema si las mediciones resultantes son continuas y se
cumplen las siguientes suposiciones: i) los datos son
obtenidos de manera aleatoria e independiente o que los
individuos sean asignados a los grupos aleatoriamente, ii)
los valores de cada grupo estn distribuidos normalmente,
iii) la varianza dentro de cada poblacin debera ser igual
para todas las poblaciones, existe una metodologa conocida
como anlisis de varianza (ANOVA) para comparar la
medias de los grupos y cuya hiptesis nula es H0 : 1 = 2 =
= k. Por otra parte, si los supuestos ii) o iii) no se cumplen
existen metodologas que permiten todava llevar cabo las
comparaciones deseadas.
Ejemplo 10: Una compaa desea comparar las expectativas
salariales anuales de su personal de ventas femenino y
masculino, segn un nuevo plan de compensaciones sobre
ventas, mas comisin. Se seleccion al azar muestras de
tamao 40, una del personal masculino y otra del personal de
ventas femenino y se les pidi que dijeran sus ingresos
anuales bajo el nuevo plan. Las medias muestrales y las
desviaciones muestrales resultaron en
45
x1 = $31083
x2 =$ 29745
Empresa
s2 =$2569
Estadstica muestral 1 2
La pregunta que surge es, proporcionan los datos evidencia
Tamao 30 30
que indique una diferencia en el promedio de ingreso anual
esperado tanto entre los vendedores como las vendedoras?.
Media 264 199
Ya que se espera una diferencia en el promedio del ingreso
estndar 157 111
anual entre las vendedoras y los vendedores, es decir, 1 Desviacin
< 2 o
bien 1 > 2, la hiptesis nula paraHay
el test
ser
evidencia
con los datos que indique una diferencia
H0: 1 = 2 es decir H0: 1 -2 =entre
D0 =las
0 dos empresas de corretaje en las ganancias
contra la alternativa
medias por accin recomendada?
a) Establezca H0
b) Enuncie la hiptesis
que ms conviene
1 - alternativa
2
H1 : 1 H 2 es decir
: ()0
1
s1 = $2312
para contestar
la pregunta expuesta antes.
Si se supone que las poblaciones de los ingresos
son normales
con diferentes desviaciones estndares
y puestolaque
ellosdeson
c) Obtenga
regin
rechazo para a = 0,05.
desconocidos, se los estima con s1d)
y s2.
Luego,
el
estadstico
Realice la prueba y saque sus conclusiones.
del test est dado por (17), es decir,e) Obtenga el correspondiente Intervalo de Confianza
t=
()()
x - x
1
-0
31083 - 29745 - 0
= la diferencia de las medias
=2, y compare las
para
2
2
()()
45
2312
2569
conclusiones
que
se
pueden
elaborar con l con
1
2
+
n1 + 2n aquellas40obtenidas
por el test de hiptesis.
40
2
s2 s2
Al utilizar una prueba de dos colas con a = 0,05, se considerar

a/2 = 0,025 en cada cola de la distribucin del estadstico y se
rechaza H0 si el valor encontrado es mayor que
=1.99
ta o( n menor
que
- 99
ta . (n
+ n - 2)
22 1
22 1
+ n - 2)
= -1 .
Puesto que, el valor observado t = 2,45 es mayor que 1,99, el

estadstico de la prueba cae en la zona de rechazo. Por lo tanto
se rechaza H0 y se concluye que hay evidencia suficiente
para asegurar que en las expectativas salariales anuales
para los vendedores es mayor que para las vendedoras.
Actividad 4:
partecomparar
de dos AFJP,
comparan
las ganancias
anuales
1. Para
lasse
aptitudes
para
seleccionar
acciones por
(menos los honorarios) para una inversin de $1000
(dlares) en cada una de las 30 acciones que se encuentran
en las listas de las ms recomendadas de ambas
empresas. Las medias y las desviaciones estndares (en
dlares) para cada una de las muestras, se indican en la
tabla siguiente
46
47

Estadística Inferencial

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estadística Inferencial

Uploaded by

Copyright:

Available Formats

Estadstica Inferencial

Ernesto Cervantes Lpez, INEGI

miembro de alguna familia conocida de distribucin y que es

Se asume que la distribucin de la poblacin de inters puede

que )t (es una funcin de .

Equivalentemente se puede abusar y decir que un estimador

1 que tienen una funcin de probabilidad

g (y1 , y2 ,..., yn ) f ( y1 , y2 ,...,dy

E ( g1 (Y1 , Y2 ) + g 2 (Y1 , Y2 ) + ... + g k (Y1 , Y2 )) =

Propiedades de los estimadores

usualmente se denota con-x= n

t ( x1 , x2 ,..., xn ) = (( x1 - x)+ (x 2 - x)+ ... + ( x n - x)) / n - 1

Ejercicio: Verificar que son insesgados.

En pocas palabras nos gustara que la media del valor

La adecuada sera (b) ya que una menor varianza garantiza que

T de ) t (es denominado un estimador

diferenciabilidad, se puede obtener dicha expresin.

La media del cuadrado del error de un estimador , )

una funcin al mismo tiempo de su varianza y sesgo

Enseguida se muestran algunos estimadores de parmetros

Dados dos estimadores insesgados 1

Suele utilizar el siguiente resultado para probar la consistencia

para es un estimador consistente

El siguiente teorema relaciona la propiedad de suficiencia

1 representa una muestra aleatoria de

una funcin de probabilidad

el mtodo utiliza la razn de verosimilitudes evaluadas en esto

' k,k Yel= E (

Mtodo de los momentos: Elija estimaciones aquellos valores

Mtodo de la mxima verosimilitud.

una muestra de 50 automviles nuevos es de $935,

Si se encontr que una curso de capacitacin ayuda a

encontrar trabajo a 16 de 20 jvenes de una ciudad,

Se requiere sentido comn para

Figura 1: Alcances de las inferencias

entre la poblacin muestreada y la poblacin objetivo?

muestreo que us?

El mecanismo de muestreo es aleatorio? (Si no lo es,

para el esquema de seleccin usado?

de la poblacin es idntico al estadstico de la

Para responder a estas preguntas se debe comparar los

de probabilidad de la variable de inters (por ejemplo

Del parmetro de inters (media, variabilidad)

(media aritmtica o mediana, desviacin estndar

De la forma de seleccin aleatoria de la muestra.

La relacin existente entre la distribucin de probabilidad de la

encuentra que la mquina embotelladora est presentando una

1. La media de la distribucin muestral de x, es decir,

probabilidad de x, es igual a la media x

distribucin de probabilidad de la variable X.

D IS TRI BUC I N DE L A POB LA CI N

Figura 2: Distribucin muestral de la media aritmtica

La importancia del SEM y del resultado enunciado radica en

Reemplazar s por S en (1) resulta razonable ya que se puede

ya no es N(0,1) debido a que se usa una estimacin para s y en

3.1. Estimacin puntual

El valor obtenido del estadstico o estimador a partir de una

3.2. Estimacin por intervalos

donde k1 y k2 dependen de la forma de la distribucin muestral

donde SE( x) = SEM = n

Otra manera alternativa de expresar los IC para la media

z = valor de z tal que el rea debajo de la

curva de la funcin de densidad de una

Ejemplo 4: Una corporacin quiere emitir algunos pagars a