You are on page 1of 59

ESTADISTICA APLICADA

http://www.bcrp.gob.pe/estadisticas.html
ESTADISTICA
ESTADSTICA
Conceptos
Bsicos
Estadstica
Descriptiva
Poblacin Muestra
PROBABILIDAD
Conceptos Bsicos
Distribuciones
de Probabilidad
Distribuciones en
el Muestreo
Desigualdad de Tchebysheff, Ley
de los grandes Nmeros,
Teorema Central del Limite.
INFERENCIA
Estimacin

Prueba de Hiptesis
para una y dos
poblaciones
Parmetro Estimador
Discretas,
Binomial, otras
Continuas, Normal,
ji-cuadrado, t de
Student
Puntual Por intervalos
Poblacin
muestra
ESTIMACIN DE
PARAMETROS
PRUEBAS DE
HIPOTESIS
Inferencia Estadstica: Proceso
Mediante el cual se utiliza la
Informacin de una muestra
Para extraer conclusiones
De la poblacin
Areas de Estimacin de
Parmetros
ESTIMACION
ESTIMACION POR PUNTOS
ESTIMACION DE INTERVALOS DE
CONFIANZA
PROCESO INFERENCIAL
Parmetros

Estimadores


Diseo
Muestral
POBLACIN
MUESTRA
1

P
TIPO DE MUESTREO
TAMAO DE MUESTRA
p , ,
2
p S x , ,
2
Ejemplo: Media





OBSERVACION
POBLACION
f(t) = N[ ,
2
]
1
= =?
2
=
2
=?
2,4,6,8,5,

MUESTRA
x

Definiciones
Muestra aleatoria de tamao n de una
poblacin X , es una sucesin de n variables
aleatorias, independientes, X
1
, X
2
,..., X
n
, con
idntica ley de probabilidad que X .
Estimador: es una variable aleatoria, es una
funcin de las n variables aleatorias de la
muestra

) .... , , (

3 2 1 n
X X X X f
Mtodo de Mxima Verosimilitud
Distribucin Bernoulli
parmetro que se estimar?
p
1 , 0 :
) (
) 1 (
X
q p x X P
x x
Funcin de Probabilidad de la
muestra
n
L(p) = p
x
i

q
1-x
i
i=1

o bien
L(p)= p
x
i
(1-p)
n- x
i
Ln L(p) = { xi}Ln p + Ln (1-p)
n- xi
]
Ln L(p) = { xi}Ln p + (n- xi) Ln (1-p)]

Ln L(p) = { xi}Ln p + (n- xi) Ln (1-p)]
df(p)
------- = D=0
d p
xi n- xi
-------- - ----------- =0
p 1-p
(1-p) xi - p [n- xi ]=0
xi p n = 0
x
i

p = --------
n
MTODOS DE ESTIMACIN PUNTUAL: MXIMA VEROSIMILITUD Y MTODO DE LOS
MOMENTOS
ESTIMADOR DE UN PARMETRO
INSESGADEZ. ERROR CUADRTICO MEDIO
CONSISTENCIA
EFICIENCIA
SUFICIENCIA
Intervalos de confianza
Estimadores puntuales comunes
Poblacin Muestra
Media _
X
Varianza:
2
S
2
Proporcin P
De objetos q pertenecen a
una clase de inters

p= X/n
X= No. Objetos en la muestra
q estn en la clase
1
-
2
_ _
X
1
X
2
P
1
-P
2

p
1
- p
2
Estimacin Puntual
Una estimacin puntual del valor de un
parmetro poblacional desconocido
(como puede ser la media , , o la
desviacin estndar , ), es un nmero
que se utiliza para aproximar el
verdadero valor de dicho parmetro
poblacional.

Una estimacin puntual es el valor de la
estadstica de la muestra
correspondiente.
Estimadores puntuales de los parmetros
de una poblacin normal

Sea una muestra aleatoria simple, X
1
, X
2
, ......
, X
n
de una poblacin con distribucin N( ,
2
).
Estimador de la media

n
i
i
n
x
x
1

La distribucin muestral de la media es :



) , (
n
x
Estimadores puntuales de los parmetros
de una poblacin normal

estima a la desviacin tpica de la
media

n
S
n
y se denomina error estndar de la media muestral,
por esta razn se dice que el error estndar de la
media mide la variabilidad de la media en el
muestreo.

Estimadores puntuales de los parmetros
de una poblacin normal

Estimador de la Varianza es la Varianza
muestral

n
i
i
n
x x
S
1
2
2 2
) 1 (
) (

Estimadores puntuales de los parmetros


de una poblacin normal

Sea X
1
, X
2
, ... , X
n
, una muestra aleatoria
simple de una poblacin X N( ,
2
),
entonces la variable aleatoria

sigue una ji-cuadrado con n-1 grados de libertad.

2
1
) (
n
i
i
x x
Estimadores puntuales de los
parmetros de una poblacin normal



Del resultado anterior se deduce que la variable




2
2
) 1 ( S n
sigue una distribucin ji-cuadrado con n-1 grados de
libertad.

Estimadores (continuacin)



Realizada la estimacin de un parmetro cabe
preguntarse:
Es exacta la estimacin?
Es probable que la estimacin sea alta o baja?
Con otra muestra se obtendra el mismo resultado, o
bastante diferente?
La calidad de un procedimiento de estimacin mejora
bastante si la estadstica de la muestra es menos variable e
insesgada a la vez?
La distancia entre el estimador y el parmetro
a estimar puede medirse mediante los que se
denomina el error cuadrtico medio, que se
define como el valor esperado del cuadrado de
la diferencia entre el estimador y el verdadero
parmetro.

Estimadores y propiedades
deseables de los estimadores

2
)

( )

( E ECM
2
)]

( [ )

( )

( E VAR ECM
El ECM es importante ya que puede escribirse como
una es la varianza del estimador y otra el cuadrado del sesgo.

Ausencia de sesgo
Se dice que un estimador es insesgado (o centrado) si la
esperanza del estimador coincide con el parmetro a estimar
En caso contrario se dice que es sesgado.
Consistencia
Se dice que un estimador es consistente si se aproxima
cada vez ms al verdadero valor del parmetro a medida que
se aumenta el tamao muestral.






Estimadores y propiedades deseables de los
estimadores

)

( E
0 ] )

Pr[(
0 , n
La distribucin del estimador se concentra ms alrededor del
verdadero parmetro cuando el tamao muestral aumenta.

Eficiencia
Es claro que un estimador ser tanto mejor cuanto
menor sea su varianza, ya que se concentra ms
alrededor del verdadero valor del parmetro. Se
dice que un estimador insesgado es eficiente si
tiene varianza mnima.
Suficiencia
Un estimador es suficiente si utiliza una cantidad de
la informacin contenida en la muestra de manera
que ningn otro estimador podra extraer
informacin adicional de la muestra sobre el
parmetro de la poblacin que se est estimando.
Estimadores y propiedades deseables
de los estimadores



Estimadores y propiedades
deseables de los estimadores


Dada una muestra aleatoria X
1
, X
2
, ... , X
n
, de
una poblacin con funcin de densidad f(x; ) Un
intervalo de confianza, de extremos L
inferior
y
L
superior
, para el parmetro de la poblacin es
un par ordenado de funciones reales de las n
medidas de la muestra
I = [L
inferior
(X
1
,...,X
n
);L
superior
(X
1
,..., X
n
)]

Construidas de forma que la probabilidad de que
los extremos contengan al verdadero valor del
parmetro es un valor prefijado (1 - ). Al
nmero (1 - ) se le denomina nivel de
confianza.

Estimacin por Intervalos
El nivel de confianza suele ser 0,95 (95%) 0,99 (99%).
La interpretacin prctica es sencilla, por ejemplo si el
nivel de confianza es del 95%, significa que en el 95%
de las veces que repitiramos el experimento, el
intervalo de confianza calculado contendra al verdadero
valor del parmetro y en el 5% restante el intervalo no
contendra el verdadero valor.
Una vez que el intervalo de confianza ha sido calculado
para una muestra concreta, el intervalo obtenido
contiene o no contiene al verdadero valor del parmetro,
con probabilidad 1, por esa razn, cuando ya tenemos
un valor concreto hablamos de confianza y no de
probabilidad. Confiamos en que el intervalo que hemos
calculado sea del 95% que contiene el verdadero valor.

Estimacin por Intervalos
Nivel de confianza grficamente
Intervalo de confianza para la media
poblacional, conocido
Supongamos que disponemos de una poblacin en la que tenemos
una v.a. con distribucin N( , ) con conocida (de estudios
previos, por ejemplo).
Obtenemos una muestra de tamao n y deseamos estimar la media
de la poblacin. El estimador puntual de la misma es la media
muestral cuya distribucin muestral es conocida
) , (
n
x
n
x
Z
tendr distribucin
normal estndar
la cantidad
Sobre la distribucin N(0 , 1) podremos seleccionar dos
puntos simtricos z
1- /2
y z
1- /2
, tales que
P(-z
1- /2
Z z
1- /2
) = 1-

Intervalo de confianza para la media
poblacional, conocido
Sustituyendo Z por su valor en este caso
particular

1
2 / 1 2 / 1
z
n
x
z P
Despejando nos queda el intervalo de confianza,
1
2 / 1 2 / 1
n
z x
n
z x P
Intervalo de confianza para la media
poblacional, conocido
Ejemplo:Un grupo de inversionistas quiere determinar la
media del rendimiento anual medida en porcentajes de
ciertos valores. Para esto se seleccion una muestra
aleatoria de 25 de tales valores observando una media de
8.71. Si se sabe que los rendimientos tiene una
distribucin normal con desviacin estndar de 2.1.Estime
la media del rendimiento anual de tales valores mediante
un intervalo de confianza del 95% .

x
25
1 . 2
96 . 1 71 . 8
25
1 . 2
96 . 1 71 . 8
5332 . 9 8868 . 7
Intervalo de confianza para la media
poblacional, conocido
Recordemos que si la varianza poblacional es
desconocida y la variable es normal o se
puede aproximar a la distribucin normal por
el Teorema central del lmite, entonces se
usara la t de Student con n 1 grados de
libertad y la desviacin estndar muestral.
El intervalo de confianza que resulta,

1
) 1 ; 2 / 1 ( ) 1 ; 2 / 1 (
n
s
t x
n
s
t x P
n n
Intervalo de confianza para la media
poblacional, desconocido
Ejemplo: En un establecimiento dedicado a la
elaboracin de alimentos balanceados para aves, se
afirma que su producto aumenta el peso promedio
de las aves en 30 gs diarios. En una muestra de 9
aves tomadas al azar, se obtuvo un aumento
promedio de 35 grs. con desviacin de 3,04 grs.
Estimar el intervalo de confianza del 95% para el
verdadero aumento promedio
9
04 . 3
306 . 2 35
9
04 . 3
306 . 2 35
34 . 37 66 . 32
Intervalo de confianza para la media poblacional,
desconocido
Determinacin del tamao de muestra n para un grado de
precisin dado
es la mitad del ancho del intervalo de confianza
(producto del coeficiente y el error estndar) y se
denomina error mximo de estimacin E.
n
z
/2 - 1
Dado un valor de error y un cierto nivel de confianza,
puedo estimar cul sera el tamao de la muestra
n
E
2
2 2
/2 - 1
z
Sea X una variable aleatoria con distribucin
normal con y desconocidos y sea X
1
, X
2
, ..., X
n

una muestra aleatoria de tamao n.
El intervalo de confianza se construye a partir de
la variable
Intervalo de confianza para la varianza
poblacional
1 Pr
2 2 2
2 / 1 ); 1 ( ) 1 ( 2 / ); 1 ( n n n
2
2
2
) 1 ( S n
Que tiene una distribucin ji-cuadrado con n-1 grados de
libertad y dos valores tales que delimiten el 100(1 - )%
Reemplazando la variable
2
en el intervalo

Intervalo de confianza para la
varianza poblacional
1
) 1 (
Pr
2
2
2
2
2 / 1 ); 1 ( 2 / ); 1 ( n n
S n
Despejando el intervalo de confianza queda,
1
) 1 ( ) 1 (
Pr
2
2
2
2
2
2 / ); 1 ( 2 / 1 ); 1 ( n n
S n S n
Intervalo de confianza para la varianza poblacional
Ejemplo: Una gran corporacin que realiza ventas de productos de
consumo masivo decidi analizar la dispersin de las ventas semanales de
un producto especfico en sus 400 tiendas. Tales ventas se distribuyen
aproximadamente normal. Si en una muestra aleatoria de 15 de sus
tiendas se encontr las siguientes ventas semanales en dlares
700,739,695,710,724,715,720,723,700,750,695,760,689,735,670
Obtenga el intervalo de confianza al 95% de la media y la desviacin
estndar de las ventas del producto.
De los datos se tiene
63 . 5
454 . 24 ) 14 (
12 . 26
454 . 24 ) 14 (
454 . 24 , 715
2
2
2
S X
562 . 38 9 . 17
028 . 1487 5196 . 320
2
Intervalo de confianza para la
Diferencia de Medias
) , (
2
1
N X segn distribuye se
) , (
2
2
N Y segn distribuye se
Ambas variables miden el mismo atributo, pero
en distintas poblaciones
Caso 1: Varianzas Poblacionales conocidas
Muestras Independientes
) , (
) , ( ) , (
2
2
2
1
2
1
2 1 1 1
2
2
2
2 2
1
2
1
1 1
n n
N X X
n
N X
n
N X
El Intervalo de confianza con (1 - ) % para la diferencia de medias es:

2
2
2
1
2
1
) 2 / 1 ( 2 1 2 1
2
2
2
1
2
1
) 2 / 1 ( 2 1
n n
Z X X
n n
Z X X
Ejemplo: Un alto dirigente del emporio comercial Gamarra afirma que el
salario promedio por semana de los hombres supera en S/42 al salario
promedio de las mujeres. Para comprobar la afirmacin un grupo de
trabajo escogi una muestra aleatoria de 20 hombres y otra de 25
mujeres encontrando los promedios S/ 356.4 y S/.324 respectivamente.
Aplicando un intervalo de confianza del 95% para la diferencia de
medias,es consistente la afirmacin del dirigente? . El grupo supone
que los salarios en cada caso siguen el modelo de probabilidad normal
con varianzas 400 y 225 soles
2
respectivamente.
356.4 324
400 225
356.4 324 1.96
20 25
32.4 10.55 21.85 42.95
H M
H M
H M
X X
) , (
2
1 1
N X segn distribuye se
) , (
2
2 2
N Y segn distribuye se
Ambas variables miden el mismo atributo, pero
en distintas poblaciones
Cociente de varianzas
) , (
2
1 1
N X segn distribuye se
) , (
2
2 2
N Y segn distribuye se
1 1
2 2 1 1
, , ,
n n
x X x X x X
2
2
2 2 1 1
, , ,
n n
y Y y Y y Y
g.l. 1 - n con cuadrado - Ji una segn distribuye se
) 1 (
1
2
1
2
1
1
X
S n
g.l. 1 - n con cuadrado - Ji una segn distribuye se
) 1 (
2
2
2
2
2
2
Y
S n
Intervalo de confianza para el
Cociente de Varianzas
g.l. 1 - n con cuadrado - Ji una segn distribuye se
) 1 (
1
2
1
2
1
1
X
S n
g.l. 1 - n con cuadrado - Ji una segn distribuye se
) 1 (
2
2
2
2
2
2
Y
S n
Ambas son independientes. Entonces

) 1 /(
) 1 /(
2 2
1 1
n
n
F
Sigue una distribucin F de Fisher con (n
1
- 1) grados de libertad en
el numerador y (n
2
- 1) grados de libertad en el denominador.
Intervalo de confianza para el
Cociente de Varianzas
0 5 10 15 20 25 30
0
1
) 2 / , 1 2 , 1 1 ( n n
F
) 2 / 1 , 1 2 , 1 1 ( n n
F
) 1 , 1 ( m n
F
1 Pr
) 2 / 1 , 1 2 , 1 1 (
2
1
2
2
2
2
) 2 / , 1 2 , 1 1 ( n n
Y
X
n n
F
S
S
F
Intervalo de confianza para el
Cociente de Varianzas
0 5 10 15 20 25 30
0
1
) 2 / , 1 2 , 1 1 ( n n
F
) 2 / 1 , 1 2 , 1 1 ( n n
F
) 1 , 1 ( m n
F
) 2 / , 1 2 , 1 1 (
2 2
) 2 / 1 , 1 2 , 1 1 (
2 2
/
,
/
n n
Y X
n n
Y X
F
S S
F
S S
Intervalo de confianza para la razn
2
2
2
1
Intervalo de confianza para el
Cociente de Varianzas
) , (
2
1
N X segn distribuye se
) , (
2
2
N Y segn distribuye se
1 1
2 2 1 1
, , ,
n n
x X x X x X
2 2 2 2 1 1
, , ,
n n
y Y y Y y Y
1
1
n
X
X
n
i
i
1
) (
1
1
2
2
n
X X
S
n
i
i
X
2
1
n
Y
Y
m
i
i
1
) (
2
1
2
2
n
Y Y
S
m
i
i
Y
Caso 2:Intervalo de confianza para la
Diferencia de Medias-Varianzas
Poblacionales Desconocidas
2
) 1 ( ) 1 (
2 1
2
2
2
1
2
n n
S n S n
S
Y X
p
Un estimador de la varianza basada en las dos muestras es
Por otro lado, se demuestra que
)) / 1 / 1 ( , ( como distribuye se
2 1
2
2 1
n n N Y X
2 1
2 1
/ 1 / 1
) ( ) (
n n S
Y X
T
p
Sigue una distribucin t-student con n
1
+n
2
-2 grados de libertad
Intervalo de confianza para la Diferencia de Medias:
Varianzas Desconocidas pero iguales
Por lo tanto un intervalo de confianza (1- ) para la diferencia de
medias est dado por
) / 1 / 1 ( ) (
2 1
2
) 2 (
2 1
n n S t Y X
p n n
Percentil (1- 100 de la distribucin t-student con n
1
+n
2
-2 grados
de libertad
Intervalo de confianza para la
Diferencia de Medias
Un intervalo de confianza (1- ) para la diferencia de medias
cuando las varianzas poblacionales no se conocen y son diferentes
es:
1 1
) (
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
2
2
2
1
2
1
) 2 / 1 , (
n
n
S
n
n
S
n
S
n
S
v
n
S
n
S
t Y X
v
Percentil (1- 100 de la distribucin t-student con v grados de libertad
Intervalo de confianza para la Diferencia de Medias con Varianzas
desconocidas pero diferentes
) , (
2
1
N X segn distribuye se
) , (
2
2
N Y segn distribuye se
) , ),...( , ( ), , (
2 2 1 1 n n
Y X Y X Y X
Intervalo de Confianza para la diferencia entre
dos medias de observaciones pareadas
Una muestra aleatoria de n datos emparejados, escogida
de la poblacin bivariada (X, Y) donde
2 2 1 1 2 1
,.. , ,.. ,
n n
Y Y Y e X X X
Son dos muestras correlacionadas
n n n
Y X D Y X D Y X D ,... ,
2 2 2 1 1 1
Una muestra aleatoria de tamao n, seleccionada de la
poblacin de diferencias D=X-Y cuya distribucin es normal
Intervalo de Confianza para la diferencia entre
dos medias de observaciones pareadas
) , ( 2
) , (
2
2
2
1
2
2 1
2
Y X Cov
N D
D
D
D D
n
S
t d
n
S
t d
t
n S
d
T
D
n D
D
n
n
d
D
) 2 / 1 , 1 ( ) 2 / 1 , 1 (
) 1 (
/
Intervalo de Confianza para
proporciones
Poblacin infinita
o finita con
reposicin :


Poblacin finita,
de tamao N, sin
reposicin :
n
q p
z p
2 / 1
1
2 / 1
N
n N
n
q p
z p
Intervalo de confianza para la Diferencia
de Proporciones Poblacionales

Un intervalo de confianza aproximado del 100(1- ) para la diferencia de las
proporciones ser de la forma:
2
2 2
1
1 1
2 / 1 2 1

n
q p
n
q p
z p p

El consorcio BACKUS distribuye dos marcas de cerveza. En una reciente
encuesta se encontr que la mitad de 120 clientes prefieren la marca X y
que slo cincuenta de ochenta prefieren la marca Y. Determine si son
diferentes los porcentajes de preferencias poblacionales de las marcas de
cerveza, con un intervalo de confianza del 95% .
Ejemplo
Una agencia de publicidad LASER realiz un
estudio para comparar la efectividad de un
anuncio por la radio en dos ciudades. Despus
de difundir el aviso durante una semana, se
realiz una encuesta a 900 personas
seleccionadas al azar en cada una de las
ciudades y se les pregunt si escucharon el
aviso, resultando las proporciones 20% y 18%
respectivamente. Si con estos datos se infiere
que p1 p2 [-0.0162, 0.0562], qu nivel de
confianza se utiliz?

You might also like