You are on page 1of 6

Estimacin estadstica

Este artculo o seccin necesita referencias que aparezcan en una publicacin


acreditada. Este aviso fue puesto el 31 de marzo de 2010.
Puedes aadirlas o avisar al autor principal del artculo en su pgina de discusin
pegando: {{sust:Aviso referencias|Estimacin estadstica}}
~~~~

En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un


valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados
por una muestra. Por ejemplo, una estimacin de la media de una determinada
caracterstica de una poblacin de tamao N podra ser la media de esa misma
caracterstica para una muestra de tamao n.1
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos
mtodos que se usan en funcin de las caractersticas y propsitos del estudio:

Estimacin puntual:2
Mtodo de los momentos;
Mtodo de la mxima verosimilitud;
Mtodo de los mnimos cuadrados;
Estimacin por intervalos.
Estimacin bayesiana.

Estimacin puntual[editar]
Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una
frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la
talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador
eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mnima) Estimacin puntual. Sea X una variable poblacional con
distribucin F , siendo desconocido. El problema de estimacin puntual consiste en,
seleccionada una muestra X1, ..., Xn, encontrar el estadstico T(X1, ..., Xn) que mejor
estime el parmetro . Una vez observada o realizada la muestra, con valores x1, ..., xn,
se obtiene la estimacin puntual de , T(x1, ..., xn) = .
Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro:
mtodo de los momentos y mtodo de mxima verosimilitud. Mtodo de los momentos:
consiste en igualar momentos poblacionales a momentos muestrales. Deberemos tener
tantas igualdades como parmetros a estimar. Momento poblacional de orden r r = E(Xr)
Momento muestral de orden r ar = Xn i=1 Xr i n
Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro aquel que
maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una
muestra seleccionada de una poblacin con distribucin F o densidad f(x), la
probabilidad de que ocurra una realizacin x1, ..., xn viene dada por: L(x1, ..., xn) = Yn
i=1 f(xi)
A L(x1, ..., xn) se le llama funcin de verosimilitud.(credibilidad de la muestra observada).
Buscamos entonces el valor de que maximice la funcin de verosimilud, y al valor
obtenido se le llama estimacin por mxima verosimilitud de . Nota: si la variable X es
discreta, en lugar de f(xi ) consideramos la funcin masa de probabilidad p(xi).
Ejemplo 7.1: Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn,
con realizacin x1, ..., xn, estimamos el parmetro por ambos mtodos. Segn el mtodo
de los momentos: E(X) = Xn i=1 Xi n = X, y al ser = E(X) se obtiene que = x. Por
el mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e
(xi) 2 2
Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso
resulta ms fcil maximizar su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n ln(
2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi ) = n x n 2 = 0 =

Estimacin por intervalos[editar]


Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro
estimado con una cierta probabilidad. En la estimacin por intervalos se usan los
siguientes conceptos:

Intervalo de confianza[editar]
El intervalo de confianza es una expresin del tipo [1, 2] 1 2, donde es el
parmetro a estimar. Este intervalo contiene al parmetro estimado con un determinado
nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no
garantiza un axioma o un equivalente circunstancial.

Los otros ejercicios te lo paso por was osea los ejercicios


primeros

Estos son ejemplos de estimacin de intervalos de confianza:

3. Un grupo de investigadores de Ecologa midieron la


concentracin de clulas rojas en la sangre de 29
lagartos (Sceloporis occidentales) capturados en el
campo. Tambin observaron si los lagartos estaban
infectados por el parsito de Malaria Plasmodium. Los
recuentos de clulas rojas proporcionaron los siguientes
valores.

Animales infectados: n1 13 X 1 972,1


s1 245,1
Animales no infectados: n 2 16 X 2 843,4
s 2 251,2

a) Construye un intervalo de confianza al 99% para la


diferencia entre la concentracin media de clulas
rojas en la sangre de animales infectados y no
infectados (se supone normalidad).
b) Se podra afirmar que la malaria reduce el nmero de
clulas rojas? Razona la respuesta.

Solucin:

a) Se trata de comparar dos poblaciones: P1, lagartos infectados


con el parsito, y P2, lagartos no infectados. Concretamente,
nos interesa comparar las medias poblacionales. En
consecuencia, buscamos I . 1 2
Asumimos que las varianzas poblacionales NO son conocidas.
Para verificar si pueden considerarse iguales o no, como s 2 s1 ,
calculamos

s 22 251,2 2
1,05 2 Por lo tanto, consideramos que 12 22
s12 245,1 2
(caso b1).

X 1 X 2 972,1 843,4 128,7

Como n1 13, n 2 16 y 1% (0,01 en tanto por uno),


t / 2, n n
1 2 2
t 0, 005, 27 2,771

n1 1 s12 n2 1 s 22
Finalmente, s 2p ; operando se tiene
n1 n2 2
s p 248,507

Sustituyendo en la frmula del intervalo de confianza,


obtenemos

I (128'424, 385'82)

b) Si el intervalo contuviera slo nmeros negativos, estaramos


diciendo que la diferencia entre el nmero medio de clulas
rojas de P1 y P2 es negativa, o equivalentemente que el
nmero medio de clulas rojas de P1 (lagartos infectados con
malaria) es inferior al de P2 (lagartos no infectados). En ese
caso, se podra afirmar que la malaria reduce el nmero de
clulas rojas. Pero vemos que el intervalo contiene tanto
nmeros negativos como positivos, con lo cul tan aceptables
es que sea mayor la media de los infectados, como la de los no
infectados. En consecuencia, NO se puede afirmar que la
malaria reduzca el nmero de clulas rojas.

4. En un estudio sobre el efecto del dixido de azufre como


agente contaminante del aire, se dispuso de cierto tipo
de semillas de habichuelas en cmaras que se
mantuvieron a lo largo del experimento abiertas por su
parte superior. Se asignaron aleatoriamente seis de esas
cmaras a un tratamiento consistente en fumigarlas con
dixido de azufre, y en las otras seis no se efectu ningn
proceso. Transcurrido un mes, se registraron las
cosechas totales (en kg) de habichuelas en cada cmara,
obtenindose los siguientes datos:

Con 1,52 1,85 1,39 1,15 1,30 1,57


Diox.
Sin Diox. 1,49 1,55 1,21 0,65 0,76 0,69

Halla un intervalo de confianza al 90% para la diferencia


de produccin media de habichuelas con y sin dixido de
azufre. Interprtalo.

Queremos comparar dos poblaciones, P1 y P2. Llamamos:

P1: cosechas de habichuelas criadas con dix. Podemos


comprobar que X 1 1,463 , n1 6 , s1 0,243 .
P2: cosechas de habichuelas criadas sin dix. Podemos comprobar
que X 2 1,058 , n2 6 , s 2 0,410

Queremos determinar un intervalo para la diferencia de medias


poblacionales, I 1 2

Para comprobar si las varianzas poblacionales (que suponemos


desconocidas) pueden considerarse iguales o no, como s 2 s1 ,
s 22
calculamos 2 2,847 2 . Por lo tanto, consideramos que 12 22
s1
(caso b2)

Necesitamos calcular f ; podemos comprobar que f 9,38 9

Adems, 10% . Por tanto, necesitamos t 0.05,9 1'833

Finalmente, sustituyendo en la expresin para I 1 2 , tenemos

I (0.049, 0.761)

Como el intervalo contiene slo nmeros positivos, se tiene que


1 2 0 , luego 1 2 , es decir, la cosecha media con dixido de
azufre es superior a la cosecha media sin l. En otras palabras,
efectivamente el dixido de azufre favorece el crecimiento de las
semillas.

5. Se realiz un estudio para comparar el contenido en


sodio en el plasma de las focas peleteras australes
jvenes, con el nivel de sodio en la leche de las focas. Se
obtuvieron las siguientes observaciones sobre el
contenido de sodio (en minimoles) por litro de leche (o
plasma) en 10 focas aleatoriamente seleccionadas:

Sujeto Leche Plasma


1 93 147
2 104 157
3 95 142
4 81,5 141
5 95 142
6 95 147
7 76,5 148
8 80,5 144
9 79,5 144
10 87 146

Halla un intervalo de confianza del 95% para la


diferencia de niveles de sodio en los dos lquidos
corporales. Hay pruebas de que exista alguna
diferencia? En qu sentido?

Sea X el nivel de sodio en la Leche, y sea Y el nivel de sodio en


el plasma. Queremos estudiar la diferencia de las medias de Y,
y X. Sin embargo, como los valores que tenemos para ambas
provienen de los mismos individuos, en principio los valores de
X e Y NO son pueden considerarse independientes. Por lo
tanto, estamos ante el caso de datos emparejados.

En consecuencia, formamos una nueva variable, D=X-Y, cuyos


datos corresponden a las diferencias entre los valores de X e Y;
es decir:

Y=Sodio en X=Sodio en
Sujeto Leche plasma D =X-Y
1 93 147 54
2 104 157 53
3 95 142 47
4 81,5 141 59,5
5 95 142 47
6 95 147 52
7 76,5 148 71,5
8 80,5 144 63,5
9 79,5 144 64,5
10 87 146 59
Total: 887 1458 571

Sobre los datos de D, calculamos media y cuasivarianza,


obtenindose D 57.1 , s D 1.033 . Como t 0.025,9 2.262 ,
aplicando la frmula del intervalo de confianza
se tiene I = (56.361, 57.839). Es decir, la presencia del sodio en
el plasma es claramente superior.

You might also like