You are on page 1of 16

1.- ESTIMACIÓN DE PARÁMETROS.

El objetivo más importante de la Estadística es obtener una inferencia con


respecto a la población basándose en la información contenida en una
muestra. Como las poblaciones se describen mediante medidas numéricas
denominadas parámetros, el objetivo de la mayoría de las investigaciones
estadísticas es deducir una inferencia con respecto a uno o más parámetros de
la población.

Se han estudiado, hasta el momento, las nociones fundamentales de


distribución de probabilidades; se está en condiciones, entonces, de tratar los
métodos de inferencia estadística, los cuales comprenden los procedimientos
para estimar parámetros de poblaciones y probar (contrastar) si una afirmación
provisional sobre un parámetro poblacional se ve apoyada o desaprobada ante
la evidencia de la muestra.

Hay dos tipos de inferencia: la deductiva y la inductiva.

 Inferencia deductiva: Es un juicio o generalización que se basa en


un razonamiento o proceso dialéctico a priori. Por ejemplo, se
supone que dos monedas están perfectamente equilibradas y que
entonces la probabilidad de cada una de caer "cara" es = 0,5
(premisa). La media o número esperado de "caras" en la jugada de
las monedas deber ser 1 (conclusión). Si las premisas son ciertas,
las conclusiones no pueden ser falsas.
 Inferencia inductiva: Es un juicio o generalización derivado de
observaciones empíricas o experimentales; la conclusión sobre el
número promedio de "caras" con base en los resultados de una
muestra de prueba. Si los resultados de las pruebas son diferentes,
la conclusión también será diferente. No se requiere una suposición
a priori sobre la naturaleza de las monedas.

Es muy probable que una estadística muestral sea diferente del


parámetro de la población y sólo por coincidencia sería el uno exactamente
igual al otro. La diferencia entre el valor de una estadística muestral y el
correspondiente parámetro de la población se suele llamar error de
estimación. Sólo se sabría cuál es el error si se conociera el parámetro
poblacional, pero éste por lo general se desconoce

Los problemas que se tratan en la inferencia estadística se dividen


generalmente en dos clases: los problemas de estimación y los de prueba de
hipótesis. Como al estimar un parámetro poblacional desconocido se suele
hacer una afirmación o juicio este último ofrece solamente una estimación. Es
un valor particular obtenido de observaciones de la muestra.

Generalidades: Parámetros

El uso principal de la inferencia estadística en la investigación


empírica, es lograr conocimiento de una gran clase de unidades
estadísticas (seres humanos, plantas, parcelas de tierra), de un número
relativamente pequeño de los mismos elementos.

Los métodos de inferencia estadística emplean el razonamiento


inductivo, razonamiento de lo particular a lo general y de lo observado a lo
no observado.

Cualquier colección o agregación grande de cosas que deseamos


estudiar o de las cuales deseamos hacer inferencias, se llama población.
El término población tiene más significado cuando se lo junta con la
definición de muestra de una población: una muestra es una parte o
subconjunto de una población.

Una muestra de “n” elementos de la población de “N” elementos,


debería ser seleccionada de forma tal que las características de la
población puedan ser estimados con un margen de error conocido.

Los valores de varias medidas descriptivas calculadas para las


poblaciones, se llaman parámetros. Para las muestras, estas mismas
medidas descriptivas se llaman estadísticas.

Un parámetro describe una población de la misma manera que una


estadística describe a una muestra.
Es costumbre simbolizar las estadísticas con letras romanas y los
parámetros con letras griegas.

Estadística Parámetro
Media aritmética m
Variancia S² s2
Desvío estándar S s
Coeficiente de R r
correlación

Una estadística calculada a partir de una muestra es un estimador


del parámetro en la población. Una estimación es alguna función de los
resultados de una muestra que produce un valor, llamado estimador.

El estimador da alguna información respecto al parámetro. Por


ejemplo, la media de la muestra, , es un estimador de la media m en la
población.

Las poblaciones pueden ser infinitas o finitas.

Para la mayoría de los propósitos de investigación, se supone que


las poblaciones son infinitas, no finitas, en tamaño, las cuales son algo
artificial o imaginario.

Una población finita puede ser extremadamente grande. Es posible


concebir un proceso de conteo de los elementos de la población, el cual
puede ser computado; luego la población es técnicamente finita.
Afortunadamente no es necesario crear problemas en cuanto a la
distinción entre poblaciones infinitas y finitas.

El método usado para seleccionar la muestra es muy importante al


juzgar la validez de la inferencia que se hace de la nuestra a la población.

Para que una muestra sirva adecuadamente como base para


obtener estimadores de parámetros poblacionales, debe ser
representativa de la población.
El muestreo al azar de una población producirá muestras que a la
larga son representativas de la población.

Si una muestra se extrae aleatoriamente, es representativa de la


población en todos los aspectos, esto es, la estadística diferirá del
parámetro solo por azar. La habilidad para estimar el grado de error
debido al azar (error de muestreo), es un rasgo importante de una
muestra al azar.

Estimación de Parámetros.

La teoría clásica de la Inferencia Estadística trata de los métodos por


los cuales se selecciona una muestra de una población y, basándose en
las pruebas de las muestras, se trata de:

 Estimar el valor de un parámetro desconocido, por ejemplo Ɵ.


 Verificar si q es o no igual a cierto valor predeterminado, por
ejemplo Ɵ0.

El primero de estos dos procedimientos, de inferir de una muestra a


una población, se llama estimación de un parámetro; el segundo, prueba
de una hipótesis acerca de un parámetro.

Dentro del primer procedimiento, la estimación de un parámetro


puede tener por resultado un solo punto (estimación puntual), o un
intervalo dentro del cual exista cierta probabilidad de encontrarlo
(estimación por intervalos).

Un estimador puntual es un único punto o valor, el cual se considera


va a estimar a un parámetro. La expresión E( ) = m sugiere que el único
valor de es un estimador puntual insesgado o no viciado de m .

Un estimador por intervalo se construye sobre el concepto de un


estimador puntual, pero además, proporciona algún grado de exactitud del
estimador. Como el término lo sugiere, un estimador por intervalo es un
rango o banda dentro de la cual el parámetro se supone va a caer.
2.- PROPIEDADES DE ESTIMADORES

A. ESTIMADOR:

Es un estadístico (es decir, es una función de la muestra) usado para estimar


un parámetro desconocido de la población. Por ejemplo, si se desea conocer el
precio medio de un artículo (el parámetro desconocido) se recogerán
observaciones del precio de dicho artículo en diversos establecimientos (la
muestra) y la media aritmética de las observaciones puede utilizarse como
estimador del precio medio.

Para cada parámetro pueden existir varios estimadores diferentes. En general,


escogeremos el estimador que posea mejores propiedades que los restantes,
como insesgadez, eficiencia, convergencia y robustez (consistencia).

B. SESGO:

Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor


esperado) del estimador y el verdadero valor del parámetro a estimar. Es
deseable que un estimador sea insesgado o centrado, es decir, que su sesgo
sea nulo por ser su esperanza igual al parámetro que se desea estimar.

Por ejemplo, si se desea estimar la media de una población, la media aritmética


de la muestra es un estimador insesgado de la misma, ya que su esperanza
(valor esperado) es igual a la media de la población.

C. EFICIENCIA:

Un estimador es más eficiente o preciso que otro, si la varianza del primero es


menor que la del segundo.

D. CONVERGENCIA:

Para estudiar las características de un estimador no solo basta con saber el


sesgo y la varianza, sino que además es útil hacer un análisis de su
comportamiento y estabilidad en el largo plazo, esto es, su comportamiento
asintótico. Cuando hablamos de estabilidad en largo plazo, se viene a la mente
el concepto de convergencia. Luego, podemos construir sucesiones de
estimadores y estudiar el fenómeno de la convergencia.
Comportamiento Asintótico: En el caso de las variables aleatorias, existen
diversos tipos de convergencia, dentro de las cuales podemos distinguir:

-Convergencia en probabilidad (o débil).

-Convergencia casi segura (o fuerte).

-Convergencia en media cuadrática.

-Convergencia en distribución.

E. CONSISTENCIA:

También llamada robustez, se utilizan cuando no es posible emplear


estimadores de mínima varianza, el requisito mínimo deseable para un
estimador es que a medida que el tamaño de la muestra crece, el valor del
estimador tiende a ser el valor del parámetro, propiedad que se denomina
consistencia.

F. ESTIMACIÓN POR INTERVALOS

La estimación por intervalos consiste en establecer el intervalo de valores


donde es más probable se encuentre el parámetro. La obtención del intervalo
se basa en las siguientes consideraciones:

a) Si conocemos la distribución muestral del estimador podemos obtener las


probabilidades de ocurrencia de los estadísticos muestrales.

b) Si conociéramos el valor del parámetro poblacional, podríamos establecer


la probabilidad de que el estimador se halle dentro de los intervalos de la
distribución muestral.

c) El problema es que el parámetro poblacional es desconocido, y por ello el


intervalo se establece alrededor del estimador. Si repetimos el muestreo un
gran número de veces y definimos un intervalo alrededor de cada valor del
estadístico muestral, el parámetro se sitúa dentro de cada intervalo en un
porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de
confianza".
Ejemplo

Se generan 100000 muestras aleatorias (n=25) de una población que sigue la


distribución Normal, y resulta:

La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias


muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución


muestral son los valores cuya función de distribución es igual a 0.975 y 0.025
respectivamente y se pueden obtener en las tablas de la distribución Normal
estandarizada o de funciones en aplicaciones informáticas como Excel).
Seguidamente generamos una muestra de la población y obtenemos su Media,
que es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral,
el parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A.


Por esa razón, la distancia desde m a la Media muestral es la misma que va de
la Media muestral a m. En consecuencia, si hacemos un muestreo con un
número grande de muestras observamos que el 95% de las veces
(aproximadamente) el valor de la Media de la población (m) se encuentra
dentro del intervalo definido alrededor de cada uno de los valores de la Media
muestral. El porcentaje de veces que el valor de m se halla dentro
de alguno de los intervalos de confianza es del 95%, y es denominado nivel
de confianza.

Si queremos establecer un intervalo de confianza en que el % de veces que m


se halle dentro del intervalo sea igual al 99%, la expresión anterior es:

(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la


distribución muestral en las tablas de la distribución Normal estandarizada o de
funciones en aplicaciones informáticas como Excel), y son los valores cuya
función de probabilidad es igual a 0.995 y 0.005 respectivamente).

Ejemplo

La siguiente imagen muestra la distribución de las Medias muestrales


obtenidas de 100000 muestras aleatorias y los intervalos alrededor de cada
una de las Medias obtenidas de diez de las muestras:

Donde ls y le simbolizan los límites superior e inferior del intervalo de confianza


al 95%.
Nueve de los diez intervalos (salvo el definido alrededor de la Media muestral
igual a 3.7) incluyen el valor del parámetro dentro sus límites.

INTERVALO DE CONFIANZA

En estadística, se llama intervalo de confianza a un par o varios pares de


números entre los cuales se estima que estará cierto valor desconocido con
una determinada probabilidad de acierto. Formalmente, estos números
determinan un intervalo, que se calcula a partir de datos de una muestra, y el
valor desconocido es un parámetro poblacional. La probabilidad de éxito en la
estimación se representa con 1 - α y se denomina nivel de confianza. En estas
circunstancias, α es el llamado error aleatorio o nivel de significación, esto es,
una medida de las posibilidades de fallar en la estimación mediante tal
intervalo.1

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma


que un intervalo más amplio tendrá más probabilidad de acierto (mayor nivel de
confianza), mientras que para un intervalo más pequeño, que ofrece una
estimación más precisa, aumenta su probabilidad de error.

Para la construcción de un determinado intervalo de confianza es necesario


conocer la distribución teórica que sigue el parámetro a estimar, θ.2 Es habitual
que el parámetro presente una distribución normal. También pueden
construirse intervalos de confianza con la desigualdad de Chebyshev.

En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de


un parámetro poblacional θ que sigue una determinada distribución de
probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α,
donde P es la función de distribución de probabilidad de θ.
ESTIMACIÓN DEL INTERVALO DE CONFIANZA PARA LA MEDIA
POBLACIONAL

Se emplea la siguiente fórmula:

Donde:

Z = valor crítico de la distribución normal estandarizada

Se llama valor crítico al valor de Z necesario para construir un intervalo de


confianza para la distribución. El 95% de confianza corresponde a un valor (de
0,05. El valor crítico Z correspondiente al área acumulativa de 0,975 es 1,96
porque hay 0,025 en la cola superior de la distribución y el área acumulativa
menor a Z = 1,96 es 0,975.

Un nivel de confianza del 95% lleva a un valor Z de 1,96.

El valor de Z es aproximadamente 2,58 porque el área de la cola alta es 0,005


y el área acumulativa menor a Z = 2,58 es 0,995.

Ejemplo ilustrativo

Solución:

Realizando un gráfico ilustrativo en Winstats y Paint se obtiene:


Con lectura en la tabla de la distribución normal para un área de 0,025 se
obtiene Z = -1,96. Por simetría se encuentra el otro valor Z = 1,96

Remplazando valores y realizando lo cálculos se obtiene:

Los cálculos en Excel se muestran en la siguiente figura:


Interpretación: Existe un 95% de confianza de que la media poblacional se
encuentre entre 23,02 y 24,98

ESTIMACIÓN DE INTERVALO DE CONFIANZA PARA LA MEDIA

Antes de seguir continuando es necesario estudiar la distribución t de Student,


por lo que a continuación se presenta una breve explicación de esta
distribución.

Al comenzar el siglo XX, un especialista en Estadística de la Guinness


Breweries en Irlanda llamado William S. Gosset deseaba hacer inferencias
acerca de la media cuando la fuera desconocida. Como a los empleados de
Guinness no se les permitía publicar el trabajo de investigación bajo sus
propios nombres, Gosset adoptó el seudónimo de "Student". La distribución
que desarrolló se conoce como la distribución t de Student.
Si la variable aleatoria X se distribuye normalmente, entonces el siguiente
estadístico tiene una distribución t con n - 1 grados de libertad.

Esta expresión tiene la misma forma que el estadístico Z en la ecuación para la


distribución muestral de la media con la excepción de que S se usa para
estimar la desconocida.
3.- INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL

Suponemos: Población normal X ~ N(m , s )

Se fija (1 - ±) y el estadístico tipificado de prueba tiene una distribución


muestral:

Donde Ã2 es la variancia poblacional.


Además:

1.
Reemplazando (1) en (2) resulta:

Invirtiendo fracciones:

Multiplicando miembro a miembro por (n - 1) .S2 para despejar Ã2, se obtiene:


Invirtiendo la desigualdad:
la fórmula para el intervalo de confianza, con nivel de confianza 1 − α es la
siguiente:

Ejemplo: Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1


grados de libertad que deja a su derecha una probabilidad de α/2.

Por ejemplo, dados los datos siguientes:

 Distribución poblacional: Normal

 Tamaño de muestra: 10

 Confianza deseada para el intervalo: 95 %

 Varianza muestral corregida: 38,5

Un intervalo de confianza al 95 % para la varianza de la distribución viene dado


por:

Que resulta, finalmente:


BIBLIOGRAFIA
[1] -WOLFOWITZ, J. (1969): 'Reflections on the future of mathematical statistics'. en R. c.
Bose et al. (eds.) "Essays in Probability and Sraristics". University of North Carolina Press.
Chapel Hill.
[2] -TUKEY, J.W. (1962): 'The future of Data Analysis'. Annals of Mathematical Statistics,
33, 1-67.

You might also like