You are on page 1of 9

Introducción

A la inferencia estadística le interesa sacar conclusiones de un gran número de


acontecimientos (población), fundándose en las observaciones de una parte de los
mismos (muestra). La estadística nos proporciona herramientas que formalizan y
uniforman los procedimientos para sacar conclusiones siempre que las muestras
seleccionadas sean representativas de la población que han sido extraídas. Esta
representatividad permite extender los valores que describen a las muestras
(estadísticos), tales como la media, la desviación típica, un coeficiente de
correlación, a la población correspondiente, es decir, la media o la desviación típica
(estadísticos) pueden tomarse como estimadores de los parámetros μ y σ, valores
que caracterizan a la población.
Los estadísticos, valores obtenidos en la muestra, son, pues, estimadores de los
parámetros correspondientes (valores de la población).
UNIDAD 2. INFERENCIA ESTADISTICA: ESTIMACION

2.1 CONCEPTOS BASICOS

POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter común.


Se representa con la letra N.
MUESTRA: Conjunto de unidades de una población. Cuanto más significativa sea,
mejor será la muestra. Se representa con la letra n.
UNIDAD DE MUESTREO: Está formada por uno o más elementos de la población.
El total de unidades de muestreo constituyen la población. Estas unidades son
disjuntas entre sí y cada elemento de la población pertenece a una unidad de
muestreo.
PARÁMETRO: Es un resumen numérico de alguna variable observada de la
población. Los parámetros normales que se estudian son:

 Media poblacional: 𝑋
 Total poblacional: 𝑋
 Proporción: 𝑃

ESTIMADOR: Un estimador θ* de un parámetro θ, es un estadístico que se emplea


para conocer el parámetro θ desconocido.

ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable


aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribución de
probabilidad, se conoce como “Distribución muestral del estadístico”.

ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un resumen
estadístico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la población total, de modo que lo estimado
es el valor generalizado a la población. Consiste en la búsqueda del valor de los
parámetros poblacionales objeto de estudio. Puede ser puntual o por intervalo de
confianza:

 Puntual: cuando buscamos un valor concreto.

 Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se


supone que va a estar el valor del parámetro que se busca con una cierta
probabilidad.
CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo de
datos muéstrales, que la característica o el parámetro poblacional estudiado tome
un determinado valor o esté dentro de unos determinados valores.

NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al afirmar


que el parámetro θ está dentro del intervalo al seleccionar muchas muestras.

2.2 DISTIBUCIONES DE MUESTREO

La inferencia estadística es el proceso que permite hacer inferencias (predicciones,


suposiciones, …) acerca de los parámetros de la población a partir de los
estimadores obtenidos con una muestra. Utiliza como base el muestreo aleatorio
simple. La distribución muestral de un estimador es la distribución de la probabilidad
de la variable que recoge los distintos valores del estimador obtenidos al analizar
diferentes muestras.

Una población con cualquier distribución de frecuencias, que tiene una µ y σ



concretas, tiene una distribución muestral de la 𝑋 (las medias de infinitas muestras
obtenidas de dicha población):

 Con una media igual al a la media de la población

 Una desviación estándar, denominada error típico o estándar, igual a σ,


desviación
estándar de la población, dividida entre la raíz cuadrada del tamaño de

la muestra, n:

 Y sigue una distribución normal (si n es suficientemente grande)


Ejemplo:

Histograma de x en 1000 muestras de 11elementos.


2.3 ESTIMACION PUNTUAL
Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido
de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de
un determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos. Lo más importante de un
estimador, es que sea un estimador eficiente. Es decir, que sea insesgado (ausencia
de sesgos) y estable en el muestreo o eficiente (varianza mínima)
Con la estimación puntual se estima el valor del parámetro poblacional desconocido,
a partir de una muestra. Para cada muestra se tendrá un valor que estima el
parámetro. Esta estimación no es muy útil si desconocemos el grado de
aproximación de la estimación al parámetro.
Un estimador de un parámetro poblacional es una función de los datos muéstrales.
En pocas palabras, es una fórmula que depende de los valores obtenidos de una
muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto
de un parámetro. Por ejemplo, si se pretende estimar la talla media de un
determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos de la muestra.
La media de la muestra puede ser un estimador de la media de la población, la cuasi
varianza muestral es un buen estimador de la varianza poblacional y el total
muestrales un buen estimador del total poblacional.
Las propiedades o criterios para seleccionar un buen estimador son los
siguientes:
A) Insesgadez: Diremos que un estimador θ* de un parámetro θ es insesgado si su
esperanza coincide con el verdadero valor del parámetro.

En el caso de que no coincidan, diremos que el estimador es sesgado.


B) Eficiencia: Dados dos estimadores θ1* y θ2* para un mismo parámetro θ, se dice
que θ1* es más eficiente que θ2* si:

C) Suficiencia: Se dice que un estimador de un parámetro es suficiente cuando para


su cálculo utiliza toda la información de la muestra.
D) Consistencia: Decimos que un estimador θ* de un parámetro θ es consistente si
la distribución del estimador tiende a concentrarse en un cierto punto cuando el
tamaño dela muestra tiende a infinito.
La probabilidad de que la media muestral sea igual a la media poblacional es cero,
es decir, que será bastante complicado obtener un estimador puntual,
por ello se utiliza más el Intervalo de Confianza y el Contraste de Hipótesis.

Ejemplo
Sea X X X n , ,..., 1 2 una m.a. de una distribución Γ(α, λ). Como hay dos parámetros
a estimar, planteamos un sistema de ecuaciones basadas en el primer y en el
segundo momento.
2.4 ESTIMACION DE INTERVALO
La estimación por intervalos consiste en establecer el intervalo de valores donde es
más probable se encuentre el parámetro. La obtención del intervalo se basa en las
siguientes consideraciones:
a) Si conocemos la distribución muestral del estimador podemos obtener las
probabilidades de ocurrencia de los estadísticos muestrales.
b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y por ello el
intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran
número de veces y definimos un intervalo alrededor de cada valor del estadístico
muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido
de ocasiones. Este intervalo es denominado "intervalo de confianza".
Es deseable conocer un método que nos permita saber dónde se encuentra el
parámetro con un cierto grado de certeza. Este método va a ser la determinación
de un intervalo donde estará el parámetro con un nivel de confianza. Estimación de
intervalo expresa la amplitud dentro de la cual probablemente se encuentra un
parámetro poblacional.
El intervalo se construye a partir de una muestra, entonces, para cada muestra se
tendrá un intervalo distinto. Llamaremos ? al error que se permite al dar el intervalo
y el nivel de confianza será 1-a. Un intervalo tiene un nivel de confianza 1-a cuando
el 100·(1-a) % delos intervalos que se construyen para el parámetro lo contienen.
Es deseable para un intervalo de confianza que tenga la menor amplitud posible,
esta amplitud dependerá de:
 El tamaño de la muestra, mientras mayor sea el tamaño mejor será la
estimación, aunque se incurre en un aumento de costes
 Nivel de confianza, si se pide mayor nivel de confianza, el intervalo será
mayor
Ejemplo
Se generan 100000 muestras aleatorias (n=25) de una población que sigue la
distribución Normal, y resulta:
La distribución de las Medias muestrales aproxima al modelo Normal:

En consecuencia, el intervalo dentro del cual se halla el 95% de las Medias


muestrales es

(Nota: Los valores +-1.96 que multiplican la Desviación Típica de la distribución


muestral son los valores cuya función de distribución es igual a 0.975 y 0.025
respectivamente y se pueden obtener en las tablas de la distribución Normal
estandarizada o de funciones en aplicaciones informáticas como Excel).
Seguidamente generamos una muestra de la población y obtenemos su Media, que
es igual a 4.5. Si establecemos el intervalo alrededor de la Media muestral, el
parámetro poblacional (5.1) está incluido dentro de sus límites:

Ahora bien, la distancia de un punto A a un punto B es la misma que de B a A. Por


esa razón, la distancia desde m a la Media muestral es la misma que va de la Media
muestral a m. En consecuencia, si hacemos un muestreo con un número grande de
muestras observamos que el 95% de las veces (aproximadamente) el valor de la
Media de la población (m) se encuentra dentro del intervalo definido alrededor
de cada uno de los valores de la Media muestral. El porcentaje de veces que el valor
de m se halla dentro de alguno de los intervalos de confianza es del 95%, y es
denominado nivel de confianza.
Si queremos establecer un intervalo de confianza en que él % de veces que m se
halle dentro del intervalo sea igual al 99%, la expresión anterior es:
(Obtenemos el valor +-2.58 que multiplica la Desviación Típica de la distribución
muestral en las tablas de la distribución Normal estandarizada o de funciones en
aplicaciones informáticas como Excel), y son los valores cuya función de
probabilidad es igual a 0.995 y 0.005 respectivamente).
CIBERGRAFÍA

 Inferencia Estadística Unidad II, extraído de:


https://es.scribd.com/document/130447032/Inferencia-Estadistica-Unidad-II
 Estimación estadística, extraído de:
https://es.scribd.com/document/59824674/estimacion-puntual
 Estimación por intervalos, extraído de:
https://www.uv.es/Webgid/Inferencial/5_estimacin_por_intervalos.html
 PyEC013.pdf, extraído de:
http://www.dm.uba.ar/materias/probabilidades_estadistica_C/2005/1/PyEC0
13.pdf

You might also like