You are on page 1of 24

Estadstica inferencial

La estadstica inferencial estudia cmo sacar conclusiones


generales para toda la poblacin a partir del estudio de una
muestra, y el grado de fiabilidad o significacin de los
resultados obtenidos.
En inferencia estadstica se llama estimacin al conjunto de
tcnicas que permiten dar un valor aproximado de
unparmetro de una poblacin a partir de los datos
proporcionados por una muestra. Por ejemplo, una
estimacin de la mediade una determinada caracterstica de
una poblacin de tamao N podra ser la media de esa misma
caracterstica para unamuestra de tamao n.
La estimacin se divide en tres grandes bloques, cada uno de
los cuales tiene distintos mtodos que se usan en funcin de
las caractersticas y propsitos del estudio:

Estimador:
Un estimador es una regla que establece cmo calcular una
estimacin basada en las mediciones contenidas en una
muestra estadstica.

Qu es una estimacin?

Cuando queremos realizar un estudio de una poblacin


cualquiera de la que desconocemos sus parmetros, por
ejemplo su media poblacional o la probabilidad de xito si la
poblacin sigue una distribucin binomial, debemos tomar
una muestra aleatoria de dicha poblacin a travs de la cual
calcular una aproximacin a dichos parmetros que
desconocemos y queremos estimar.

Bien, pues esa aproximacin se llama estimacin.


Adems, junto a esa estimacin, y dado que muy
probablemente no coincida con el valor real del parmetro,
acompaaremos el error aproximado que se comete al
realizarla.
Estimacin puntual
Una estimacin puntual del valor de un parmetro poblacional
desconocido (como puede ser la media , o la desviacin
estndar ), es un nmero que se utiliza para aproximar el
verdadero
Valor de dicho parmetro poblacional. A fin de realizar tal
estimacin, tomaremos una muestra de la poblacin y
calcularemos el parmetro muestral asociado (x para la
media, s para la desviacin estndar, etc.). El valor de este
parmetro muestral ser la estimacin puntual del parmetro
poblacional.
Por ejemplo, supongamos que la compaa Sonytron desea
estimar la edad media de los compradores de equipos de alta
fidelidad. Seleccionan una muestra de 100 compradores y
Calculan la media de esta muestra, este valor ser un
estimador puntual de la media de la poblacin.

Muestreo probabilstico
Consiste en elegir una muestra de una poblacin al azar.
Podemos distinguir variostipos de muestreo:

Muestreo aleatorio simple:


Para obtener una muestra, se numeran los elementos
de la poblacin y se seleccionan al azar los n elementos
que contiene la muestra.
Muestreo aleatorio sistemtico:
Se elige un individuo al azar y a partir de l, a intervalos
constantes, se eligen los dems hasta completar la
muestra.

Por ejemplo:
Si tenemos una poblacin formada por 100 elementos y
queremos extraer una muestra de 25 elementos, en
primer lugar debemos establecer el intervalo de
seleccin que ser igual a 100/25 = 4.
A continuacin elegimos el elemento de arranque,
tomando aleatoriamente un nmero entre el 1 y el 4, y a
partir de l obtenemos los restantes elementos de la
muestra.
2, 6, 10, 14,..., 98
Muestreo aleatorio estratificado:
Se divide la poblacin en clases o estratos y se
escoge, aleatoriamente, un nmero de individuos de
cada estrato proporcional al nmero de componentes de
cada estrato.

Por ejemplo:
En una fbrica que consta de 600 trabajadores
queremos tomar una muestra de 20. Sabemos que hay
200 trabajadores en la seccin A, 150 en la B, 150 en la
C y 100 en la D.

Un muestreo puede hacerse con o sin reposicin, y la


poblacin de partida puede ser infinita o finita.
En todo nuestro estudio vamos a limitarnos a una
poblacin de partida infinita o a muestreo con reposicin.
Si consideremos todas las posibles muestras de tamao
n en una poblacin, para cada muestra podemos
calcular un estadstico (media, desviacin tpica,
proporcin, ...) que variar de una a otra.
As obtenemos una distribucin del estadstico que se
llama distribucin muestral.

Estimacin de parmetros
En una poblacin cuya distribucin es conocida pero
desconocemos algn parmetro, podemos estimar dicho
parmetro a partir de una muestra representativa.
Un estimador es un valor que puede calcularse a partir
de los datos mustrales y que proporciona informacin
sobre el valor del parmetro. Por ejemplo la media
muestral es un estimador de la media poblacional, la
proporcin observada en la muestra es un estimador de
la proporcin en la poblacin.
Una estimacin es puntual cuando se obtiene un slo
valor para el parmetro. Los estimadores ms probables
en este caso son los estadsticos obtenidos en la
muestra, aunque es necesario cuantificar el riesgo que
se asume al considerarlos. Recordemos que
ladistribucin muestral indica la distribucin de los
valores que tomar el estimador al seleccionar distintas
muestras de la poblacin. Las dos medidas
fundamentales de esta distribucin son la media que
indica el valor promedio del estimador y la desviacin
tpica, tambin denominada error tpico de estimacin,
que indica la desviacin promedio que podemos esperar
entre el estimador y el valor del parmetro.
Ms til es la estimacin por intervalos en la que
calculamos dos valores entre los que se encontrar el
parmetro, con un nivel de confianza fijado de
antemano.
Intervalo de confianza
Se llama as a un intervalo en el que sabemos que est
un parmetro, con un nivel de confianza especfico.

Nivel de confianza
Probabilidad de que el parmetro a estimar se encuentre
en el intervalo de confianza.
El nivel de confianza (p) se designa mediante 1 .
Error de estimacin admisible
Que estar relacionado con el radio del intervalo de
confianza.
INTERVALO DE CONFIANZA PARA LA MEDIA
deseamos estimarla a partir de la media x obtenida en
una muestra de tamao n
extraemos de ella muestras de tamao n, o sin ser la
poblacin normal es n>30,

La distribucin muestral de medias es ,


por tanto si fijamos una probabilidad 1la

es decir, el (1-

Entonces para un nivel de confianza 1-

INTERVALO DE CONFIANZA Y TAMAO DE LA


MUESTRA
La amplitud del intervalo de confianza depende del valor
de
Con un nivel de confianza del (1la diferencia entre la estimacin para la media a partir de
la muestra y su valor real es menor que E, que
llamaremos error mximo admisible.

El tamao de la muestra depende del nivel de


confianza que se desee para los resultados y de la
amplitud del intervalo de confianza, es decir del error
mximo que se est dispuesto a admitir. Fijados estos,
1calcular el tamao mnimo de la
muestra que emplearemos.

En el caso de estimar proporciones

con lo que

Estimacin de la media de una poblacin


El intervalo de confianza, para la media de una
poblacin, con un nivel de confianza de 1 , siendo x
la media de una muestra de tamao n y la desviacin
tpica de la poblacin, es:

El error mximo de estimacin es:

Cuanto mayor sea el tamao de la muestra, n, menor es


el error.
Cuanto mayor sea el nivel de confianza, 1-, mayor es el
error.
Tamao de la muestra

Si aumentamos el nivel de confianza, aumenta el


tamao de la muestra.
Si disminuimos el error, tenemos que aumentar el
tamao de la muestra.
El tiempo que tardan las cajeras de un supermercado en
cobrar a los clientes sigue una ley normal con media
desconocida y desviacin tpica 0,5 minutos. Para una

muestra aleatoria de 25 clientes se obtuvo un tiempo


medio de 5,2 minutos.
1. Calcula el intervalo de confianza al nivel del 95% para
el tiempo medio que se tarda en cobrar a los clientes.

.Indica el tamao muestral necesario para estimar dicho


tiempo medio con un el error de 0,5 minutos y un nivel
de confianza del 95%.

n4
Estimacin de una proporcin
Si en una poblacin, una determinada caracterstica se
presenta en una proporcin p, la proporcin p' , de
individuos con dicha caracterstica en las muestras de
tamao n, se distribuirn segn:

Intervalo de confianza para una proporcin

El error mximo de estimacin es:

Ejemplo:
En una fbrica de componentes electrnicos, la
proporcin de componentes finales defectuosos era del
20%. Tras una serie de operaciones e inversiones
destinadas a mejorar el rendimiento se analiz una
muestra aleatoria de 500 componentes, encontrndose
que 90 de ellos eran defectuosos. Qu nivel de
confianza debe adoptarse para aceptar que el
rendimiento no ha sufrido variaciones?
p = 0.2

q = 1 - p =0.8 p'= 90/ 500 = 0.18


E = 0.2 - 0.18 = 0.02

P (1 - z/2 <1.12) = 0.86861 - 0.8686 = 0.1314


0.8686 - 0.1314 = 0.737
Nivel de confianza: 73.72%

PROPORCIN POBLACIONAL

En poblaciones dicotmicas con una proporcin de


xitos el estimador puntual del parmetro es la
proporcin muestral
de xitos, p, que coincide con la media de la muestra
cuando se codifica como 1 la caracterstica que se
considera como xito y 0 la que se considera no xito. A
partir de un tamao muestral moderadamente grande el
estadstico p tiene una distribucin aproximadamente
normal. El intervalo de confianza para la proporcin
poblacional est centrado en la proporcin muestral;
siendo sus lmites superior e inferior
donde z /2 es el valor crtico correspondiente al grado
de confianza 1- de la distribucin normal tipificada
y

es el error tpico de la proporcin.

Para obtener el intervalo de confianza y contrastar


hiptesis sobre la proporcin una alternativa consiste en
tratar a la proporcin
como la media poblacional de
una variable dicotmica codificada como se ha descrito
anteriormente (xito=1, no xito=0) y la secuencia es:
Para el intervalo de confianza:
Analizar
Estadsticos Descriptivos
Explorar
Para contrastar la hiptesis nula
Analizar
Comparar medias
Prueba T para una muestra

PRUEBA BINOMIAL
La prueba binomial prueba binomial analiza variables
dicotmicas y compara las frecuencias observadas en
cada categora con las que cabra esperar segn una
distribucin binomial de parmetro
Especificado en la hiptesis nula. El nivel de
significacin crtico de esta prueba indica la probabilidad
de obtener una discrepancia igual o superior a la
observada a partir de la muestra si la distribucin es la
postulada por la hiptesis nula.
El nivel de significacin crtico (bilateral) de este
contraste debe interpretarse como:
el nmero de xitos en la
muestra.

Cuando n es suficientemente grande se calcula esta


probabilidad aproximando la distribucin binomial a la
normal con correccin de continuidad.

Pruebas de Hiptesis
Otra manera de hacer inferencia es haciendo una
Afirmacin acerca del valor que el parmetro de la
Poblacin bajo estudio puede tomar. Esta afirmacin
puede estar basada en alguna creenciao experiencia
pasada que ser contrastada con laevidencia que
nosotros obtengamos a travs de lainformacin
contenida en la muestra. Esto es a loque llamamos
Prueba de Hiptesis
Una prueba de hiptesis comprende cuatro
Componentes principales:
-Hiptesis Nula
-Hiptesis Alternativa
-Estadstica de Prueba
-Regin de Rechazo
La Hiptesis Nula:
Denotada como H0 siempre especifica un solo valor del
parmetro de lapoblacin si la hiptesis es simple o un
conjunto devalores si es compuesta (es lo que
queremosdesacreditar)
La Hiptesis Alternativa:
Denotada como H1 es la que responde nuestra
pregunta, la que se estableceen base a la evidencia que
tenemos. Puede tenercuatro formas:
!
H0 : =
H0 : " 0
H0 : " 0

la proposicin H1;
50 cm/s, recibe el nombre de
hiptesis alternativa. Puesto que la hiptesis alternativa
especifica valores de que pueden ser mayores o
menores que 50 cm/s, tambin se conoce
como hiptesis alternativa bilateral. En algunas
situaciones, lo que se desea es formular una hiptesis
alternativa unilateral, como en
Ho; = 50 cm/s Ho; = 50 cm/s
La hiptesis alternativa, representada por H1, es la
afirmacin contradictoria a Ho, y sta es la hiptesis del
investigador.
La hiptesis nula se rechaza en favor de la hiptesis
alternativa, slo si la evidencia muestral sugiere que
Ho es falsa. Si la muestra no contradice decididamente a
Ho, se contina creyendo en la validez de la hiptesis
nula. Entonces, las dos conclusiones posibles de un
anlisis por prueba de hiptesis son rechazar Ho o no
rechazar Ho.
Prueba de una Hiptesis Estadstica
Para ilustrar los conceptos generales, considere el
problema de la rapidez de combustin del agente
propulsor presentado con anterioridad. La hiptesis nula
es que la rapidez promedio de combustin es 50 cm/s,
mientras que la hiptesis alternativa es que sta no es
igual a 50 cm/s. Esto es, se desea probar:
Ho; = 50 cm/s
H1;
50 cm/s
Supngase que se realiza una prueba sobre una
muestra de 10 especmenes, y que se observa cual es la
rapidez de combustin promedio muestral. La media
muestral es un estimador de la media verdadera de la

poblacin. Un valor de la media muestral que este


prximo al valor hipottico = 50 cm/s es una evidencia
de que el verdadero valor de la media es realmente 50
cm/s; esto es, tal evidencia apoya la hiptesis nula Ho.
Por otra parte, una media muestral muy diferente de 50
cm/s constituye una evidencia que apoya la hiptesis
alternativa H1. Por tanto, en este caso, la media muestral
es el estadstico de prueba.
La media muestral puede tomar muchos valores
diferentes. Supngase que si 48.5
51.5, entonces
no se rechaza la hiptesis nula Ho; = 50 cm/s, y que
si <48.5 >51.5, entonces se acepta la hiptesis
alternativa H1;
50 cm/s.
Los valores de que son menores que 48.5 o mayores
que 51.5 constituyen la regin crtica de la prueba,
mientras que todos los valores que estn en el intervalo
48.5
51.5 forman la regin de aceptacin. Las
fronteras entre las regiones crticas y de aceptacin
reciben el nombre de valores crticos. La costumbre es
establecer conclusiones con respecto a la hiptesis nula
Ho. Por tanto, se rechaza Ho en favor de H1 si el
estadstico de prueba cae en la regin crtica, de lo
contrario, no se rechaza Ho.
Este procedimiento de decisin puede conducir a una de
dos conclusiones errneas. Por ejemplo, es posible que
el valor verdadero de la rapidez promedio de combustin
del agente propulsor sea igual a 50 cm/s. Sin embargo,
para todos los especmenes bajo prueba, bien puede
observarse un valor del estadstico de prueba que cae
en la regin crtica. En este caso, la hiptesis nula
Ho ser rechazada en favor de la alternativa H1cuando,

de hecho, Ho en realidad es verdadero. Este tipo de


conclusin equivocada se conoce como error tipo I.
El error tipo I se define como el rechazo de la hiptesis
nula Ho cuando sta es verdadera. Tambin es conocido
como
nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el
nivel de significancia sera del 5%. Anlogamente si se
tiene un nivel de confianza del 90% entonces el nivel de
significancia sera del 10%.
Ahora supngase que la verdadera rapidez promedio de
combustin es diferente de 50 cm/s, aunque la media
muestral caiga dentro de la regin de aceptacin. En
este caso se acepta Ho cuando sta es falsa. Este tipo
de conclusin recibe el nombre de error tipo II.
El error tipo II error
se define como la aceptacin de
la hiptesis nula cuando sta es falsa.
Por tanto, al probar cualquier hiptesis estadstica,
existen cuatro situaciones diferentes que determinan si
la decisin final es correcta o errnea.
Decisin

Ho es
verdadera

Ho es falsa

Aceptar Ho

No hay error

Error tipo II

Rechazar Ho

Error tipo I

No hay error

1. Los errores tipo I y tipo II estn relacionados. Una


disminucin en la probabilidad de uno por lo general
tiene como resultado un aumento en la probabilidad del
otro.
2. El tamao de la regin crtica, y por tanto la probabilidad
de cometer un error tipo I, siempre se puede reducir al
ajustar el o los valores crticos.
3. Un aumento en el tamao muestral n reducir
y de
forma simultnea.
4. Si la hiptesis nula es falsa,
es un mximo cuando el
valor real del parmetro se aproxima al hipottico. Entre
ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor

PASOS PARA ESTABLECER UNA HIPOTESIS

1. Interpretar correctamente hacia que distribucin muestral


se ajustan los datos del enunciado.
2. Interpretar correctamente los datos del enunciado
diferenciando los parmetros de los estadsticos. As
mismo se debe determinar en este punto informacin
implcita como el tipo de muestreo y si la poblacin es
finita o infinita.
3. Establecer simultneamente el ensayo de hiptesis y el
planteamiento grfico del problema. El ensayo de
hiptesis est en funcin de parmetros ya que se quiere
evaluar el universo de donde proviene la muestra. En
este punto se determina el tipo de ensayo (unilateral o
bilateral).

4. Establecer la regla de decisin. Esta se puede establecer


en funcin del valor crtico, el cual se obtiene
dependiendo del valor de
(Error tipo I o nivel de
significancia) o en funcin del estadstico lmite de la
distribucin muestral. Cada una de las hiptesis deber
ser argumentada correctamente para tomar la decisin,
la cual estar en funcin de la hiptesis nula o Ho.
5. Calcular el estadstico real, y situarlo para tomar la
decisin.
Justificar la toma de decisin y concluir

Prueba de hiptesis para la media proporcional


El promedio aritmtico poblacional es un indicador muy
importante, por lo tanto, frecuentemente se desea probar
si dicho promedio ha permanecido igual, ha aumentado
o ha disminuido. A travs de la prueba de hiptesis se
determina si la media poblacional es significativamente
mayor o menor que algn valor supuesto.
Hiptesis
Se puede plantear uno de los siguientes tres tipos de
hiptesis:
- Prueba de hiptesis a dos colas
H0 : = k
H1 : k
- Prueba de hiptesis a una cola superior
H0 : = k H0 :
k
H1 : >k H1 : > k
- Prueba de hiptesis a una cola inferior
H0 : = k H0 :
k
H1 : < k H1 : < k

En las distribuciones en el muestreo se vio que para el


caso de la media, hay tres situaciones, por consiguiente
la estadstica de trabajo a utilizar depende de los
supuestos de la poblacin y del tamao de la muestra.
.2.1 Prueba de hiptesis para la media si la poblacin
de donde se obtiene la muestra tiene distribucin
normal con conocida.
La estadstica de trabajo a usar corresponde a la
expresin

Donde: es el valor que se est suponiendo en la


hiptesis nula (H0).

REGLA DE DECISION

- Si se ha planteado la hiptesis alternativa como: H1 :


k se tiene una prueba de hiptesis a dos colas, por lo
tanto, el nivel de significancia ( ) se divide en dos
partes iguales, quedando estos valores en los extremos
de la distribucin como se aprecia en la figura 3.1

y
pertenecen a una distribucin normal estndar.
Si el valor de la estadstica de trabajo (Zx) est entre
y
no se rechaza la hiptesis nula, en caso contrario
se rechaza H0 lo cual implica aceptar H1. Es decir:

Si se ha planteado la hiptesis alternativa como:


H1 : > k, se tiene una prueba de hiptesis a una cola
superior, quedando el nivel de significancia ( ) en la
parte superior de la distribucin, como se aprecia en la
figura 3.2

pertenece a una distribucin normal estndar. Si el


valor de la estadstica de trabajo (Zx) es menor que
no se rechaza la hiptesis nula, en caso contrario se
rechaza H0 lo cual implica aceptar H1. Es decir

Si se ha planteado la hiptesis alternativa como:


H1 : < k, se tiene una prueba de hiptesis a una cola
inferior, quedando el nivel de significancia ( ) en la parte
inferior de la distribucin, como se aprecia en la figura
3.3

Z pertenece a una distribucin normal estndar. Si el


valor de la estadstica de trabajo (Zx) es mayor que Z no
se rechaza la hiptesis nula, en caso contrario se
rechaza H0 lo cual implica aceptar H1. Es decir,

You might also like