Estadistica Inferencial

INSTITUTO TECNOLOGICO DEL ISTMO
INGENIERIA INDUSTRIAL
ASIGNATURA:
ESTADISTICA INFERENCIAL I
DOCENTE:
LOPEZ MARCIAL JUAN OMAR
ALUMNO:
LOPEZ GOMEZ DIEGO JOSEPH
UNIDAD 2:
ESTIMACION
GRUPO:
3” Q”
HEROICA CIUDADD DE JUCHITAN DE ZARAGOZA, OAXACA, A

16/11/17
INDICE
2.1 INTRODUCCIÓN.
2.2 CARACTERÍSTICA DE UN ESTIMADOR.
2.3 ESTIMACIÓN PUNTUAL.
2.4 ESTIMACIÓN POR INTERVALOS.
2.4.1 INTERVALO DE CONFIANZA PARA LA MEDIA.
2.4.2 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS.
2.4.3 INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN.
2.4.4 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE
PROPORCIÓN.
2.4.5 INTERVALOS DE CONFIANZA PARA LA VARIANZA.
2.4.6 INTERVALOS DE CONFIANZA PARA LA RELACIÓN DE
VARIANZAS.
2.5 DETERMINACIÓN DEL TAMAÑO DE MUESTRA.
2.5.1 BASADO EN LA MEDIA DE LA POBLACIÓN.
2.5.2 BASADO EN LA PROPORCIÓN DE LA POBLACIÓN.
2.1 INTRODUCCIÓN
Estimación se refiere a la valoración o la apreciación que se debe
realizar y desarrollar para calcular un valor. Es el proceso de
encontrar una aproximación sobre una medida, es utilizable incluso si
los datos de entrada pueden estar incompleto, inciertos o inestable.
En la estadística la estimación implica usar el valor en estadística

derivada una muestra estima el valor de un parámetro a una
población, la muestra da información que se puede proyectar de
diversos factores, formal o informalmente, son procesos que
determina una gama probablemente y descubrir información que
falta a veces la estimación supera el resultado real, una
subestimación si la estimación se quedó en corto del resultado real.
La estimación se puede generar mediante la proyección de los

resultados de encuestas sobre la población, lo más a menudo es que
el objetivo es útil para generar un rango de posibles resultados.
Sin embargo, el punto de estimación es probable que sea incorrecto,

debido al tamaño de la muestra, es un numero demasiado pequeño
para estar seguro, contiene anomalías de diferente de la población
en su conjunto, es la estimación de intervalo que captura una gama
más amplia de posibilidad, es muy amplio para serlo útil.
En el estudio de la estimación hay dos partes fundamentales:
1. La estimación puntual: trata de la construcción de la estimación y el

estudio de sus propiedades. Por ejemplo, el porcentaje muestral de
P es un posible estimador del porcentaje poblacional (p). igualmente, la
media maestral (x) y la varianza muestral (S2) son estimadores de la
media poblacional (µ) y la varianza poblacional (σ2).
2. Estimación por intervalos (o intervalos de confianza como también se
conoce) utiliza el estimador puntual para dar un intervalo con un límite
inferior y con un límite superior. Una estimación por intervalo es mucho
más útil que una estimación puntual ya que posee más información: no
solo da el valor estimado (0.35, por ejemplo) sino que también la presión;
(0,04. Por ejemplo) y el nivel de confianza (95%, por ejemplo) con el cual
se asegura el parámetro por estimar está conteniendo el intervalo.
2.2 CARACTERISTICA DE UN ESTIMADOR
SESGO. Un estimador es insesgo si la media de la

distribución del estimador es igual al parámetro.
estimador insesgados son la media muestral (estimador de la

media de la población) y varianza estimadora de la varianza de la
población.
EJEMPLO:
En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho
un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras=
100) y hallan que la Media de las Medias muestréales es igual a 5.09, (la media
poblacional y la media de las medias muestréales coinciden). En cambio, la
Mediana de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto
es, hay diferencia ya que la Mediana es un estimador sesgado.
La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas

obtenidas con la Varianza
en un muestreo de 1000 muestras (n=25) en que la Varianza de la población es

igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar
la Casi varianza
Ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha

resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que la
Media es un estimador más eficiente que la Mediana). la Media de las Varianzas
muestréales es igual a 9.5, esto es, coincide con la Varianza de la población ya
que la Cuasi varianza es un estimador insesgado.
CONSISTENCIA. Un estimador es consistente si

aproxima el valor del parámetro cuanto mayor es n
(tamaño de la muestra).
EJEMPLO:
En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho
tres muestreos aleatorios (número de muestras= 100) con los siguientes
resultados:
Vemos que el muestreo en que n=100 la Media de las Medias muestrales toma
el mismo valor que la Media de la población.
EFICIENCIA.
El estimador es más eficiente que otro si la varianza de la

distribución muestral del estimador es menor a la del otro estimador.
cuanto menor es la eficiencia, menor es la confianza de que el
estadístico obtenido en la muestra aproxime el parámetro población.
EJEMPLO:
La Varianza de la distribución muestral de la Media en un muestreo aleatorio
(número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la
distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este
resultado muestra que la Media es un estimador más eficiente que la Mediana).
SUFICIENTE.
Se dice que un buen estimador es suficiente

cuando resume toda la información relevante contenida en la
muestra, de forma ningún otro estimador pueda proporcionar
información adicional sobre el parámetro desconocido de la
población. por ejemplo, la media muestral sería un estimador
suficiente de la media poblacional, mientras que la moda no lo seria.
2.3 ESTIMACION PUNTUAL
La estimación puntual consiste en atribuir un valor (la estimación) al
parámetro poblacional. Si la muestra es representativa de la
población, podemos esperar que los estadísticos calculados en las
muestras tengan valores semejantes a los parámetros
poblacionales, y la estimación consiste en asignar los valores de los
estadísticos muestrales a los parámetros poblacionales. Los
estadísticos con que obtenemos las estimaciones se
denominan estimadores.
Esencialmente son tres los parámetros de interés:
- En el caso de que investiguemos una variable cuantitativa:
a) Para la media de la población μ tomaremos como aproximación la

media de la muestra.
b) Para la varianza de la población σ2 tomaremos la cuasi varianza

de la muestra.
Si el estudio se centra en el estudio de un carácter cualitativo el

parámetro de interés será la proporción de elementos de la
población que pertenecen a cierta categoría C que lo aproximaremos
con la correspondiente proporción en la muestra.
Ejemplo:
En el futuro habrá cada vez más interés en desarrollar aleaciones de
Mg de bajo costo, para varios procesos de fundición. En
consecuencia, es importante contar con métodos prácticos para
determinar varias propiedades mecánicas de esas aleaciones.
Examine la siguiente muestra de mediciones del módulo de elasticidad
obtenidos de un proceso de fundición a presión: 44.2 43.9 44.7 44.2
44.0 43.8 44.6 43.1 Suponga que esas observaciones son el resultado
de una muestra aleatoria. Se desea estimar la varianza poblacional
σ2. Un estimador natural es la varianza muestral:
2._Se desea estimar la Media de las puntuaciones del curso 2003/4,
pero solo se dispone de 50 puntuaciones seleccionadas
aleatoriamente. La Media de la muestra (el estimador), es igual a 5.6
y atribuimos este valor (la estimación) a la Media del curso completo.
Resumiendo:
2.4 ESTIMACION POR INTERVALOS
La estimación por intervalos consiste en establecer el intervalo de

valores donde es más probable se encuentre el parámetro. La
obtención del intervalo se basa en las siguientes consideraciones:
a) Si conocemos la distribución muestral del estimador podemos

obtener las probabilidades de ocurrencia de los estadísticos
muestrales.
b) Si conociéramos el valor del parámetro

poblacional, podríamos establecer la probabilidad de que el
estimador se halle dentro de los intervalos de la distribución
muestral.
c) El problema es que el parámetro poblacional es desconocido, y

por ello el intervalo se establece alrededor del estimador. Si
repetimos el muestreo un gran número de veces y definimos un
intervalo alrededor de cada valor del estadístico muestral, el
parámetro se sitúa dentro de cada intervalo en un porcentaje
conocido de ocasiones. Este intervalo es denominado "intervalo
de confianza".
EJEMPLOS
1. Una empresa de investigación llevo a cabo una encuesta para
determinar la cantidad media que los fundadores gastan en
cigarros durante una semana. La semana encontró que la
distribución de cantidades gastadas por semana tendía la seguir
una distribución normal, con una desviación estándar de $5. Una
muestra de 64 fumadores revelo que x=$20.
¿cuál es estimador de intervalo de confianza de 95% para
m(media).
 2.4.1 INTERVALO DE CONFIANZA PARA LA MEDIA
El intervalo de confianza describe la variabilidad entre la medida obtenida en un
estudio y la medida real de la población (el valor real). Corresponde a un rango
de valores, cuya distribución es normal y en el cual se encuentra, con alta
probabilidad, el valor real de una determinada variable. Esta alta probabilidad
se ha establecido por consenso en 95%. Así, un intervalo de confianza de 95%
nos indica que dentro del rango dado se encuentra el valor real de un parámetro
con 95% de certeza.
Rango de valores, derivado de los estadísticos de la muestra, que posiblemente
incluya el valor de un parámetro de población desconocido. Debido a su
naturaleza aleatoria, es poco probable que dos muestras de una población en
particular produzcan intervalos de confianza idénticos.
EJEMPLO:
Se encuentra que la concentración promedio de zinc de una muestra

de 36 cereales es de 2.6 gramos por miligramo. Encuentre los
intervalos de confianza de 95% y 99% para la concentración media
de zinc en el cereal. Suponga que la desviación estándar de la
población es 0.3. Solución: La estimación puntual de μ es x = 2.6 (el
valor de la media de la muestra). El valor de z para un nivel de
confianza del 95% es 1.96, por lo tanto:
2.4.2 INTERVALO DE CONFIANZA PARA LA
DIFERENCIA DE MEDIAS
Los intervalos de confianza para la diferencia de medias, se aplica

en situaciones como las siguientes; Comparación entre las
calificaciones promedio de cualquier examen, considerando a dos
grupos.
Las producciones promedio en una planta química que usa materias

primas suministradas por dos proveedores diferentes. El promedio
de diámetros de tallos de plantas crecidas con dos tipos diferentes
de nutrientes.
*INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE

MEDIAS DE DOS DISTRIBUCIONES NORMALES, VARIANZAS
DESCONOCIDAS
En esta sección se verá el caso en donde se tienen dos poblaciones

con medias y varianzas desconocidas, y se desea encontrar un
intervalo de confianza para la diferencia de dos medias 1- 2. Si
los tamaños de muestras n1 y n2 son mayores que 30, entonces,
puede emplearse el intervalo de confianza de la distribución normal.
Sin embargo, cuando se toman muestras pequeñas se supone que las
poblaciones de interés están distribuidas de manera normal, y los
intervalos de confianza se basan en la distribución t.
*INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE

MEDIAS DE DOS DISTRIBUCIONES NORMALES, VARIANZAS
DESCONOCIDAS PERO IGUALES
Si s12 y s22 son las medias y las varianzas de dos muestras
aleatorias de tamaño n1 y n2, respectivamente, tomadas de dos
poblaciones normales e independientes con varianzas desconocidas
pero iguales, entonces un intervalo de confianza del 100( ) por
ciento para la diferencia entre medias es:
en donde:
es el estimador combinado de la desviación estándar común de la

población con n1+n2 – 2 grados de libertad.
EJEMPLO
1.Una compañía de taxis trata de decidir si comprar neumáticos de

la marca A o de la B para su flotilla de taxis. Para estimar la
diferencia de las dos marcas, se lleva a cabo un experimento
utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se
desgastan, dando como resultado promedio para la marca A 36,300
kilómetros y para la marca B 38,100 kilómetros. Calcule un intervalo
de confianza de 95% para la diferencia promedio de las dos marcas,
si se sabe que las poblaciones se distribuyen de forma
aproximadamente normal con desviación estándar de 5000
kilómetros para la marca A y 6100 kilómetros para la marca B.
Como el intervalo contiene el valor “cero”, no hay razón para creer que el
promedio de duración del neumático de la marca B es mayor al de la marca A,
pues el cero nos está indicando que pueden tener la misma duración promedio
EJEMPLO 2
Los vuelos de una empresa de aviación tienen una duración bimestral
aproximadamente distribuida de forma normal con una desviación estándar de
40 horas. Si una muestra de 30 vuelos tiene una duración promedio de 780 horas,
encuentre los intervalos de confianza de 96% para la media de la población de
todos los vuelos de esta empresa.
Con un nivel de confianza del 96% se sabe que la duración media de los vuelos
está entre 765 y 795 horas.

2.4.3. INTERVALO DE CONFIANZA PARA LA PROPORCIÓN.
Dada una variable aleatoria con distribución Binomial B (n, p), el objetivo es la
construcción de un intervalo de confianza para el parámetro p, basada en una
observación de la variable que ha dado como valor x. El mismo caso se aplica si
estudiamos una Binomial B (1, p) y consideramos el número de veces que ocurre
el suceso que define la variable al repetir el experimento n veces en
condiciones de independencia.
Existen dos alternativas a la hora de construir un intervalo de confianza para

p:
 Considerar la aproximación asintótica de la distribución Binomial en la

distribución Normal.
 Utilizar un método exacto.
Aproximación asintótica
Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más

referenciada en la mayoría de textos de estadística. Se basa en la
aproximación
Que, trasladada a la frecuencia relativa, resulta
Tomando como estadístico pivote

que sigue una distribución N (0, 1), y añadiendo una corrección por continuidad
al pasar de una variable discreta a una continua, se obtiene el intervalo de
confianza asintótico:
Donde zα/2 es el valor de una distribución Normal estándar que deja a su

derecha una probabilidad de α/2 para un intervalo de confianza de (1 − α) · 100
%. Las condiciones generalmente aceptadas para considerar válida la
aproximación asintótica anterior son:
El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la

validez de la aproximación utilizada. Una información más general sobre los
intervalos de confianza asintóticos puede encontrase aquí.
Intervalo exacto
Aun cuando las condiciones anteriores no se verifiquen, es posible la

construcción de un intervalo exacto, válido siempre, pero algo más complicado
en los cálculos. Es posible demostrar que un intervalo exacto para el parámetro
p viene dado por los valores siguientes:
EJEMPLO
Un fabricante de reproductores de discos compactos utiliza un conjunto de

pruebas amplias para evaluar la función eléctrica de su producto. Todos los
reproductores de discos compactos deben pasar todas las pruebas antes de
venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15
que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90%
para la proporción de los reproductores de discos compactos de la población que
no pasarían todas las pruebas.
Se sabe con un nivel de

confianza del 90% que
la proporción de discos
defectuosos que no
pasan la prueba en esa
población está entre
0.0237 y 0.0376.
2.En un estudio de 300 accidentes de automóvil en una ciudad específica, 60

tuvieron consecuencias fatales. Con base en esta muestra, construya un
intervalo del 90% de confianza para aproximar la proporción de todos los
accidentes automovilísticos que en esa ciudad tienen consecuencias fatales.
2.4.4. INTERVALOS DE CONFIANZA PARA LA
DIFERENCIA DE PROPORCIONES.
Un estimador puntual de la proporción P en un experimento binomial está dado por la
estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por tanto, la
proporción de la muestra p =x/n se utilizará como estimador puntual del parámetro P.
Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se

puede establecer un intervalo de confianza para P al considerar la distribución
muestral de proporciones.
Al despejar P de esta ecuación nos queda:
En este despeje podemos observar que se necesita el valor del parámetro P y es

precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción
de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el

procedimiento del intervalo de confianza que se establece aquí no es confiable, por
tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o
igual a 5.
El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel
de confianza de que esta diferencia no excederá .
EJEMPLO
1. Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos
que no pasan la prueba en esa población está entre 0.0237 y 0.0376.
En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se

encontraron 20 defectuosas. Si la proporción p de pilas defectuosas en esa muestra
se usa para estimar P, que vendrá a ser la proporción verdadera de todas las pilas
defectuosas tipo B fabricadas por la Everlast Company, encuentre el máximo error de
estimación tal que se pueda tener un 95% de confianza en que P dista menos
de de p.
Solución:
p=x/n = 20/400=0.05
z (0.95) =1.96
Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista
menos de 0.021 de p. En otras palabras, si p=0.05 se usa para estimar P, el error
máximo de estimación será aproximadamente 0.021 con un nivel de confianza del 95%.
Para calcular el intervalo de confianza se tendría:
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se
sabe que la proporción de pulas defectuosas de esta compañía está entre 0.029 y
0.071.
Si se requiere un menor error con un mismo nivel de confianza sólo se necesita

aumentar el tamaño de la muestra.
2.4.5 INTERVALOS DE CONFIANZA PARA LA VARIANZA
Si tenemos una muestra de tamaño n tomada de una población normal, podemos
obtener un intervalo de confianza del nivel dado (90%, 95%, 99%, etc.) para la
varianza sabiendo que el valor de chi cuadrada es para este caso:
El cual es una variable aleatoria que tiene una distribución Chi cuadrada con n -
1 grados de libertad. Por lo tanto, podemos emplear esta definición para estimar
un intervalo de confianza ya que
lo que necesitamos es que:
Entonces podemos despejar la varianza σ2:
Los valores de Chi cuadrada
corresponden a lo que se muestra en la siguiente figura (notar que el valor mayor
define el límite de la izquierda del intervalo y el menor el derecho, ya que están
dividiendo). Corresponden a lo que se muestra en la siguiente figura (notar que

el valor mayor define el límite de la izquierda del intervalo y el menor el derecho,
ya que están dividiendo).
Por lo que el intervalo de confianza para la varianza estará dado por:
Podemos encontrar el intervalo de confianza
correspondiente para la desviación estándar,
σ, obteniendo las raíces cuadradas ces
cuadradas de los límites de confianza para la varianza.
EJEMPLO:
En 16 recorridos de prueba, el consumo de gasolina de un motor experimental tuvo
una desviación estándar de 2.2. Litros. Construir un intervalo de confianza del 99%
para la varianza y para la desviación estándar esperadas de este motor. Solución.
Suponiendo que los datos pueden considerarse como una muestra aleatoria tomada de
una población normal, usamos n = 16 y s=2.2. Ahora necesitamos los valores de Chi
cuadrada para el caso específico.
Por lo que el intervalo de confianza para la varianza estará dado por:
Es decir: 2.21 < σ <15.78
Y, por lo tanto, el intervalo de confianza para la desviación estándar sería:
1.49 < σ < 3.97 Litros

2.4.6 INTERVALO DE CONFIANZA PARA LA
RELACIÓNVARIANZAS
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos

poblaciones es evidente a partir del análisis de una sola población.Frecuentemente se
desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad
de un proceso de manufactura con la de otro o hasta la forma en que varía el
procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, ,

utilizando la razón de las varianzas muestrales:
y si es casi igual a 1, se tendrá poca evidencia para indicar que y no son i guales.
Por otra parte, un valor muy grande o muy pequeño para , proporcionará evidencia de
una diferencia en las varianzas de las poblaciones.
Para encontrar un intervalo de confianza para el cociente de dos varianzas, empleamos

la distribución Fisher que es similar a como hicimos en el caso de una sóla varianza
empleando la distribución chicuadrada, sólo que ahora usamos el estadístico definido
por:
Supóngase que se tienen dos poblaciones normales e independientes con varianzas

desconocidas , respectivamente. De este par de poblaciones, se tienen disponibles
dos muestras aleatorias de tamaños n 1 y n 2, respectivamente, sean las dos
varianzas muestrales. Si se desea, por ejemplo, conocer un intervalo de confianza del
95% por ciento para el cociente de las dos varianzas:
El caso de la distribución la F, para un nivel de confianza (por ejemplo de 95%) requiere

calcular los grados de libertad del numerador y del denominador, este ejemplo son 30 y
24 respectivamente:
Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales,
se coloca la varianza muestral mayor en el numerador del estadístico F.
Despejando:
Esto nos da permite calcular la probabilidad de que el cociente se encuentre entre dos
valores de F.
Para construir el intervalo de confianza empleamos entonces:
En este caso se requiere calcular los grados de libertad del numerador que son n1-1
(recordando que se toma a n1 como el tamaño de la muestra de la varianza más grande)
y los del denominador que son n2 -1.
Ejemplo. Una empresa fabrica propulsores. A los ingenieros les gustaría saber cuál de
dos procesos tiene la menor rugosidad en las superficies. Para ello se toman muestras
aleatorias de cada proceso.
Datos.
Proceso 1. n1 = 16 mm, s1 = 4.7

Proceso 2. n2 = 12 mm, s2 = 5.1
Por lo que el intervalo de confian za para el cociente de varianzas varianzas estará dado
por:
Y para las desviaciones estándar (calculamos la raíz cuadrada):
Como el intervalo de confianza incluye el valor de uno, no se puede concluir que exista
alguna diferencia entre la variabilidad de los dos procesos (es decir, el intervalo de
confianza incluye la posibilidad de que las dos desviaciones estándar sean iguales, por
lo que el cociente sería igual a uno).
2.5 DETERMINACIÓN DEL TAMAÑO DE
MUESTRA
En estadística el tamaño de la muestra es el número de sujetos que componen
la muestra extraída de una población, necesarios para que los datos obtenidos
sean representativos de la población.
Cálculo del tamaño de la muestra desconociendo el tamaño de la población.
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño

de la población es la siguiente:
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción).
Por ejemplo, en un estudio de investigación epidemiológico la determinación de
un tamaño adecuado de la muestra tendría como objetivo su factibilidad.
Así: Si el número de sujetos es insuficiente habría que modificar los criterios
de selección, solicitar la colaboración de otros centros o ampliar el período de
reclutamiento. Los estudios con tamaños muéstrales insuficientes, no son

capaces de detectar diferencias entre grupos, llegando a la conclusión errónea
de que no existe tal diferencia.
Si el número de sujetos es excesivo, el estudio se encarece desde el punto de
vista económico y humano. Además, es poco ético al someter a más individuos a
una intervención que puede ser menos eficaz o incluso perjudicial.
El tamaño de una muestra es el número de individuos que contiene.
Los valores de Zα más utilizados y sus niveles de confianza son:
Valor de Zα 1.28 1.65 1.69 1.75 1.81 1.88 1.96
Nivel de confianza 80% 90% 91% 92% 93% 94% 95%
(Por tanto, si pretendemos obtener un nivel de confianza del 95% necesitamos
poner en la fórmula Zα=1.96)
E: es el error muestral deseado, en tanto por ciento. El error muestral es la
diferencia que puede haber entre el resultado que obtenemos preguntando a una
muestra de la población y el que obtendríamos si preguntáramos al total de ella.
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían
un producto y tenemos un error muestral del 5% comprarán entre 95 y 105
personas.
Ejemplo 2: si hacemos una encuesta de satisfacción a los empleados con un error
muestral del 3% y el 60% de los encuestados se muestran satisfechos significa
que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa
lo estarán.
Otra fórmula para calcular el tamaño de la muestra es:
Donde:
n = el tamaño de la muestra.
N = tamaño de la población.
Desviación estándar de la población, que generalmente cuando no se tiene su valor,
suele utilizarse un valor estimado a ojo o a partir de una pequeña muestra o muestra
piloto. Para ser conservador (prudente), mejor errar estimando por exceso que por
defecto.
Zα: Valor obtenido mediante niveles de confianza. Es un valor constante que, si no
se tiene su valor, se lo toma en relación al 95% de confianza equivale a 1,64 (como
más usual) o en relación al 99% de confianza equivale 2,33, valor que queda a
criterio del encuestador.
e = Límite aceptable de error muestral que, generalmente cuando no se tiene su
valor, suele utilizarse un valor que varía entre el 1% (0,01) y 9% (0,09), valor que
queda a criterio del encuestador.
2.5.1 BASADO EN LA MEDIA DE LA POBLACIÓN
Si deseamos estimar una media debemos saber:
a. El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar

a un coeficiente (Zα). Para una seguridad del 95% = 1.96; para una seguridad del
99% = 2.58.
b. La precisión con que se desea estimar el parámetro (2 * d es la amplitud del

intervalo de confianza).
c. Una idea de la varianza S2 de la distribución de la variable cuantitativa que

se supone existe en la población.
Ejemplo: Si deseamos conocer la media de la glucemia basal de una población,

con una seguridad del 95 % y una precisión de ± 3 mg/dl y tenemos información
por un estudio piloto o revisión bibliográfica que la varianza es de 250 mg/dl.
Si la población es finita, como previamente se señaló, es decir conocemos el total

de la población y desearíamos saber cuántos del total tendríamos que estudiar,
la respuesta sería:
2.5.2 BASADO EN LA PROPORCION DE LA POBLACION
Si deseamos estimar una proporción, debemos saber:
a) El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar

a un coeficiente (Zα). Para una seguridad del 95% = 1.96, para una seguridad del
99% = 2.58.
b) La precisión que deseamos para nuestro estudio.
c) Una idea del valor aproximado del parámetro que queremos medir (en este
caso una proporción). Esta idea se puede obtener revisando la literatura, por
estudio pilotos previos. En caso de no tener dicha información utilizaremos el
valor p = 0.5 (50%).
Ejemplo: ¿A cuantas personas tendríamos que estudiar para conocer la

prevalencia de diabetes? Seguridad = 95%; Precisión = 3%: Proporción esperada
= asumamos que puede ser próxima al 5%; si no tuviésemos ninguna idea de dicha
proporción utilizaríamos el valor p = 0,5 (50%) que maximiza el tamaño muestral:
donde:
Zα 2 = 1.962 (ya que la seguridad es del 95%)
p = proporción esperada (en este caso 5% = 0.05)
q = 1 – p (en este caso 1 – 0.05 = 0.95)
d = precisión (en este caso deseamos un 3%)
Si la población es finita, es decir conocemos el total de la población y deseásemos

saber cuántos del total tendremos que estudiar la respuesta seria:
donde:
• N = Total de la población
• Zα 2 = 1.962 (si la seguridad es del 95%)
• p = proporción esperada (en este caso 5% = 0.05)
• q = 1 – p (en este caso 1-0.05 = 0.95)
• d = precisión (en este caso deseamos un 3%).
¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes

para conocer la prevalencia de diabetes? Seguridad = 95%; Precisión = 3%;
proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese
ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que
maximiza el tamaño muestral.
Según diferentes seguridades el coeficiente de Zα varía, así:
• Si la seguridad Zα fuese del 90% el coeficiente sería 1.645
• Si la seguridad Zα fuese del 97.5% el coeficiente sería 2.24

2.5.3. Determinacion del tamaño de la muestra
basado en la diferencia entre medias.
El error máximo que se puede tolerar en la estimación de la diferencia de medias
con varianzas poblaciones conocidas pero distintas, viene dado por:
Si la población es finita,se debe calcular el tamaño muestral mediante la

siguiente ecuación (Kerlinger y Lee):
donde n es el tamaño muestral para poblaciones finitas y el tamaño muestral

para poblaciones infinitas. Si por alguna razón no se quiere trabajar con la
relación , se debe fijar el porcentaje de la muestra 2 en relación a la

muestra 1 en una cantidad distinta al 50%:
De la misma manera, se pueden obtener otras ecuaciones similares cuando no se

conocen las varianzas poblacionales y se las debe estimar.
PREGUNTAS
1._ ¿QUÉ ES LA ESTIMACIÓN?
Es el proceso de inferir los posibles valores de alguna característica de la

población en base a la información contenida en una muestra aleatoria.
2._ ¿CUÁLES SON LAS CARACTERÍSTICAS DE UN ESTIMADOR?

Sesgo, consistencia y eficiencia.
3._ ¿EN QUE MOMENTO UN ESTIMADOR ES INSESGADO?

en el momento cuando la media de la distribución del estimador es igual al parámetro.
4._¿ A QUE SE LE ENTIENDE COMO ESTIMACION PUNTUAL?
Al valor que es extraído de la muestra para así poder estimar el parámetro desconocido de dicha
población.
5._ MENCIONA LA RAZON POR LA CUAL SE LLAMA ESTIMACION

PUNTUAL:
Se le llama estimación puntual porque a ese número que se utiliza como estimación del
parámetro θ, se le puede asignar un punto sobre la recta real.
6.- QUE SE DEBE SABER PARA EL CALCULO EN EL INTERVALO DE

CONFIANZA PARA LA DIFERENCIA DE MEDIAS:
saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean
desconocidas, se debe probar si son iguales o diferentes.
7._ ¿QUÉ MÉTODO SE EMPLEA PARA ENCONTRAR EL INTERVALO DE

CONFIANZA DE RELACIÓN ENTRE VARIANZAS?
el método de Fisher
8._ CUALES SON LOS OBJETIVOS DE LOS INTERVALOS DE CONFIANZA

ENTRE LA DIFERENCIA DE PROPORCIONES:
encontrar los límites de los intervalos de una diferencia de proporciones correspondiente a

dos muestras independientes
9._ ¿CUÁL ES LA FÓRMULA DISTRIBUCIÓN MUESTRAL DE
DIFERENCIA DE MEDIAS?
10._ ¿COMO SE JUSTIFICA UNA MUESTRA?

Se debe justificar convenientemente de acuerdo al planteamiento del problema, la
población, los objetivos y el propósito de la investigación.
11._MENCIONA EL PROPOSITO DE ESTIMAR

Para el Análisis de datos, tomar decisiones racionales, etc.
12._¿ EN QUE MÉTODOS SE BASA LA DETERMINACIÓN DE

MUESTRA?
Basado en la media de la población, basado en la proporción de la población y basado en
la diferencias de medias de la población.
BIBLIOGRAFIA
https://iescastelar.educarex.es/web/departamentos/mate
maticas/matematicasccss2ba/matematicas2ccss/testimacio
ndelamedia.htm
http://www.geociencias.unam.mx/~ramon/EstInf/Clase12.p
df
http://inferencial1.blogspot.mx/p/unidad-2.html

Estadistica Inferencial

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estadistica Inferencial

Uploaded by

Copyright:

Available Formats

INSTITUTO TECNOLOGICO DEL ISTMO

HEROICA CIUDADD DE JUCHITAN DE ZARAGOZA, OAXACA, A

En la estadística la estimación implica usar el valor en estadística

La estimación se puede generar mediante la proyección de los

Sin embargo, el punto de estimación es probable que sea incorrecto,

1. La estimación puntual: trata de la construcción de la estimación y el

SESGO. Un estimador es insesgo si la media de la

estimador insesgados son la media muestral (estimador de la

La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas

en un muestreo de 1000 muestras (n=25) en que la Varianza de la población es

Ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha

CONSISTENCIA. Un estimador es consistente si

El estimador es más eficiente que otro si la varianza de la

Se dice que un buen estimador es suficiente

a) Para la media de la población μ tomaremos como aproximación la

b) Para la varianza de la población σ2 tomaremos la cuasi varianza

Si el estudio se centra en el estudio de un carácter cualitativo el

2._Se desea estimar la Media de las puntuaciones del curso 2003/4,

pero solo se dispone de 50 puntuaciones seleccionadas

aleatoriamente. La Media de la muestra (el estimador), es igual a 5.6

y atribuimos este valor (la estimación) a la Media del curso completo.

La estimación por intervalos consiste en establecer el intervalo de

a) Si conocemos la distribución muestral del estimador podemos

b) Si conociéramos el valor del parámetro

c) El problema es que el parámetro poblacional es desconocido, y

El intervalo de confianza describe la variabilidad entre la medida obtenida en un

estudio y la medida real de la población (el valor real). Corresponde a un rango

de valores, cuya distribución es normal y en el cual se encuentra, con alta

probabilidad, el valor real de una determinada variable. Esta alta probabilidad

se ha establecido por consenso en 95%. Así, un intervalo de confianza de 95%

con 95% de certeza.

Rango de valores, derivado de los estadísticos de la muestra, que posiblemente

incluya el valor de un parámetro de población desconocido. Debido a su

naturaleza aleatoria, es poco probable que dos muestras de una población en

particular produzcan intervalos de confianza idénticos.

Se encuentra que la concentración promedio de zinc de una muestra

Los intervalos de confianza para la diferencia de medias, se aplica

Las producciones promedio en una planta química que usa materias

*INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE

En esta sección se verá el caso en donde se tienen dos poblaciones

*INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE

es el estimador combinado de la desviación estándar común de la

1.Una compañía de taxis trata de decidir si comprar neumáticos de

Los vuelos de una empresa de aviación tienen una duración bimestral

aproximadamente distribuida de forma normal con una desviación estándar de

encuentre los intervalos de confianza de 96% para la media de la población de

todos los vuelos de esta empresa.

está entre 765 y 795 horas.

Existen dos alternativas a la hora de construir un intervalo de confianza para

 Considerar la aproximación asintótica de la distribución Binomial en la

Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más

Que, trasladada a la frecuencia relativa, resulta

Tomando como estadístico pivote

Donde zα/2 es el valor de una distribución Normal estándar que deja a su

El intervalo obtenido es un intervalo asintótico y por tanto condicionado a la

Aun cuando las condiciones anteriores no se verifiquen, es posible la

Un fabricante de reproductores de discos compactos utiliza un conjunto de

Se sabe con un nivel de

2.En un estudio de 300 accidentes de automóvil en una ciudad específica, 60

Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se

Al despejar P de esta ecuación nos queda:

En este despeje podemos observar que se necesita el valor del parámetro P y es

Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el