Minitab Inferencia EDB 2017-II

Intervalos y
contrastes con
MINITAB
1
MODELOS DE PROBABILIDAD CON MINITAB
Intervalos y contrastes con

MINITAB
Índice
1. Intervalos de confianza y tamaño muestral
2. Contraste de hipótesis
2
Ejemplo: diámetro de un aro de pistón
Un fabricante de motores utiliza un proceso de forja

para producir aros de pistón. Queremos caracterizar a
la variable aleatoria ‘Diámetro interno’.
Se toma una muestra de 125 aros de pistón y se mide el
diámetro interno.
Calcular un intervalo de confianza para la media
Histograma de Diámetro
25
20 Como el tamaño de la muestra es muy grande, podemos

aplicar el intervalo de la media sin importarnos mucho
15
Frecuencia
cómo es la distribución de los datos, siempre y cuando no

10
tenga atípicos que sesguen la estimación de media y
cuasi-desv. típica.
5
0
73,97 73,98 73,99 74,00 74,01 74,02 74,03
Diámetro
3
(1   )
4
Resumen para Diámetro

P rueba de normalidad de A nderson-Darling
A -cuadrado 0,19
V alor P 0,892
M edia 74,001
D esv .E st. 0,010
V arianza 0,000
A simetría -0,114375
Kurtosis 0,379661
N 125
M ínimo 73,967
1er cuartil 73,994
M ediana 74,001
3er cuartil 74,008
73,97 73,98 73,99 74,00 74,01 74,02 74,03 M áximo 74,030
Interv alo de confianza de 95% para la media
73,999 74,003
Interv alo de confianza de 95% para la mediana
73,999 74,004
Interv alo de confianza de 95% para la desv iación estándar
Intervalos de confianza de 95%
0,009 0,012
Media
Mediana
74,000 74,002 74,004
Sˆ
Minitab siempre hace los intervalos con X  tn 1; /2 ¿Cuándo son fiables?
n
¿Por qué la mediana tiene un intervalo más ancho que la media?
5
Ejemplo: Duración de una transmisión telemática
El centro de computación de una agencia meteorológica envía de forma telemática a sus clientes información
en tiempo real sobre un conjunto de variables procedente de su red de estaciones. Se tiene una muestra de
la duración de dichas transmisiones recogidas de forma consecutiva.
Gráfica de series de tiempo de Duration

13
12
11
10
Duration
9
1 10 20 30 40 50 60 70 80 90 100
Índice
Calcula un intervalo de confianza para la media
6
En primer lugar vamos a eliminar el dato anómalo, que tiene un valor inferior a 5. Lo
hacemos creando una nueva hoja con los datos ‘buenos’.
7
Hacemos un resumen estadístico
Resumen para Duration

A -cuadrado 0,26
V alor P 0,692
M edia 10,013
Desv .E st. 1,200
Los datos se distribuyen como una V arianza
A simetría
1,439
0,0748536
normal, y no hay atípicos. El tamaño Kurtosis
N
-0,0423816
99
muestral es suficientemente grande M ínimo 7,087
por lo que el intervalo de confianza

1er cuartil 9,251
M ediana 9,970
es válido aunque la variable Duration

3er cuartil 10,721
7 8 9 10 11 12 13 M áximo 12,751
no fuese normal. Interv alo de confianza de 95% para la media

9,773 10,252
9,685 10,293
1,053 1,395
Media
Mediana
9,60 9,75 9,90 10,05 10,20
IC(95%)   9.77;10.25  10.01  0.24
8
Vamos a calcular cuál sería el tamaño muestral para reducir el intervalo. Vamos
a calcular el tamaño muestral para, por ejemplo, L=0.1.
Estadísticas>Potencia y tamaño de la muestra>Tamaño de la muestra para estimación
Se tendrá una nueva media

muestral. El intervalo será
x  0.1
9
Si no lo marcamos, asume que usamos ŝ
Si lo marcamos, asume que s es El intervalo se basa en la t de Student
conocida. El cálculo del tamaño muestral (implica población normal)
se basa en estos intervalos:
Sˆ
X  tn 1; /2
s n
x za / 2
n
sˆ
za / 2 z0.025 1.96 Sˆ 1.2
s 1.2 s L  tn 1; /2
L za / 2 n
n
No podemos despejar n, pues afecta a tn-1
Despejamos n
Se resuelve con un algoritmo de búsqueda
10
Ejemplo: Intervalo y tamaño muestral para una proporción
Con el objeto de determinar la proporción de personas que poseen coche en una provincia determinada se
realizó un muestreo aleatorio simple, de tal forma que de los 100 encuestados, 30 de ellos tienen coche.
Calcula un intervalo de confianza del 95% para la proporción de personas con coche en la provincia
Calcula n para que en un intervalo del 95%, se tenga L=0.02
Intervalo aproximado para muestras grandes : np(1- p)>5
Minitab usa una fórmula más exacta
p  (0.3  0.0876;0.3  0.0998)

 (0.21;0.40)
11
Ejemplo: Intervalo y tamaño muestral para una proporción
Con el objeto de determinar la proporción de personas que poseen coche en una provincia determinada se
realizó un muestreo aleatorio simple, de tal forma que de los 100 encuestados, 30 de ellos tienen coche.
Calcula un intervalo de confianza del 95% para la proporción de personas con coche en la provincia
Calcula n para que en un intervalo del 95%, se tenga L=0.02
Si no tenemos ningún estudio previo, ponemos una proporción

del 50%, que es el caso más desfavorable (mayor intervalo)
12
Ejemplo: Intervalo y tamaño muestral para una varianza
Un fabricante de motores utiliza un proceso de forja para

producir aros de pistón. Queremos caracterizar a la
variable aleatoria ‘Diámetro interno’.
Se toma una muestra de 125 aros de pistón y se mide el
diámetro interno.
Calcular un intervalo de confianza para la varianza
Histograma de Diámetro Minitab sólo calcula intervalos de confianza para la

25
varianza basados en las fórmulas para distribuciones
20
normales (ver diapositivas). Por tanto, en primer lugar
debemos verificar si podemos asumir normalidad. En
15 caso contrario, los intervalos van a ser erróneos.
Frecuencia
10 El histograma se asemeja a la normalidad y no hay

valores atípicos.
5
0
73,97 73,98 73,99 74,00 74,01 74,02 74,03
Diámetro
13
Resumen para Diámetro

A -cuadrado 0,19
V alor P 0,892
M edia 74,001
D esv .E st. 0,010
V arianza 0,000
A simetría -0,114375
Kurtosis 0,379661
N 125
M ínimo 73,967
1er cuartil 73,994
M ediana 74,001
3er cuartil 74,008
73,97 73,98 73,99 74,00 74,01 74,02 74,03 M áximo 74,030
Interv alo de confianza de 95% para la media
73,999 74,003
73,999 74,004
0,009 0,012
Media
Mediana
74,000 74,002 74,004
IC(95%) s 2  0.0092 ;0.0122 
14
IC(95%) s 2  0.0092 ;0.0122 
IC (95%) s   0.009;0.012 sˆ  0.010
Si queremos un intervalo más estrecho, con L=0.001:
15
Ejemplo: Intervalos cuando tenemos sólo las estimaciones
Ejemplo: En una explotación minera las rocas excavadas se someten a un análisis químico
para determinar su contenido de Cadmio (mg/kg). Después de analizar 25 rocas se
obtiene que x  9.77 ˆ s  3.164
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir
un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.

 Sˆ 

IC(1   ) :    X  tn 1; /2 

 n 

Para n=25
y a=0.05
a/2=0.025
t24;0.025  2.06
16
obtiene que x  9.77 ˆs  3.164
Estadísticas /Estadística básica/t de 1 muestra
17
Sˆ
tn 1; /2
n
IC(95%) :   9.77  1.306

18
Suponiendo que el contenido de Cadmio sigue una distribución normal:
• Calcula el número de rocas que debemos analizar para que el intervalo de la media del
95% tenga un margen de error de L=1.
• Calcula un intervalo de confianza del 95% para la desviación típica
• Calcula el número de rocas que debemos analizar para reducir a la mitad el intervalo
de confianza de la desviación típica calculado anteriormente
19
MODELOS DE PROBABILIDAD CON MINITAB
Intervalos y contrastes con

MINITAB
Índice
1. Intervalos de confianza y tamaño muestral
2. Contraste de hipótesis
CONTRASTE DE HIPÓTESIS CON MINITAB 16
INDICE
1. Contraste de hipótesis para la media usando muestras grandes
2. Contraste de hipótesis para la media con muestras pequeñas y distribuciones
normales.
3. Contraste de hipótesis para la varianza.
4. Contraste de hipótesis para una proporción.
NOTA: usaremos siempre =0.05. Por tanto:

• Los intervalos serán de nivel de confianza del 95%
• En los tests sólo rechazamos Ho si p-valor<0.05
21
1. Contraste de hipótesis para la media con muestras grandes
CASO 1:
Un fabricante de transistores del tipo NPN sabe que cuando su producción se

mantiene en los niveles de calidad usuales (en condiciones normales de
funcionamiento), el valor de la llamada Ganancia en Corriente de los transistores
sigue una distribución normal de media =290 y desviación típica s=27.57.
Se quiere contrastar si la media del proceso se mantiene. Para ello se toma una
muestra de 100 transistores (fichero transistorNPN.txt)
En este problema no usamos los datos para estimar los parámetros de la

población, sino para ver si ésta ha cambiado respecto a una situación previa.
Los datos se usarán para respaldar o desmentir hipótesis sobre la población
22
Hacemos un análisis descriptivo:
23
La variable no presenta atípicos. Es algo asimétrica positiva.
X  282.29 Vemos que las estimaciones tienen un valor diferente

al de las hipótesis. ¿Esa diferencia se debe a la
sˆ  27.69 variabilidad del muestreo o indican un cambio en la
población?
24
Como se trata de tamaño de muestra grande, n>30 podemos aplicar el

contraste de hipótesis para muestras grandes, aunque la variable no se
ajustase a una distribución normal.
X  0
Z ~ N (0,1)
s/ n
• Asume s conocida
• Asume muestra grande o
población normal
X  0
T ~ tn 1
ˆ
S/ n
• Estima s con la muestra
• No es necesaria muestra grande
si la población es normal.
25
Como se trata de tamaño de muestra grande, n>30, podemos aplicar el contraste de

hipótesis para muestras grandes, aunque la variable no se ajuste a una distribución normal.
26
Gain
Cuando no
tenemos todos
los datos pero
conocemos el
valor de la
media obtenida
con la muestra.
Se indica el nivel de
confianza ( =0.05) y si
la hipótesis alternativa
es igual, mayor o menor.
Hay que indicar la desviación típica poblacional s e indicar que se quiere realizar el contraste de
hipótesis. Si no, sólo hace el intervalo de confianza.
Se indica también el valor de la media hipotética (la que define el contraste de hipótesis)
27
H 0 :   290
H1 :   290
Gain
Calcula el intervalo de confianza

Calcula el p-valor=0.005 <0.05
para la media. Este intervalo no
contiene el valor 290. Podemos concluir con bastante seguridad (p-
valor=0.005) que la media ha cambiado. La
muestra contradice mucho a la ´hipótesis’ que
teníamos sobre la población. La diferencia
observada es ‘significativa’, es decir, mayor de lo
que cabría esperar por variabilidad de la muestra.
Se rechaza la hipótesis nula: La ganancia media de los transistores no es ya igual a 290.
28
Como la población puede asumirse normal (y además la muestra es

grande) podemos usar el test de la t, en el que se utiliza la cuasi-
desviación típica muestral
Gain
Ya no se pide el valor de la
desviación típica, automáticamente
la estima con la muestra
29
En este caso los resultados son muy parecidos a los obtenidos usando el estadístico Z. Se
concluye lo mismo: se rechaza la hipótesis nula, es decir, la ganancia media de los
transistores ya no es igual a 290.
p-valor<<<0.05 (5%)
30
2. Contraste para la media con muestras pequeñas pero normales
CASO 2:
Una línea de llenado de paquetes de detergente debe
introducir 4kg en cada paquete. Durante una semana, se
toma una muestra de 20 paquetes obteniendo los
valores (en gramos) del fichero Detergente.txt.
¿Puede decirse que el proceso está descentrado?
Hay dos opciones:

• que el proceso esté centrado   4000 Ho
• que el proceso no esté centrado   4000 H1
H 0 :   4000 Asumiremos que la Ho es

H1 :   4000 cierta salvo que la media
muestral se aleje mucho de
4000
31
Realizamos el estudio descriptivo de la variable
No presenta atípicos. Parece seguir una distribución normal X  3986

sˆ  28.31
32
A pesar de que el tamaño de muestra es pequeño, <30 , es posible utilizar los

contrastes estudiados, pues la población puede asumirse normal.
En este caso, como se estima s con la muestra se usará el estadístico t.
Nota: si la distribución no se ajustara a la normal, con n=20, no podríamos
aplicar los contrastes estudiados. Incluso aunque se conociera el valor de s
poblacional (es decir, aunque s no se estimara con la muestra)
Resultados
Se rechazar la hipótesis nula. Por tanto, el

proceso no está centrado en 4000g
33
¿Y qué sucedería si la desviación típica no fuese una estimación y fuese

un valor poblacional, igual a 25?
En ese caso se usa el estadístico Z.
Se rechaza la hipótesis nula. El proceso no está centrado en 4000g.
34
3. Contraste para la varianza con distribuciones normales
CASO 1 (cont)
Un fabricante de transistores del tipo NPN sabe que cuando su producción se

mantiene en los niveles de calidad usuales (en condiciones normales de
funcionamiento), el valor de la llamada Ganancia en Corriente de los transistores
sigue una distribución normal de media =290 y desviación típica s=27.57.
Se quiere contrastar si la variabilidad del porceso no ha aumentado. Para ello se
toma una muestra de 100 transistores (fichero transistorNPN.txt)
Hay dos opciones:

• ha aumentado la variabilidad s  27 .57 H1
• no ha aumentado la variabilidad
s  27 .57 H0
H 0 : s2  27.572 Asumiremos que la Ho es cierta

salvo que la cuasivarianza sea
mucho mayor que 27.572
H 1 : s2  27.572
35
Ya vimos anteriormente que podíamos asumir normalidad en la población. Teníamos

también que
sˆ  27.69  27 .57
por tanto, los datos hacen lo que dice H1. Necesitamos cuantificar si ese alejamiento respecto
de H0 es significativo o, por el contrario, puede explicarse por el azar del muestreo.
36
H 0 : s2  27.572
H 1 : s2  27.572
El p-valor es muy elevado. Los datos por

tanto no contradicen a H0. la diferencia
observada puede explicarse fácilmente
por la variabilidad el muestreo
37
4. Contraste de hipótesis para una proporción
CASO 3:
Cierto producto de electrónica posee cierta
prestación que encarece el producto, sin embargo
se cree que prácticamente nadie la usa. Se realiza
una encuesta a 200 usuarios y 17 de ellos usan
esta prestación.
¿Confirman los datos la sospecha de que menos del 10% de usuarios utilizan
esta prestación?
Hay dos opciones:

• esos usuarios son menos del 10% p  0.10 H1
• esos usuarios no son menos del 10% p  0.10 H0
H 0 : p  0.10 Asumiremos que la Ho es cierta salvo

H1 : p  0.10 que la proporción muestral sea muy
inferior al 10%
38
Si se cumple que np(1- p)>5 la distribución binomial (de p) se puede

aproximar a una normal. El intervalo de confianza sería:
Y se puede realizar un contraste de hipótesis basado en el estadístico Z

Por defecto el Minitab usa la distribución binomial (más exacto), pero se
puede pedir que use la aproximación a la normal
39
No tengo los datos, así que

indico la información
resumida
Si no se selecciona sólo
calcula el intervalo de
confianza
Si se selecciona esta opción utiliza

el ajuste para np(1-p)>5 (utiliza la
aproximación a la normal del
estimador de la proporción)
40
H 0 : p  0.10
H1 : p  0.10
El p-valor es mayor que 0.05

Intervalo de confianza, sólo límite
(5%). No podemos rechazar H0
superior. Es mayor que 10%
No se puede rechazar la hipótesis nula. Por tanto, los datos no permiten

asegurar que el porcentaje de usuarios que utiliza la prestación sea menor
del 10%.
41

Minitab Inferencia EDB 2017-II

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Minitab Inferencia EDB 2017-II

Uploaded by

Copyright:

Available Formats

Intervalos y

Intervalos y contrastes con

Un fabricante de motores utiliza un proceso de forja

20 Como el tamaño de la muestra es muy grande, podemos

cómo es la distribución de los datos, siempre y cuando no

Resumen para Diámetro

74,000 74,002 74,004

Gráfica de series de tiempo de Duration

Calcula un intervalo de confianza para la media

Hacemos un resumen estadístico

Resumen para Duration

por lo que el intervalo de confianza

es válido aunque la variable Duration

no fuese normal. Interv alo de confianza de 95% para la media

9,60 9,75 9,90 10,05 10,20

IC(95%)   9.77;10.25  10.01  0.24

Estadísticas>Potencia y tamaño de la muestra>Tamaño de la muestra para estimación

Se tendrá una nueva media

Intervalo aproximado para muestras grandes : np(1- p)>5

Minitab usa una fórmula más exacta

p  (0.3  0.0876;0.3  0.0998)

Si no tenemos ningún estudio previo, ponemos una proporción

Un fabricante de motores utiliza un proceso de forja para

Histograma de Diámetro Minitab sólo calcula intervalos de confianza para la

10 El histograma se asemeja a la normalidad y no hay

Resumen para Diámetro

74,000 74,002 74,004

IC(95%) s 2  0.0092 ;0.0122 

IC(95%) s 2  0.0092 ;0.0122 

IC (95%) s   0.009;0.012 sˆ  0.010

Si queremos un intervalo más estrecho, con L=0.001:

Estadísticas /Estadística básica/t de 1 muestra

IC(95%) :   9.77  1.306

• Calcula un intervalo de confianza del 95% para la desviación típica

Intervalos y contrastes con

NOTA: usaremos siempre =0.05. Por tanto:

Un fabricante de transistores del tipo NPN sabe que cuando su producción se

En este problema no usamos los datos para estimar los parámetros de la

Los datos se usarán para respaldar o desmentir hipótesis sobre la población

Hacemos un análisis descriptivo:

X  282.29 Vemos que las estimaciones tienen un valor diferente

Como se trata de tamaño de muestra grande, n>30 podemos aplicar el

Como se trata de tamaño de muestra grande, n>30, podemos aplicar el contraste de

Calcula el intervalo de confianza

Como la población puede asumirse normal (y además la muestra es

Hay dos opciones:

H 0 :   4000 Asumiremos que la Ho es

Realizamos el estudio descriptivo de la variable

No presenta atípicos. Parece seguir una distribución normal X  3986

A pesar de que el tamaño de muestra es pequeño, <30 , es posible utilizar los

Se rechazar la hipótesis nula. Por tanto, el

¿Y qué sucedería si la desviación típica no fuese una estimación y fuese

En ese caso se usa el estadístico Z.

Se rechaza la hipótesis nula. El proceso no está centrado en 4000g.

Un fabricante de transistores del tipo NPN sabe que cuando su producción se

Hay dos opciones:

H 0 : s2  27.572 Asumiremos que la Ho es cierta

Ya vimos anteriormente que podíamos asumir normalidad en la población. Teníamos

El p-valor es muy elevado. Los datos por

Hay dos opciones:

H 0 : p  0.10 Asumiremos que la Ho es cierta salvo

Si se cumple que np(1- p)>5 la distribución binomial (de p) se puede

Y se puede realizar un contraste de hipótesis basado en el estadístico Z

No tengo los datos, así que