You are on page 1of 41

Intervalos y

contrastes con
MINITAB

1
MODELOS DE PROBABILIDAD CON MINITAB

Intervalos y contrastes con


MINITAB

Índice
1. Intervalos de confianza y tamaño muestral
2. Contraste de hipótesis

2
Ejemplo: diámetro de un aro de pistón

Un fabricante de motores utiliza un proceso de forja


para producir aros de pistón. Queremos caracterizar a
la variable aleatoria ‘Diámetro interno’.
Se toma una muestra de 125 aros de pistón y se mide el
diámetro interno.
Calcular un intervalo de confianza para la media

Histograma de Diámetro
25

20 Como el tamaño de la muestra es muy grande, podemos


aplicar el intervalo de la media sin importarnos mucho
15
Frecuencia

cómo es la distribución de los datos, siempre y cuando no


10
tenga atípicos que sesguen la estimación de media y
cuasi-desv. típica.
5

0
73,97 73,98 73,99 74,00 74,01 74,02 74,03
Diámetro

3
Ejemplo: diámetro de un aro de pistón

(1   )

4
Ejemplo: diámetro de un aro de pistón

Resumen para Diámetro


P rueba de normalidad de A nderson-Darling
A -cuadrado 0,19
V alor P 0,892

M edia 74,001
D esv .E st. 0,010
V arianza 0,000
A simetría -0,114375
Kurtosis 0,379661
N 125

M ínimo 73,967
1er cuartil 73,994
M ediana 74,001
3er cuartil 74,008
73,97 73,98 73,99 74,00 74,01 74,02 74,03 M áximo 74,030
Interv alo de confianza de 95% para la media
73,999 74,003
Interv alo de confianza de 95% para la mediana
73,999 74,004
Interv alo de confianza de 95% para la desv iación estándar
Intervalos de confianza de 95%
0,009 0,012
Media

Mediana

74,000 74,002 74,004


Minitab siempre hace los intervalos con X  tn 1; /2 ¿Cuándo son fiables?
n
¿Por qué la mediana tiene un intervalo más ancho que la media?

5
Ejemplo: Duración de una transmisión telemática

El centro de computación de una agencia meteorológica envía de forma telemática a sus clientes información
en tiempo real sobre un conjunto de variables procedente de su red de estaciones. Se tiene una muestra de
la duración de dichas transmisiones recogidas de forma consecutiva.

Gráfica de series de tiempo de Duration


13

12

11

10

Duration
9

1 10 20 30 40 50 60 70 80 90 100
Índice

Calcula un intervalo de confianza para la media

6
Ejemplo: Duración de una transmisión telemática

En primer lugar vamos a eliminar el dato anómalo, que tiene un valor inferior a 5. Lo
hacemos creando una nueva hoja con los datos ‘buenos’.

7
Ejemplo: Duración de una transmisión telemática

Hacemos un resumen estadístico

Resumen para Duration


P rueba de normalidad de A nderson-Darling
A -cuadrado 0,26
V alor P 0,692

M edia 10,013
Desv .E st. 1,200
Los datos se distribuyen como una V arianza
A simetría
1,439
0,0748536
normal, y no hay atípicos. El tamaño Kurtosis
N
-0,0423816
99
muestral es suficientemente grande M ínimo 7,087

por lo que el intervalo de confianza


1er cuartil 9,251
M ediana 9,970

es válido aunque la variable Duration


3er cuartil 10,721
7 8 9 10 11 12 13 M áximo 12,751

no fuese normal. Interv alo de confianza de 95% para la media


9,773 10,252
Interv alo de confianza de 95% para la mediana
9,685 10,293
Interv alo de confianza de 95% para la desv iación estándar
Intervalos de confianza de 95%
1,053 1,395
Media

Mediana

9,60 9,75 9,90 10,05 10,20

IC(95%)   9.77;10.25  10.01  0.24

8
Ejemplo: Duración de una transmisión telemática

Vamos a calcular cuál sería el tamaño muestral para reducir el intervalo. Vamos
a calcular el tamaño muestral para, por ejemplo, L=0.1.

Estadísticas>Potencia y tamaño de la muestra>Tamaño de la muestra para estimación

Se tendrá una nueva media


muestral. El intervalo será

x  0.1

9
Si no lo marcamos, asume que usamos ŝ
Si lo marcamos, asume que s es El intervalo se basa en la t de Student
conocida. El cálculo del tamaño muestral (implica población normal)
se basa en estos intervalos:


X  tn 1; /2
s n
x za / 2
n

za / 2 z0.025 1.96 Sˆ 1.2
s 1.2 s L  tn 1; /2
L za / 2 n
n
No podemos despejar n, pues afecta a tn-1
Despejamos n
Se resuelve con un algoritmo de búsqueda
10
Ejemplo: Intervalo y tamaño muestral para una proporción

Con el objeto de determinar la proporción de personas que poseen coche en una provincia determinada se
realizó un muestreo aleatorio simple, de tal forma que de los 100 encuestados, 30 de ellos tienen coche.
Calcula un intervalo de confianza del 95% para la proporción de personas con coche en la provincia
Calcula n para que en un intervalo del 95%, se tenga L=0.02

Intervalo aproximado para muestras grandes : np(1- p)>5

Minitab usa una fórmula más exacta

p  (0.3  0.0876;0.3  0.0998)


 (0.21;0.40)

11
Ejemplo: Intervalo y tamaño muestral para una proporción

Con el objeto de determinar la proporción de personas que poseen coche en una provincia determinada se
realizó un muestreo aleatorio simple, de tal forma que de los 100 encuestados, 30 de ellos tienen coche.
Calcula un intervalo de confianza del 95% para la proporción de personas con coche en la provincia
Calcula n para que en un intervalo del 95%, se tenga L=0.02

Si no tenemos ningún estudio previo, ponemos una proporción


del 50%, que es el caso más desfavorable (mayor intervalo)

12
Ejemplo: Intervalo y tamaño muestral para una varianza

Un fabricante de motores utiliza un proceso de forja para


producir aros de pistón. Queremos caracterizar a la
variable aleatoria ‘Diámetro interno’.
Se toma una muestra de 125 aros de pistón y se mide el
diámetro interno.
Calcular un intervalo de confianza para la varianza

Histograma de Diámetro Minitab sólo calcula intervalos de confianza para la


25
varianza basados en las fórmulas para distribuciones
20
normales (ver diapositivas). Por tanto, en primer lugar
debemos verificar si podemos asumir normalidad. En
15 caso contrario, los intervalos van a ser erróneos.
Frecuencia

10 El histograma se asemeja a la normalidad y no hay


valores atípicos.
5

0
73,97 73,98 73,99 74,00 74,01 74,02 74,03
Diámetro

13
Ejemplo: Intervalo y tamaño muestral para una varianza

Resumen para Diámetro


P rueba de normalidad de A nderson-Darling
A -cuadrado 0,19
V alor P 0,892

M edia 74,001
D esv .E st. 0,010
V arianza 0,000
A simetría -0,114375
Kurtosis 0,379661
N 125

M ínimo 73,967
1er cuartil 73,994
M ediana 74,001
3er cuartil 74,008
73,97 73,98 73,99 74,00 74,01 74,02 74,03 M áximo 74,030
Interv alo de confianza de 95% para la media
73,999 74,003
Interv alo de confianza de 95% para la mediana
73,999 74,004
Interv alo de confianza de 95% para la desv iación estándar
Intervalos de confianza de 95%
0,009 0,012
Media

Mediana

74,000 74,002 74,004

IC(95%) s 2  0.0092 ;0.0122 

14
Ejemplo: Intervalo y tamaño muestral para una varianza

IC(95%) s 2  0.0092 ;0.0122 

IC (95%) s   0.009;0.012 sˆ  0.010

Si queremos un intervalo más estrecho, con L=0.001:

15
Ejemplo: Intervalos cuando tenemos sólo las estimaciones

Ejemplo: En una explotación minera las rocas excavadas se someten a un análisis químico
para determinar su contenido de Cadmio (mg/kg). Después de analizar 25 rocas se
obtiene que x  9.77 ˆ s  3.164
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir
un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.


 Sˆ 

IC(1   ) :    X  tn 1; /2 

 n 

Para n=25
y a=0.05

a/2=0.025

t24;0.025  2.06
16
Ejemplo: Intervalos cuando tenemos sólo las estimaciones

Ejemplo: En una explotación minera las rocas excavadas se someten a un análisis químico
para determinar su contenido de Cadmio (mg/kg). Después de analizar 25 rocas se
obtiene que x  9.77 ˆs  3.164
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir
un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.

Estadísticas /Estadística básica/t de 1 muestra

17
Ejemplo: Intervalos cuando tenemos sólo las estimaciones

Ejemplo: En una explotación minera las rocas excavadas se someten a un análisis químico
para determinar su contenido de Cadmio (mg/kg). Después de analizar 25 rocas se
obtiene que x  9.77 ˆ s  3.164
Suponiendo que el contenido de Cadmio sigue una distribución normal. Se quiere construir
un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.


tn 1; /2
n

IC(95%) :   9.77  1.306


18
Ejemplo: Intervalos cuando tenemos sólo las estimaciones

Ejemplo: En una explotación minera las rocas excavadas se someten a un análisis químico
para determinar su contenido de Cadmio (mg/kg). Después de analizar 25 rocas se
obtiene que x  9.77 ˆ s  3.164
Suponiendo que el contenido de Cadmio sigue una distribución normal:

• Calcula el número de rocas que debemos analizar para que el intervalo de la media del
95% tenga un margen de error de L=1.

• Calcula un intervalo de confianza del 95% para la desviación típica

• Calcula el número de rocas que debemos analizar para reducir a la mitad el intervalo
de confianza de la desviación típica calculado anteriormente

19
MODELOS DE PROBABILIDAD CON MINITAB

Intervalos y contrastes con


MINITAB

Índice
1. Intervalos de confianza y tamaño muestral
2. Contraste de hipótesis
CONTRASTE DE HIPÓTESIS CON MINITAB 16

INDICE
1. Contraste de hipótesis para la media usando muestras grandes
2. Contraste de hipótesis para la media con muestras pequeñas y distribuciones
normales.
3. Contraste de hipótesis para la varianza.
4. Contraste de hipótesis para una proporción.

NOTA: usaremos siempre =0.05. Por tanto:


• Los intervalos serán de nivel de confianza del 95%
• En los tests sólo rechazamos Ho si p-valor<0.05

21
1. Contraste de hipótesis para la media con muestras grandes

CASO 1:

Un fabricante de transistores del tipo NPN sabe que cuando su producción se


mantiene en los niveles de calidad usuales (en condiciones normales de
funcionamiento), el valor de la llamada Ganancia en Corriente de los transistores
sigue una distribución normal de media =290 y desviación típica s=27.57.
Se quiere contrastar si la media del proceso se mantiene. Para ello se toma una
muestra de 100 transistores (fichero transistorNPN.txt)

En este problema no usamos los datos para estimar los parámetros de la


población, sino para ver si ésta ha cambiado respecto a una situación previa.

Los datos se usarán para respaldar o desmentir hipótesis sobre la población

22
1. Contraste de hipótesis para la media con muestras grandes

Hacemos un análisis descriptivo:

23
1. Contraste de hipótesis para la media con muestras grandes
La variable no presenta atípicos. Es algo asimétrica positiva.

X  282.29 Vemos que las estimaciones tienen un valor diferente


al de las hipótesis. ¿Esa diferencia se debe a la
sˆ  27.69 variabilidad del muestreo o indican un cambio en la
población?

24
1. Contraste de hipótesis para la media con muestras grandes

Como se trata de tamaño de muestra grande, n>30 podemos aplicar el


contraste de hipótesis para muestras grandes, aunque la variable no se
ajustase a una distribución normal.

X  0
Z ~ N (0,1)
s/ n
• Asume s conocida
• Asume muestra grande o
población normal

X  0
T ~ tn 1
ˆ
S/ n
• Estima s con la muestra
• No es necesaria muestra grande
si la población es normal.

25
1. Contraste de hipótesis para la media con muestras grandes

Como se trata de tamaño de muestra grande, n>30, podemos aplicar el contraste de


hipótesis para muestras grandes, aunque la variable no se ajuste a una distribución normal.

26
1. Contraste de hipótesis para la media con muestras grandes

Gain
Cuando no
tenemos todos
los datos pero
conocemos el
valor de la
media obtenida
con la muestra.

Se indica el nivel de
confianza ( =0.05) y si
la hipótesis alternativa
es igual, mayor o menor.

Hay que indicar la desviación típica poblacional s e indicar que se quiere realizar el contraste de
hipótesis. Si no, sólo hace el intervalo de confianza.
Se indica también el valor de la media hipotética (la que define el contraste de hipótesis)

27
1. Contraste de hipótesis para la media con muestras grandes

H 0 :   290
H1 :   290

Gain

Calcula el intervalo de confianza


Calcula el p-valor=0.005 <0.05
para la media. Este intervalo no
contiene el valor 290. Podemos concluir con bastante seguridad (p-
valor=0.005) que la media ha cambiado. La
muestra contradice mucho a la ´hipótesis’ que
teníamos sobre la población. La diferencia
observada es ‘significativa’, es decir, mayor de lo
que cabría esperar por variabilidad de la muestra.
Se rechaza la hipótesis nula: La ganancia media de los transistores no es ya igual a 290.
28
1. Contraste de hipótesis para la media con muestras grandes

Como la población puede asumirse normal (y además la muestra es


grande) podemos usar el test de la t, en el que se utiliza la cuasi-
desviación típica muestral

Gain

Ya no se pide el valor de la
desviación típica, automáticamente
la estima con la muestra

29
1. Contraste de hipótesis para la media con muestras grandes

En este caso los resultados son muy parecidos a los obtenidos usando el estadístico Z. Se
concluye lo mismo: se rechaza la hipótesis nula, es decir, la ganancia media de los
transistores ya no es igual a 290.

p-valor<<<0.05 (5%)

30
2. Contraste para la media con muestras pequeñas pero normales

CASO 2:
Una línea de llenado de paquetes de detergente debe
introducir 4kg en cada paquete. Durante una semana, se
toma una muestra de 20 paquetes obteniendo los
valores (en gramos) del fichero Detergente.txt.
¿Puede decirse que el proceso está descentrado?

Hay dos opciones:


• que el proceso esté centrado   4000 Ho
• que el proceso no esté centrado   4000 H1

H 0 :   4000 Asumiremos que la Ho es


H1 :   4000 cierta salvo que la media
muestral se aleje mucho de
4000

31
2. Contraste para la media con muestras pequeñas pero normales

Realizamos el estudio descriptivo de la variable

No presenta atípicos. Parece seguir una distribución normal X  3986


sˆ  28.31

32
2. Contraste para la media con muestras pequeñas pero normales

A pesar de que el tamaño de muestra es pequeño, <30 , es posible utilizar los


contrastes estudiados, pues la población puede asumirse normal.
En este caso, como se estima s con la muestra se usará el estadístico t.
Nota: si la distribución no se ajustara a la normal, con n=20, no podríamos
aplicar los contrastes estudiados. Incluso aunque se conociera el valor de s
poblacional (es decir, aunque s no se estimara con la muestra)

Resultados

Se rechazar la hipótesis nula. Por tanto, el


proceso no está centrado en 4000g

33
2. Contraste para la media con muestras pequeñas pero normales

¿Y qué sucedería si la desviación típica no fuese una estimación y fuese


un valor poblacional, igual a 25?

En ese caso se usa el estadístico Z.

Se rechaza la hipótesis nula. El proceso no está centrado en 4000g.

34
3. Contraste para la varianza con distribuciones normales

CASO 1 (cont)

Un fabricante de transistores del tipo NPN sabe que cuando su producción se


mantiene en los niveles de calidad usuales (en condiciones normales de
funcionamiento), el valor de la llamada Ganancia en Corriente de los transistores
sigue una distribución normal de media =290 y desviación típica s=27.57.
Se quiere contrastar si la variabilidad del porceso no ha aumentado. Para ello se
toma una muestra de 100 transistores (fichero transistorNPN.txt)

Hay dos opciones:


• ha aumentado la variabilidad s  27 .57 H1
• no ha aumentado la variabilidad
s  27 .57 H0

H 0 : s2  27.572 Asumiremos que la Ho es cierta


salvo que la cuasivarianza sea
mucho mayor que 27.572
H 1 : s2  27.572
35
3. Contraste para la varianza con distribuciones normales

Ya vimos anteriormente que podíamos asumir normalidad en la población. Teníamos


también que
sˆ  27.69  27 .57
por tanto, los datos hacen lo que dice H1. Necesitamos cuantificar si ese alejamiento respecto
de H0 es significativo o, por el contrario, puede explicarse por el azar del muestreo.

36
3. Contraste para la varianza con distribuciones normales

H 0 : s2  27.572
H 1 : s2  27.572

El p-valor es muy elevado. Los datos por


tanto no contradicen a H0. la diferencia
observada puede explicarse fácilmente
por la variabilidad el muestreo

37
4. Contraste de hipótesis para una proporción

CASO 3:
Cierto producto de electrónica posee cierta
prestación que encarece el producto, sin embargo
se cree que prácticamente nadie la usa. Se realiza
una encuesta a 200 usuarios y 17 de ellos usan
esta prestación.
¿Confirman los datos la sospecha de que menos del 10% de usuarios utilizan
esta prestación?

Hay dos opciones:


• esos usuarios son menos del 10% p  0.10 H1
• esos usuarios no son menos del 10% p  0.10 H0

H 0 : p  0.10 Asumiremos que la Ho es cierta salvo


H1 : p  0.10 que la proporción muestral sea muy
inferior al 10%

38
4. Contraste de hipótesis para una proporción

Si se cumple que np(1- p)>5 la distribución binomial (de p) se puede


aproximar a una normal. El intervalo de confianza sería:

Y se puede realizar un contraste de hipótesis basado en el estadístico Z


Por defecto el Minitab usa la distribución binomial (más exacto), pero se
puede pedir que use la aproximación a la normal

39
4. Contraste de hipótesis para una proporción

No tengo los datos, así que


indico la información
resumida

Si no se selecciona sólo
calcula el intervalo de
confianza

Si se selecciona esta opción utiliza


el ajuste para np(1-p)>5 (utiliza la
aproximación a la normal del
estimador de la proporción)

40
4. Contraste de hipótesis para una proporción

H 0 : p  0.10
H1 : p  0.10

El p-valor es mayor que 0.05


Intervalo de confianza, sólo límite
(5%). No podemos rechazar H0
superior. Es mayor que 10%

No se puede rechazar la hipótesis nula. Por tanto, los datos no permiten


asegurar que el porcentaje de usuarios que utiliza la prestación sea menor
del 10%.

41

You might also like