You are on page 1of 67

UNIVERSIDAD CENTRAL DEL ECUADOR

FACULTAD DE CIENCIAS ADMINISTRATIVAS


MODALIDAD A DISTANCIA

SEMESTRE MARZO - AGOSTO 2018

UNIDAD DIDÁCTICA

ESTADISTICA APLICADA

Nivel: 6
Número de créditos: 5

TUTOR:
Econ. Héctor Cumbal Flores

Quito - Ecuador
INDICE

INTRODUCCIÓN ................................................................................................................................... 4
Caracterización de la materia ............................................................................................................... 4
Competencias a lograr: ......................................................................................................................... 4
Bibliografía básica ................................................................................................................................... 6
Orientaciones generales............................................................................................................................ 7
PRIMERA PARTE DE LA UNIDAD DIDÁCTICA. ......................................................................... 8
I. UNIDAD: Prueba de hipótesis para una muestra ............................................................................. 9
1.1 Conceptos principales .............................................................................................................. 9
1.2 Que es una prueba de hipótesis, procedimiento y tipos de pruebas de hipótesis ................... 10
1.3 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
conocida (muestras grandes) .............................................................................................................. 17
1.4 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
desconocida (muestras grandes) ......................................................................................................... 19
1.5 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
desconocida (muestras pequeñas) ...................................................................................................... 21
1.6 Pruebas de hipótesis para una proporción (muestras grandes) ............................................... 22
II. UNIDAD: Prueba de hipótesis para dos muestras ......................................................................... 25
2.1 Conceptos principales ............................................................................................................ 25
2.2 Prueba de hipótesis: diferencia de dos medias poblacionales (muestras grandes) ................. 26
2.3 Pruebas de hipótesis: diferencia de dos relaciones proporcionales ........................................ 28
2.4 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras pequeñas) ............. 29
2.5 Prueba de hipótesis con muestras dependientes (muestras pequeñas) ................................... 31
2.6 Comparación de muestras dependientes e independientes ..................................................... 33
SEGUNDA PARTE DE LA UNIDAD DIDACTICA ........................................................................... 34
III. UNIDAD: Análisis de varianza .................................................................................................. 35
3.1 Conceptos principales ............................................................................................................ 35
3.2 Comparación de dos varianzas poblacionales ........................................................................ 36
3.3 Suposiciones Anova ............................................................................................................... 38
3.4 Prueba Anova en una dirección .............................................................................................. 38
3.5 Inferencias acerca de pares de valores medios de tratamiento ............................................... 41
3.6 Análisis de varianza en dos direcciones ................................................................................. 44
IV. UNIDAD: Métodos no paramétricos ......................................................................................... 48
4.1 Introducción. .......................................................................................................................... 48

pág. 2
4.2 Prueba de bondad de ajuste. Frecuencias esperadas iguales. ................................................. 49
4.3 Prueba de bondad de ajuste. Frecuencias esperadas desiguales. ............................................ 51
4.4 Prueba de hipótesis de que la distribución es normal ............................................................. 52
4.5 Pruebas de independencia (tablas de contingencia) ............................................................... 55
IV. UNIDAD: Control estadístico de calidad ................................................................................... 58
4.1 Conceptos principales ............................................................................................................ 58
4.2 Diagramas de diagnóstico ...................................................................................................... 59
4.3 Diagrama de Pareto ................................................................................................................ 60
4.4 Diagramas de control de calidad ............................................................................................ 61
4.4.1 Diagrama de control para variables ................................................................................ 61

4.4.2 Diagrama de atributos .................................................................................................... 64

pág. 3
INTRODUCCIÓN

Caracterización de la materia.

Continuando con el estudio de la Estadística Inferencial; la asignatura de Estadística

Aplicada se enfoca en el estudio de las diferentes pruebas de hipótesis y finalmente culmina

con el estudio del Control Estadístico de Calidad.

Competencias a lograr:

Competencia genérica:

1. Interpreta y resuelve problemas de la realidad aplicando métodos de la investigación,

métodos propios de las ciencias, herramientas tecnológicas y variadas fuentes de

información científica, técnica y cultural con ética profesional, trabajo equipo y

respeto a la propiedad intelectual.

2. Demuestra en su accionar profesional valores universales y propios de la profesión en

diversos escenarios organizacionales y tecnológicos, fomentando el desarrollo de las

ciencias, las artes, el respeto a la diversidad cultural y equidad de género.

Competencias específicas:

1. Desarrolla el pensamiento lógico, independiente, crítico y creativo en la aplicación de

los conocimientos.

pág. 4
2. Propende a dar respuesta a las necesidades de la vida diaria dentro de la sociedad

actual, aplicando métodos de investigación, herramientas tecnológicas y estadísticas

con diversas fuentes de información; mostrando además liderazgo en el trabajo grupal.

3. Desarrolla habilidades para el análisis e interpretación de los resultados obtenidos con

la ayuda de las herramientas de la estadística descriptiva y la teoría de las

probabilidades.

Resumen de competencias por unidad

Unidades Competencias

UNIDAD No. 1 Poder usar las muestras para decidir si una población posee una
característica en particular.
Prueba de hipótesis
para una muestra

UNIDAD No. 2 Presentar un segundo método para obtener inferencias acerca de


parámetros poblacionales, probando hipótesis respecto a sus
Prueba de hipótesis
valores.
para dos muestras

UNIDAD NO. 3 Ampliar el análisis para la comparación de cualquier número de


Análisis de Varianza medias poblacionales, usando la técnica llamada Análisis de
Varianza.

UNIDAD No. 4 Usar métodos para probar hipótesis acerca de las probabilidades de
las categorías; y (como aplicación particular) probar la equivalencia
Métodos no
de más de dos proporciones binomiales
paramétricos.
Aplicaciones de la JI
cuadrada

pág. 5
Conocer algunas técnicas muy útiles que se usan en la industria para
controlar y mejorar la calidad de los productos manufacturados,
UNIDAD No. 5
además se mostrará cómo pueden utilizarse algunas de estas
Control Estadístico de
técnicas para el mejoramiento de la calidad de sistemas de
la Calidad
administración

Bibliografía básica

NOMBRE: Estadística Aplicada a los Negocios y Economía.


AUTORES: LIND / MARCHAL / WATHEN
EDICIÓN: 15ª Edición. EDITORIAL: McGrawHill. AÑO: 2012

Bibliografía adicional

Kazmier, ESTADISTICA APLICADA A LA ADMINISTRACION Y LA ECONOMIA,


Colección Schaum.

Shao, Stephen, ESTADISTICA PARA ECONOMISTAS Y ADMINISTRADORES DE


EMPRESAS.

Spiegel, Murray, ESTADISTICA, Colección Schaum.

Spiegel, Murray, PROBABILIDAD Y ESTADISTICA, Colección Schaum.

Stevenson, William, ESTADISTICA PARA ADMINISTRACION Y ECONOMICA.

Toranzo, Fausto, ESTADISTICA.

Ya Lung Chou, ANALISIS ESTADISTICO.

Andrango, Carrillo, ESTADISTICA BASICA Y APLICADA, SEGUNDA EDICION, QUITO


ECUADOR

pág. 6
Orientaciones generales

Importancia en la formación profesional

En la mayoría de los trabajos investigativos la parte medular es plantear una hipótesis y

probar si esta se acepta o se rechaza. Usualmente la población es tan grande que no es viable

estudiarla en su totalidad, por lo que se tiene que seleccionar una muestra representativa de

esta para ponerla a prueba y determinar si un enunciado es una afirmación razonable.

El Control Estadístico de la Calidad es un grupo de estrategias, técnicas y acciones de

una organización para asegurar que se está proporcionando un servicio de calidad o

produciendo un producto de calidad.

Relaciones con otras materias del plan

La Estadística Aplicada se relaciona directamente con las disciplinas de Investigación,

Investigación de Mercados, Administración de la Producción y Gestión de la calidad.

pág. 7
PRIMERA PARTE DE LA UNIDAD DIDÁCTICA.

La primera parte de esta unidad didáctica está compuesta por dos unidades: La unidad

uno que inicia el estudio de las pruebas de hipótesis; aquí aprenderemos a realizar pruebas

tanto para muestras grandes como pequeñas.

En la unidad dos, se continúa con el estudio de las pruebas de hipótesis para dos

muestras, tanto para medias como para las proporciones.

Objetivos de la primera parte

Al finalizar el estudio de esta primera parte estará en capacidad de aplicar la prueba de

hipótesis, tanto para una muestra como para dos muestras en los diferentes campos de la

administración.

pág. 8
I. UNIDAD: Prueba de hipótesis para una muestra

Competencias

El estudiante estará en capacidad de:

• Definir qué es una hipótesis y que es una prueba de hipótesis.

• Conocer acerca del procedimiento de 5 pasos para demostrar una Hipótesis.

• Distinguir entre una prueba de hipótesis con una o dos colas.

• Realizar una prueba de hipótesis para una media poblacional

• Utilizar el valor p.

• Definir nivel de significación, error tipo I y tipo II, valores críticos.

Contenidos

1.1 Conceptos principales

1.2 Que es una prueba de hipótesis procedimiento y casos de pruebas de hipótesis

1.3 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
conocida (muestras grandes)

1.4 Prueba de hipótesis para una media poblacional, con una desviación estándar poblacional
desconocida (muestras grandes)

1.5 Prueba de hipótesis para una proporción (muestras grandes)

1.1 Conceptos principales

Hipótesis estadística. - es una proposición o supuesto sobre los parámetros de una o más

poblaciones.

Hipótesis nula (Ho). - Afirmación o enunciado acerca del valor de un parámetro (población).

pág. 9
Hipótesis alternativa (H1). - Afirmación que se acepta si los datos muestrales proporcionan

evidencia de que la hipótesis nula es falsa.

Nivel de significancia. - Es la probabilidad de rechazar la hipótesis nula cuando en realidad es

verdadera.

Error tipo I (α). - Rechazar la hipótesis nula (Ho) siendo verdadera.

Error tipo II (β). - Aceptar la hipótesis nula (Ho) siendo esta falsa.

Valor estadístico de prueba. - Valor obtenido a partir de la información muestral, que se

utiliza para determinar si se rechaza la hipótesis nula.

Valor Crítico. - Número que es el punto divisorio entre la región de aceptación y la región de

rechazo, de la hipótesis nula (Ho).

1.2 Que es una prueba de hipótesis, procedimiento y tipos de pruebas de hipótesis

Una prueba de hipótesis empieza con una afirmación, o suposición, sobre un parámetro de la

población, como la media poblacional. Esta afirmación recibe el nombre de hipótesis. Una

hipótesis puede ser que la edad media de los profesores de la Universidad, es de 45 años,

como puede resultar muy oneroso o demorado estudiar a la población de profesores para

asegurarnos su edad real, se procede a probar esta afirmación en base al análisis de una

muestra de la población de profesores, para ello, se determina el valor de la media muestral

(estadístico muestral) y en base a ciertas reglas de decisión se acepta o rechaza la hipótesis.

Una media muestral de 20 años de los profesores causaría con certeza el rechazo de la

hipótesis. Sin embargo, suponga que la media de la muestra es de 44 años ¿Está lo bastante

cerca de 45 para aceptar la suposición de que la media de la población es de 45? ¿La

diferencia de 1 año entre las dos medias se podría atribuir al error de muestreo, o dicha

pág. 10
diferencia resulta estadísticamente significativa? Por tanto, una prueba de hipótesis es un

procedimiento basado en la evidencia muestral y en la teoría de la probabilidad, que se emplea

para determinar si la hipótesis es un enunciado razonable. La decisión a la que se llegue, tanto

si se acepta como si se rechaza la hipótesis puede conllevar a cometer un error. Los errores

que pueden cometerse en una prueba de hipótesis se presentan en los siguientes casos:

Hipótesis nula Se acepta Se rechaza


Verdadera Correcto Error Tipo I
Falsa Error tipo II Correcto

La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se

representa por (H0). Rechazar H0 implica aceptar una hipótesis alternativa (H1).

Esto significa que lo que queremos probar debemos formularlo como hipótesis alternativa H1,

y como hipótesis nula H0 poner su contrario para de esta forma al rechazar la H0, probar la

valides de la hipótesis alternativa.

Para realizar una prueba de hipótesis se sigue un procedimiento de 5 pasos:

a. Plantear la hipótesis nula (Ho) y la hipótesis alternativa (H1)

Es el paso más importante y de este depende el éxito de la prueba. Se pueden presentar tres

casos:

Primer caso Segundo caso Tercer caso


Prueba de dos colas Prueba de una cola Prueba de una cola
Ho:  = x Ho:   x Ho:   x
H1:   x H1:  < x H1:  > x
Nota: La condición de igualdad siempre aparece en Ho, nunca en H1

pág. 11
b. Seleccionar el nivel de significancia (α)

Se denota mediante la letra griega alfa (α). Se le llama también “nivel de riesgo”, por el

riesgo de rechazar la Hipótesis Nula cuando en realidad es verdadera. Hay tres niveles de

significancia que son los más utilizados:

α = 0.01 para control de calidad,

α = 0.05 para proyectos de consumo.

α = 0.1 para encuestas.

c. Calcular el valor estadístico de prueba

En muestras grandes (n ≥ 30) se utiliza la “Z” de la distribución Normal.

En muestras pequeñas (n < 30) se utiliza la “t” de la distribución de Student.

d. Formular la Regla de Decisión

Una regla de decisión es el enunciado de las condiciones según las cuales se aceptará o

rechazará la hipótesis nula.

Los valores de Z se encuentran en el Apéndice B1 del texto guía, (Áreas bajo la curva normal.)

Los valores de t se encuentran en el Apéndice B2 del texto guía, (Distribución t de Student,

siendo necesario establecer los grados de libertad n – 1 para una muestra).

Para poder formular la regla de decisión se debe remitir al paso 1 y 2.

pág. 12
A continuación, se revisará cada uno de los casos de una prueba de hipótesis:

Primer caso. - Prueba de dos colas

Ho: µ = x
H1: µ ≠ x
α = 0.01

Es una prueba de dos colas ya que la media muestral puede ser mayor o menor que la media

poblacional en consecuencia hay que encontrar dos valores críticos, a partir de los cuales se

pude rechazar la hipótesis nula; por este motivo, al nivel de significancia hay que dividirlo

para dos: α= 0.01/2 = 0,005

Rechazo Ho Acepto Ho Rechazo Ho

0,005 0,495 0,495 0,005

VC = -2.58 VC = 2,58

El valor crítico se busca en el apéndice B1: el área más próxima a 0,495 corresponde a Z igual

a 2,58

La regla de decisión se plantea de la siguiente manera:

Si Z < -2,58 o Z > 2,58 se rechaza la Ho y se acepta la H1

Segundo caso. - Prueba de una cola

Ho: µ ≥ x

pág. 13
H1: µ < x
α = 0.10

Es una prueba de una cola y la región de rechazo de Ho se ubica en el sentido que indique el

vértice de la desigualdad de H1.

En este caso (H1: µ < x) este vértice apunta a la izquierda por lo que se debe ubicar la región

de rechazo en el lado izquierdo de la distribución.

Rechazo Ho acepto Ho

0,10 0,40 0,50

VC = -1.28

El valor crítico se busca en el apéndice B1: el área más próxima a 0,40 corresponde a Z igual a

1,28 (como el valor está por debajo de la media lo acompañamos con el signo menos)

La regla de decisión se plantea de la siguiente manera:

Si Z < -1,28 se rechaza la Ho y se acepta la H1

Tercer caso. - Prueba de una cola

Ho:   x
H1:  > x
α = 0.05

pág. 14
Es una prueba de una cola y la región de rechazo de Ho se ubica en el sentido que indique el

vértice de la desigualdad de H1.

En este caso (H1:  > x) este vértice apunta a la derecha, por lo que hay que ubicar la región de

rechazo en el lado derecho de la distribución.

Acepto Ho Rechazo Ho

0,50 0,45 0,05

VC = 1,65
El valor crítico se busca en el apéndice B1, el área más próxima a 0,45 corresponde a Z de

1,65.

La regla de decisión se plantea de la siguiente manera:

Si Z > 1,65 se rechaza Ho y se acepta la H1

Para el cálculo del valor crítico en una muestra pequeña (n < 30) se sigue el mismo
procedimiento anterior, con la diferencia que el valor crítico no se lo calcula con la
Distribución Normal, sino con la Distribución t de Student, por consiguiente, tiene
que considerar los grados de libertad (n - 1).

e. Tomar la decisión

Para tomar la decisión debes comparar el valor obtenido en el paso tres (valor de Z o t

calculado a partir de la muestra) con la regla de decisión formulada en el paso cuatro.

pág. 15
Por ejemplo, si:

• En el paso 3, Z = 2,60

• En el paso 4, la regla: Si Z > 1,65 se rechaza Ho y se acepta H1

Entonces la decisión se plantea de la siguiente manera:

Como 2,60 > 1,65 se rechaza Ho y se acepta H1

Valor de p (Potencia)

Se utiliza el valor p, que es la probabilidad de observar un valor muestral tan extremo o más,

que el valor calculado, dado que la hipótesis nula es verdadera.

Por ejemplo

• La regla de decisión es: Si Z > 2,58 se rechaza Ho y se acepta H1

• El valor calculado de Z es igual a 1.55

• En este caso no se rechazaría Ho.

• Para Z=1.55 el área es 0.439, entonces p = 0.500 – 0.439 = 0.061

• Para el caso de dos colas se considerará p/2, por lo que se deberá duplicar el valor

encontrado para determinar el valor de p.

• Si el valor de p es menor que el nivel de significancia (α), se rechaza Ho, si es mayor

que dicho nivel, no se rechaza Ho.

Para interpretar el valor de p se establece que:

Si el valor de p es menor que:

0.10, se tiene regular evidencia de que Ho no es verdadera.

pág. 16
0.05, se tiene fuerte evidencia de que Ho no es verdadera.

0.01, se tiene muy fuerte evidencia de que Ho no es verdadera.

0.001, se tiene evidencia extremadamente fuerte de que Ho no es verdadera

En el caso de t, por ejemplo, si α = 0.02 y tenemos 11 grados de libertad y el valor calculado

es 2.91, entonces según la hilera “11 grados de libertad” del Apéndice B2…

g.l 0.20 0.10 0.05 0.02 0.01 0.001


11 1.363 1.796 2.201 2.718 3.106 4.437

…el valor calculado 2.91 está entre 2.718 para α = 0.02 y 3.106 para α = 0.01

El valor de p se encuentra entre 0.01 y 0.02, por lo que p es menor que 0.02.

1.3 Prueba de hipótesis para una media poblacional, con una desviación estándar
poblacional conocida (muestras grandes)

Para esta prueba se debe seguir los cinco pasos descritos anteriormente y como valor

estadístico de prueba (paso tres) se utiliza la siguiente fórmula:

X 
Z
/ n

Ejemplo 1

De acuerdo con la asociación de plomeros de Quito, el ingreso medio anual de los plomeros

tiene una distribución normal, con una media de $5000 y una desviación estándar de $420.

pág. 17
Una investigación en una muestra de 100 plomeros encontró que el ingreso medio anual era de

$5100. Al nivel de significancia de 0.10, ¿se puede concluir que el ingreso medio anual no es

igual a $5000? Determine el valor de p

Datos: µ =5000; σ =420; n=100; X = 5100

Primer Paso: Plantear las hipótesis (ver la pregunta del ejercicio y plantear en H1)
Ho: µ = 5000
H1: µ ≠ 5000

Prueba de 2 colas

Segundo Paso: Nivel de significancia 0,10

Tercer Paso: Valor estadístico de prueba

5100  5000
Z  2,38
420 / 100

Cuarto Paso: Plantear la regla de decisión

α = 0.10/2 = 0,05

Rechazo Ho Acepto Ho Rechazo Ho

0,05 0,4500 0,4500 0,05

VC = -1,65 VC = 1,65

Si Z <- 1,65 o si Z>1,65 se rechaza la Ho y se acepta la H1

pág. 18
Quito Paso: Tomar la decisión

Como Z (2,38) > 1,65 se rechaza la Ho y se acepta la H1

Valor de p

Rechazo Ho Acepto Ho Valor de p

0,4913

VC = -1,65 VC = 1,65 2,38


El área de Z=2,38 es 0,4913

p = 0.5000 - 0,4913 = 0,0087

Como es una prueba de dos colas hay que multiplicar por 2

p = 0,0087 x 2 = 0,0174

1.4 Prueba de hipótesis para una media poblacional, con una desviación estándar
poblacional desconocida (muestras grandes)

Para esta prueba debe seguir los cinco pasos descritos anteriormente y como valor estadístico de
prueba (paso tres) se utiliza la siguiente formula
x
Z
s/ n
Ejemplo 2

Una empresa de bienes raíces de Guayaquil, se especializa en la venta de propiedades rurales.


Sus registros indican que el tiempo medio de venta de una granja es de 90 días. Debido a
recientes condiciones de sequía, estima que el tiempo de venta medio será ahora mayor de 90
días.

pág. 19
Un estudio de 100 granjas vendidas recientemente reveló que el tiempo de venta medio era de
94 días, con una desviación estándar de 22 días. Al nivel de significancia de 0.10 ¿Se puede
concluir que el tiempo de venta ha aumentado? Determine el valor de p.

Datos: =90; n=100; X = 94; S=22

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho:   90
H1:  > 90
Prueba de 1 cola
Segundo Paso: Nivel de significancia 0,10

Tercer Paso: Valor estadístico de prueba


94  90
Z  1,82
22 / 100
Cuarto Paso: Plantear la regla de decisión

Acepto Ho Rechazo Ho

0,400 0,10
VC = 1,28

Si Z >1,28 se rechaza la Ho y se acepta la H1

Quito Paso: Tomar la decisión

Como Z (1,82) > 1,28 se rechaza la Ho y se acepta la H1

pág. 20
Valor de p

Acepto Ho Valor de p

0,4656

0
VC = 1,28 1,82
El área de Z=1,82 es 0,4656
p = 0.5000 – 0.4656 = 0.0344

1.5 Prueba de hipótesis para una media poblacional, con una desviación estándar
poblacional desconocida (muestras pequeñas)

Para esta prueba se debe seguir los cinco pasos descritos anteriormente y como valor estadístico
de prueba (paso tres) se utiliza la siguiente formula

x
t
s/ n

Ejemplo 3

El fabricante de la motocicleta Yamaha anuncia que su vehículo rinde en promedio 87


kilómetros por galón en viajes largos. El recorrido en kilómetros en ocho viajes prolongados
fue:

88 82 81 87 80 78 79 89

Al nivel de 0.05, ¿el kilometraje medio es menor que el anunciado?

Datos:  = 87; n = 8; X = 83; S = 4.34

Del conjunto de datos debe calcular la media y la desviación estándar.

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)

pág. 21
Ho:  87
H1:  < 87
Prueba de 1 cola

Segundo Paso: Nivel de significancia 0,05

Tercer Paso: Valor estadístico de prueba

83  87
t  2,61
4,34 / 8

Cuarto Paso: Plantear la regla de decisión. (Apéndice B2)

Α = 0,05 y gl = n-1 = 8-1 = 7

Rechazo Ho Acepto Ho

VC = -1,895

Si t < -1,895 se rechaza la Ho y se acepta la H1

Quito Paso: Tomar la decisión

Como t (-2,61) < -1,895 se rechaza la Ho y se acepta la H1

1.6 Pruebas de hipótesis para una proporción (muestras grandes)

Con alguna frecuencia se desea hacer una estimación de la proporción de sujetos que componen
una población y poseen una característica de interés (variable cualitativa).

pág. 22
Generalmente, no es práctico examinar una población entera para determinar “”, proporción
verdadera que posee la característica de interés.

En lugar de esto, se toma una muestra aleatoria de la población y se utiliza la proporción


muestral “p”, para hacer una estimación de .

La fórmula para calcular una proporción muestral es: p = x / n

Para esta prueba debe seguir los cinco pasos descritos anteriormente y como valor estadístico de
prueba (paso tres) se utiliza la siguiente formula

p 
Z
 (1   ) / n

Ejemplo 4

Una empresa informa que el 52% de los automovilistas que usan las autopistas son varones.
Una muestra de 300 autos que viajaron por una autopista, reveló que 170 fueron conducidos por
hombres. Al nivel de significancia de 0.01, ¿se puede concluir que la proporción de varones que
conducen por la autopista es mayor que lo que indica la empresa de investigación?

Datos:  =0,52; n=300; X=170


p = 170/300 = 0,57

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho: π  0,52
H1: π >0,52
Prueba de 1 cola

Segundo Paso: Nivel de significancia 0,01

Tercer Paso: Valor estadístico de prueba

0,57  0,52
Z  1,74
0,52(1  0,52) / 300

Cuarto Paso: Plantear la regla de decisión

pág. 23
Acepto Ho Rechazo Ho
0, 490 0,01
VC = 2,33

Si Z es > 2,33 se rechaza la Ho y se acepta la H1

Quito Paso: Tomar la decisión

Como Z (1,74) es < 2,33 se acepta la Ho

pág. 24
II. UNIDAD: Prueba de hipótesis para dos muestras

Competencias

El estudiante estará en capacidad de:

 Probar hipótesis de la diferencia entre dos medias para muestras grandes.

 Probar hipótesis de la diferencia entre dos medias para muestras pequeñas.

 Probar hipótesis de la diferencia entre dos proporciones.

 Entender la diferencia entre muestras dependientes y muestras independientes.

 Realizar una prueba de Hipótesis respecto a la diferencia media entre observaciones

pareadas.

Contenidos

2.1 Conceptos principales

2.2 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras grandes)

2.3 Pruebas de hipótesis: diferencia de dos relaciones proporcionales

2.4 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras pequeñas)

2.5 Prueba de hipótesis con muestras dependientes (muestras pequeñas)

2.6 Comparación de muestras dependientes e independientes

2.1 Conceptos principales

Muestras dependientes. - Se caracterizan porque se hace una medición, después una

intervención, y de nuevo se realiza una medición.

pág. 25
Muestras independientes. - Cuando las muestras tomadas aleatoriamente no están

relacionadas una con otra.

Varianza conjunta. - Promedio ponderado de las dos varianzas que se usa para estimar la

varianza común, cuando se usa muestras pequeñas para probar la diferencia entre dos medias

poblacionales.

2.2 Prueba de hipótesis: diferencia de dos medias poblacionales (muestras grandes)

El siguiente tema, analiza cómo se puede aplicar la prueba de hipótesis para comparar dos

poblaciones. Muchas preguntas importantes pueden resolverse comparando dos poblaciones.

Con frecuencia los datos disponibles para el análisis se obtienen de dos muestras (una de cada

población).

Fórmula para calcular el valor estadístico de prueba:

X1  X 2 X1  X 2
Z o Z
 21  22 S 21 S 2 2
 
n1 n2 n1 n2

Suposiciones necesarias para emplear las fórmulas anteriores

• Las dos poblaciones siguen distribuciones normales.

• Las dos muestras no deben estar relacionadas, es decir, deben ser independientes.

• Debe conocerse la desviación estándar de las dos poblaciones.

Ejemplo 1

pág. 26
Una empresa desea determinar si se producen más unidades en el turno de la tarde que en el

primero. Una muestra de 54 trabajadores del primer turno mostró que el número medio de

unidades producidas fue de 345, con una desviación estándar de 21. Una muestra de 60

trabajadores del turno vespertino indicó que el número medio de unidades producidas fue de

351, con una desviación estándar de 28 unidades. Al nivel de significancia de 0.05, ¿es mayor el

número de unidades elaboradas en el turno de la tarde?

Datos: n1=54; X 1 =345; S 1 =21

n2=60; X 2 =351; S 2 =28

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho: 1  2
H1: 1 < 2

Segundo Paso: Nivel de significancia α = 0,05

Tercer Paso: Valor estadístico de prueba

345  351
Z  1,30
212 28 2

54 60

Cuarto Paso: Plantear la regla de decisión.

Rechazo Ho Acepto Ho

0,05 0,4500

VC = -1,65

pág. 27
Si Z<-1,65 se rechaza la Ho y se acepta la H1

Quito Paso: Tomar la decisión

Como Z (-1,30) > -1,65 se acepta la Ho

2.3 Pruebas de hipótesis: diferencia de dos relaciones proporcionales

A menudo se necesita comparar dos proporciones poblacionales. Un investigador puede estar


interesado en saber la magnitud de la diferencia entre la proporción de dos procesos A y B.

Un estimador puntual de 1 - 2 es la diferencia entre dos proporciones calculadas a partir de


muestras aleatorias independientes tomadas de las dos poblaciones.

Fórmula para calcular el valor estadístico de prueba:

x1  x 2
pc 
n1  n 2

p1  p 2
Z
p c (1  p c ) p c (1  p c )

n1 n2

Ejemplo 2

Una muestra de 1000 ciudadanos estadounidenses reveló que 198 estaban a favor de la
reanudación de las relaciones diplomáticas con Cuba. De manera semejante, 117 de una muestra
de 500 ciudadanos nacidos en el extranjero estaban a favor de ello. Al nivel de significancia de
0.05 ¿Existe alguna diferencia en la proporción de ciudadanos estadounidenses y los nacidos en
el extranjero, que están a favor de reanudar las relaciones diplomáticas?

Datos: n1=1000; X1=198; p1=198/1000 = 0,20


n2=500; X2=117; p2=117/500=0,23

pág. 28
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 1= 2
H1: 1 2
Prueba de 2 colas

Segundo Paso: Nivel de significancia 0,05

Tercer Paso: Valor estadístico de prueba

198  117
pc   0,21
1000  500

0,20  0,23
Z  1,34
0,21(1  0,21) 0,21(1  0,21)

1000 500

Cuarto Paso: Plantear la regla de decisión. (Apéndice B1)

α= 0,05 /2=0,025
Rechazo Ho Acepto Ho Rechazo Ho

0,025 0,475 0,475 0,025

VC= -1,96 VC=1,96

Si Z <- 1,96 o si Z>1,96 se rechaza la Ho y se acepta la H1

Quito Paso: Tomar la decisión

Como Z (-1,34) > -1,96 se acepta la Ho

CICIO 7

2.4 Pruebas de hipótesis: diferencia de dos medias poblacionales (muestras pequeñas)

En este tema debes tener en cuenta las siguientes consideraciones:

pág. 29
 Las poblaciones muestreadas siguen la distribución normal.

 Las dos muestras provienen de poblaciones independientes.

 Las desviaciones estándar de las dos poblaciones son iguales.

 Fórmula para calcular el valor estadístico de prueba:


n1  1S12  n2  1S 22 X1  X 2
t
2
S
n1  n2  2
p
1 1
S p2   
 n1 n2 

Ejemplo 3

Un psicólogo seleccionó una muestra de 12 mujeres y otra de 9 hombres. Luego pidió a cada

individuo que dibujara una figura masculina. El tiempo promedio que gastaron las mujeres fue

de 8 minutos, con varianza de 18. Para los hombres el tiempo fue de 13 minutos, con varianza

de 22,5. Indican estos datos que los hombres en promedio gastan más tiempo que las mujeres

cuando dibujan una figura masculina? Utilizar un nivel de significación 0,05

2
Datos: n1 =12; X 1 =8; S 1 =18
n 2 =9; X 2 =13; S 22 =22,5

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho: 1  2
H1: 1< 2
Prueba de 1 cola

Segundo Paso: Nivel de significancia 0,05

pág. 30
Tercer Paso: Valor estadístico de prueba

S p2 
12  118  9  122,5  19,89
12  9  2 (Varianza combinada)

8  13
t  2.54
 1 1
19,89  
 12 9 

Cuarto Paso: Plantear la regla de decisión. (Apéndice B2)


α= 0,05 y gl= n1+ n2-2 =12+9-2 = 19

Rechazo Ho Acepto Ho

VC = -1,729

Si t<-1,729 se rechaza la Ho y se acepta la H1

Quito Paso: Tomar la decisión

Como t(-2,54) < -1,729 se rechaza la Ho y se acepta la H1

2.5 Prueba de hipótesis con muestras dependientes (muestras pequeñas)

Con frecuencia los datos disponibles para el análisis se obtienen de dos muestras que no son
independientes.

Un procedimiento comúnmente usado que da como resultado dos muestras no independientes es


la denominada prueba “antes y después”.

Las mediciones se hacen sobre la muestra de sujetos tanto antes como después de la
introducción de algún fenómeno.

pág. 31
Los métodos que se acaban de estudiar en las secciones anteriores no se pueden aplicar cuando
las dos muestras que generan los datos están relacionadas, puesto que tales métodos están
sujetos a la condición de que las dos muestras sean independientes.

Fórmula para calcular el valor estadístico de prueba:

d d
d ; t
n Sd
n

Ejemplo 4

Se ha observado un aumento en el ausentismo en una empresa, y se cree que está relacionado


con la salud general de los empleados. En un intento por mejorar la situación se inició un
programa de acondicionamiento, en el que los empleados realizaban ejercicios físicos durante
su hora de almuerzo. Para evaluar el programa se tomó una muestra de 8 participantes y se
determinó el número de días que cada uno se había ausentado en los seis meses antes de que
comenzara dicho plan y en los últimos seis meses. A continuación, se presentan los resultados.
Al nivel de significancia de 0.05, ¿se puede concluir que el número de ausencias ha disminuido?

Datos: n =8

Antes 6 6 7 7 5 6 7 8
Después 5 2 1 3 3 6 3 7 d
Diferencia(d) 1 4 6 4 2 0 4 1 22

Utilizando las formulas de la media y la desviación estándar calcule: d y Sd

d = 22/8 = 2,75
Sd = 2,05
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)

Ho: d  0
H1: d >0
Prueba de 1 cola

pág. 32
Segundo Paso: Nivel de significancia 0,05

Tercer Paso: Valor estadístico de prueba

2,75
t  3,79
2,05
8

Cuarto Paso: Plantear la regla de decisión

α= 0,05

gl=8-1 =7

Acepto Ho Rechazo Ho

VC= 1,895

Si t>1,895 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Como t(3,79)>1,895 se rechaza la Ho

2.6 Comparación de muestras dependientes e independientes

Es muy frecuente la confusión entre las pruebas de muestras independientes con las pruebas de
muestras dependientes. Según Lind, Marchall y otros “hay dos tipos de muestras dependientes:
1) las que se caracterizan por una medición, una intervención de algún tipo y después otra
medición, y 2) una relación o agrupación de las observaciones”. Lo que es importante enfatizar
es que cuando se emplean muestras dependientes, se reduce la variación en la distribución del
muestreo; es decir, las inferencias sobre dos medias poblacionales relacionadas o dependientes,
por lo general, se obtienen mejores resultados que con el método de muestras independientes.

pág. 33
SEGUNDA PARTE DE LA UNIDAD DIDACTICA

La segunda parte de esta unidad didáctica está compuesta por tres bloques que corresponden a

las unidades tres, cuatro y cinco:

En la unidad tres examinarás todo lo referente al análisis ANOVA, en donde aprenderás a

realizar pruebas de hipótesis de más de dos medias en una y dos direcciones.

En la unidad cuatro estudiaremos los métodos no paramétricos y sus aplicaciones con la

distribución Ji Cuadrada.

Finalmente, en la unidad cinco se analizarán las herramientas del control estadístico de la

calidad.

La importancia del estudio de estas unidades se basa en que en la vida práctica y profesional

es de gran utilidad para la toma de decisiones en el campo administrativo.

Objetivos de la segunda parte de la unidad didáctica

Al finalizar el estudio de esta segunda parte estarás en capacidad de aplicar el análisis de

varianza, la ji cuadrada y el control estadístico de calidad, en los diferentes campos de tu

carrera.

pág. 34
III. UNIDAD: Análisis de varianza

Competencias

El estudiante estará en capacidad de:

 Comprender la noción general del análisis de varianza.


 Realizar una prueba de hipótesis para determinar si dos varianzas muestrales,
provienen de poblaciones iguales.
 Establecer y organizar datos en una tabla de ANOVA de una y dos direcciones
 Efectuar una prueba de hipótesis entre tres o más medias muestrales.
 Realizar prueba de hipótesis para determinar si hay alguna diferencia entre medias de
bloques.

Contenidos

3.1 Conceptos principales

3.2 Comparaciones de dos varianzas poblacionales

3.3 Suposiciones ANOVA

3.4 Prueba ANOVA en una dirección

3.5 Inferencias acerca de las medias de tratamiento

3.6 Análisis de varianza de dos direcciones

3.1 Conceptos principales

Análisis de varianza. - Es una técnica que se usa para probar simultáneamente si las medias

de varias poblaciones son iguales.

Distribución F.- Se utiliza como estadístico de prueba en el análisis de varianza.

Tratamiento. - Es una fuente de variación.

Bloque. - Es una segunda fuente de variación, además de los tratamientos

pág. 35
Análisis de varianza

En general, el análisis de varianza es un procedimiento que se utiliza para determinar

simultáneamente si varias poblaciones normales e independientes tiene la misma media. Esto se

hace comparando las varianzas de las muestras aleatorias tomadas de estas poblaciones.

Para esto, se debe emplear el procedimiento normal de prueba de hipótesis, pero se usa la

distribución F (apéndice B4) como estadístico de prueba.

3.2 Comparación de dos varianzas poblacionales

Para realizar la prueba de hipótesis debes seguir los cinco pasos y calcular el valor estadístico

de prueba con la siguiente fórmula:

S 12
F
S 22

Ejemplo 1

Una muestra de 16 estudiantes de primer año manifestaron que se iban a especializar en artes y

una muestra de 13 dijeron que se especializarían en Historia, hicieron una prueba de aptitud

musical y la varianza de los puntajes de los que quieren especializarse en artes fue de 7,29 y la

varianza de los puntajes de quienes planean especializarse en historia fue de 39,69.

Proporcionan estos datos evidencia suficiente como para concluir que en el nivel de

significación 0,1, las dos varianzas poblacionales son diferentes?

Datos: n1=13; S21 = 39,69


n2=16; S22 = 7,29

pág. 36
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: 12 = 22
H1: 12  22

Segundo Paso: Nivel de significancia 0,1/2=0,05

Tercer Paso: Valor estadístico de prueba

39,69
F  5,44
7,29

Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)


α= 0,05
gl en el numerador = n1-1 =13-1 = 12

gl en el denominador = n2-1 =16-1 = 15

Acepto Ho rechazo Ho

VC = 2,48

Si F>2,48 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Como F(5,44) > 2,48 se rechaza la Ho y se acepta la H1

pág. 37
3.3 Suposiciones Anova

Para emplear ANOVA, se supone lo siguiente:

a. Las poblaciones siguen la distribución normal.

b. Las poblaciones tienen desviaciones estándares iguales

c. Las poblaciones son independientes.

3.4 Prueba Anova en una dirección

Cuando estamos interesados en hacer inferencias sobre tres o más poblaciones, las técnicas

estudiadas anteriormente no proporcionan por sí mismas las herramientas necesarias para

manejar el análisis estadístico que se necesita.

El análisis de varianza (ANOVA) nos permite hacer inferencias simultáneas sobre parámetros

de tres o más poblaciones. Para realizar la prueba debes seguir los cinco pasos para probar la

hipótesis y en el paso tres debes realizar la TABLA ANOVA

FUENTE DE SUMA DE GRADOS DE MEDIA DE F


VARIACIÓN CUADRADOS LIBERTAD CUADRADOS
Tratamientos SST k-1 SST/(k-1) =MST MST/MSE
Error SSE n-k SSE/(n-k) =MSE
Total SSt n-1

SSt  X 2

X 
2

pág. 38
T 2  X 2
SST   c 

 nc  n

SSE = SSt - SST

Ejemplo 2

ATU fabrica bicicletas de turismo. El ingeniero de control de calidad decide comparar las
velocidades más altas obtenidas, utilizando tres mecanismos de cambios diferentes; 5 ciclistas
son cronometrados cuando corren con cada uno de los tres mecanismos, los resultados aparecen
aquí. ¿Los datos sugieren una diferencia en las velocidades promedio a un nivel del 1%?

MECANISMO
CICLISTA I II III
1 40 51 37
2 42 49 38
3 37 53 38
4 45 57 41
5 42 42 40

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho: 1 = 2 = 3
H1: 1  2  3

Segundo Paso: Nivel de significancia 0,01

MECANISMO
CICLISTA TOTAL
I II III
X X2 X X2 X X2 X X2
1 40 1.600 51 2.601 37 1.369 128 5.570
2 42 1.764 49 2.401 38 1.444 129 5.609
3 37 1.369 53 2.809 38 1.444 128 5.622
4 45 2.025 57 3.249 41 1.681 143 6.955
5 42 1.764 42 1.764 40 1.600 124 5.128
Tc 206 252 194 652
X2 8.522 12.824 7.538 28.884

pág. 39
Tercer Paso: Valor estadístico de prueba

SSt  28884 
652
2
 543,73
15

 206 2 252 2 194 2  6522


SST        374,93
 5 5 5  15

SSE = 543,73-374,93 = 168,80

TABLA ANOVA

FUENTE DE SUMA DE GRADOS DE MEDIA DE F


VARIACIÓN CUADRADOS LIBERTAD CUADRADOS
Tratamientos 374,93 (3-1) =2 (374,93/2) =187,47 (187,47/14,07)
Error 168,80 (15-3) =12 (168,80/12) =14,07 =13.32
Total 543,73 (15-1) =14

Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)


α= 0,01
gl en el numerador = k-1 =3-1 =2
gl en el denominador = n-k =15-3 = 12

Acepto Ho rechazo Ho

VC = 6,93

Si F>6,93 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Como F (13,32) > 6,93 se rechaza la Ho y se acepta la H1

pág. 40
3.5 Inferencias acerca de pares de valores medios de tratamiento

Cuando se rechaza la hipótesis nula al aplicar el procedimiento ANOVA, se concluye que todas

las medias de tratamiento no son iguales. Algunas veces esta conclusión puede considerarse

satisfactoria, pero en otros casos se requiere conocer cuáles medias de tratamiento son

diferentes, para esto debes calcular el intervalo de confianza para la diferencia entre medias de

tratamiento utilizando la siguiente formula:

1 1
( X 1  X 2 )  t MSE  
 n1 n2 

Si el intervalo de confianza incluye al cero no hay diferencia entre las medias de

tratamiento y si tienen el mismo signo es decir no incluye al cero si hay una diferencia

significativa entre las dos medias de tratamiento

Ejemplo 3

La siguiente es información de muestra. Pruebe la hipótesis de que las medias de tratamiento

son iguales al nivel de significancia de 0.05

TRATAMIENTO

I II III

3 9 6

2 6 3

5 5 5

1 6 5

3 8 4

1 5

pág. 41
a. Enuncie la hipótesis nula y alternativa.

b. ¿Cuál es la regla de decisión?

c. Elabore una tabla ANOVA.

d. Exprese su decisión respecto a la hipótesis nula.

e. Si se rechaza Ho, ¿se puede concluir que difieren el tratamiento 1 y el tratamiento 2?

Utilice el nivel de confianza del 90%.

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho: 1 = 2 = 3
H1: 1  2  3

Segundo Paso: Nivel de significancia 0,05

I II III TOTAL
X X2 X X2 X X2 X X2
3 9 9 81 6 36 18 126
2 4 6 36 3 9 11 49
5 25 5 25 5 25 15 75
1 1 6 36 5 25 12 62
3 9 8 64 4 16 15 89
1 1 5 25 6 26
1 1 1 1
Tc 15 40 23 78
X2 49 268 111 428

Tercer Paso: Valor estadístico de prueba

SSt  428 
782  90
18

 15 2 40 2 23 2  782
SST       33,87
 6 7 5  18

pág. 42
SSE = 90-33,87 = 56,13

TABLA ANOVA

FUENTE DE SUMA DE GRADOS DE MEDIA DE F

VARIACIÓN CUADRADOS LIBERTAD CUADRADOS

Tratamientos 33,87 (3-1) =2 (33,87/2) =16,94 (16,94/3,74) =4,53

Error 56,13 (18-3) =15 (56,13/15) =3,74

Total 90,00 (18-1) =17

Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)


α= 0,05
gl en el numerador = k-1 =3-1 =2
gl en el denominador = n-k =18-3 = 15

Acepto Ho rechazo Ho

VC = 3,68

Si F>3,68 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Como F(4,53) > 3,68 se rechaza la Ho y se acepta la H1

Pregunta f: X 1  X 2
Nivel de confianza 90%

pág. 43
X 1 = 15/6=2,5 X 2 =40/7=5,71
n1 = 6 n2=7
t=1,753 del apéndice F con (n-k) =18-3=15 grados l
MSE= 3,74

1 1
(2,5  5,71)  1,753 3,74  
6 7
ICS = -3,21+1,89 = -1,32
ICI = -3,21 -1,89 = -5,10

Como los extremos son negativos se concluye que las medias difieren

3.6 Análisis de varianza en dos direcciones

Pasamos ahora a estudiar el tema de la ANOVA bidireccional (análisis de bloques y


tratamientos). Para esto debes seguir el mismo procedimiento anterior y en el paso tres debes
incluir la siguiente formula:

 B2  X 2
SSB   r 

 k  n

La tabla ANOVA queda de la siguiente manera:

FUENTE DE SUMA DE GRADOS DE MEDIA DE F


VARIACIÓN CUADRADOS LIBERTAD CUADRADOS
Tratamientos SST k-1 SST/(k-1) =MST MST/MSE
Bloques SSB b-1 SSB/(b-1) =MSB MSB/MSE
Error SSE (k-1) (b-1) SSE/(k-1) (b-1)
=MSE
Total SSt n-1

Ejemplo 4

pág. 44
Unos investigadores llevaron a cabo un experimento para evaluar la actitud hacia la reforma
educativa. Los investigadores seleccionaron al azar a obreros, oficinistas y profesionales
según la actitud hacia la reforma educativa. El siguiente cuadro muestra los resultados.

ACTITUD HACIA LA REFORMA EDUCATIVA


A FAVOR (A) NEUTRAL (N) OPUESTO (O)
Obrero (O) 19 16 37
Oficinista (Of) 15 22 46
Profesional (P) 24 11 32

Al nivel de significancia de 0,05 ¿se puede concluir que hay diferencia entre las actitudes hacia
la reforma educativa o la ocupación?

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Hipótesis para tratamientos
Ho: A = N = O
H1: A  N  O
Hipótesis para bloques
Ho: O = Of = P
H1: O  Of  P

Segundo Paso: Nivel de significancia 0,05

Tercer Paso: Valor estadístico de prueba

ACTITUD HACIA LA REFORMA


OCUPACION A FAVOR NEUTRAL OPUESTO Bt
X X2 X X2 X X2 X X2
OBRERO 19 361 16 256 37 1369 72 1986
OFICINISTA 15 225 22 484 46 2116 83 2825
PROFESIONAL 24 576 11 121 32 1024 67 1721
Tc 58 49 115 222
X2 1162 861 4509 6532

pág. 45
SSt  6532 
222
2
 1056
9

 58 2 49 2 115 2  2222
SST       854
 3 3 3  9

 72 2 83 2 67 2  2222
SSB        44,67
 3 3 3  9

SSE = 1056-854-44,67 = 157,33

TABLA ANOVA

FUENTE DE SUMA DE GRADOS DE MEDIA DE F


VARIACIÓN CUADRADOS LIBERTAD CUADRADOS
Tratamientos 854 (3-1) =2 (854/2) =427 (427/39,33) =10,85
Bloque 44,67 (3-1) =2 (44,67/2) =22,34 (22,34/39,33)
Error 157,33 (3-1) (3-1) =4 (157,33/4) =39,33 =0,57
Total 1056 (9-1) =8

Cuarto Paso: Plantear la regla de decisión. (Apéndice B4)

α= 0,05
Para tratamiento
gl en el numerador = k-1 =3-1 =2
gl en el denominador =(k-1) (b-1) = (3-1) (3-1) =4
F=6,94

Para bloque
gl en el numerador = b-1 =3-1 =2
gl en el denominador =(k-1) (b-1) = (3-1) (3-1) =4
F=6,94

pág. 46
Acepto Ho rechazo Ho

VC
6,94

Si F>6,94 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Para tratamiento

Como F (10,85) > 6,94 se rechaza la Ho y se acepta la H1

Para bloque

Como F (0,57) < 6,94 se acepta la Ho

pág. 47
IV. UNIDAD: Métodos no paramétricos

Competencias

 Realizar una prueba de hipótesis comparando un conjunto observado de frecuencias y

una distribución esperada.

 Efectuar una prueba de hipótesis de normalidad aplicando la distribución Ji Cuadrada.

 Realizar una prueba de hipótesis para determinar si están relacionados dos criterios de

clasificación (Pruebas de independencia)

Contenidos

4.1 Introducción.

4.2 Prueba de bondad de ajuste. Frecuencias esperadas iguales.

4.3 Prueba de bondad de ajuste. Frecuencias esperadas desiguales.

4.4 Prueba de hipótesis de que la distribución es normal

4.5 Pruebas de independencia (tablas de contingencia)

4.1 Introducción.

Pruebas no paramétricas. - Pruebas de hipótesis para datos de niveles nominal y ordinal. No se

necesita hacer suposiciones acerca de la forma de la población; esto es, no tiene que suponerse

que la población esté distribuida normalmente.

Prueba de bondad de ajuste de ji cuadrada. - Es una prueba cuyo objetivo es determinar que

tan bien se ajusta un conjunto de frecuencias observadas, a un conjunto de frecuencias

esperadas. Se usa cuando se tiene sólo una variable de nivel de medición nominal.

pág. 48
Las pruebas de hipótesis no paramétricas o libres de distribución usan datos de nivel nominal y

ordinal. Esto implica que estas pruebas están libres de suposiciones con respecto a la

distribución de la población de origen. Es decir, no es necesario que se suponga que la

población sigue la distribución normal.

4.2 Prueba de bondad de ajuste. Frecuencias esperadas iguales.

El objetivo de la prueba de bondad de ajuste es comparar un conjunto de frecuencias observadas

con un conjunto de frecuencias esperadas.

Para realizar la prueba debes seguir los cinco pasos y calcular el valor estadístico de prueba con

la siguiente formula:

  fo  fe 2 
X 2   
 fe 

Ejemplo 1

RR.HH. reunió la siguiente información acerca del ausentismo del personal por día de la

semana. Al nivel de significancia de 0.05, puede concluir que existe una diferencia en la tasa

de inasistencia por día de la semana.

Día Ausentismo
Lunes 124
Martes 74
Miércoles 104
Jueves 98
Viernes 120

pág. 49
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
Ho: no hay diferencia en la tasa de inasistencia
H1: hay diferencia en la tasa de inasistencia

Segundo Paso: Nivel de significancia 0,05

Tercer Paso: Valor estadístico de prueba

DIA AUSENTISMO (fo-fe) (fo-fe) 2 (fo-fe) 2 /fe


fo fe
Lunes 124 104 20 400 3,85
Martes 74 104 -30 900 8,65
Miércoles 104 104 0 0 0,00
Jueves 98 104 -6 36 0,35
Viernes 120 104 16 256 2,46
TOTAL 520 520 0 15,31

Donde X2= 15,31

Cuarto Paso: Plantear la regla de decisión. (Apéndice B3)


α= 0,05
Grados de libertad = k-1 =5-1 =4
X2=9,488

Acepto Ho rechazo Ho

VC = 9,488

Si X2>9,488 se rechaza la Ho y se acepta la H1

pág. 50
Quinto Paso: Tomar la decisión

Como X2(15,31) > 9,488 se rechaza la Ho y se acepta la H1

4.3 Prueba de bondad de ajuste. Frecuencias esperadas desiguales.

Ejemplo 2

Un banco clasifica las cuentas por cobrar como “al día”, “atrasadas” e “incobrables. Las

cifras en el sector muestran que el 60% de las cuentas por cobrar están al día, 30% son

atrasadas y 10% son incobrables. El departamento jurídico del Banco tiene 500 cuentas por

cobrar: 320 están al día, 120 tienen atraso y 60 son incobrables. Estos números concuerdan

con la distribución en el sector. Utilice el nivel de significación de 0.05

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho: no hay diferencia con la distribución en el sector
H1: hay diferencia con la distribución en el sector

Segundo Paso: Nivel de significancia 0,05

Tercer Paso: Valor estadístico de prueba

TIPO CxC fe (fo-fe) (fo-fe) 2 (fo-fe) 2 /fe


fo %
Al corriente 320 60 300 20 400 1,33
atrasadas 120 30 150 -30 900 6,00
No cobrables 60 10 50 10 100 2,00
TOTAL 500 100 500 0 9,33
Donde X2= 9,33

Cuarto Paso: Plantear la regla de decisión. (Apéndice B3)


α= 0,05
Grados de libertad = K-1 =3-1 =2
X2=5,991

pág. 51
Acepto Ho rechazo Ho

VC = 5,991

Si X2>5,991 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Como X2(9,33) > 5,991 se rechaza la Ho y se acepta la H1

4.4 Prueba de hipótesis de que la distribución es normal

La prueba de bondad de ajuste se utiliza para comparar una distribución observada de

frecuencias con una distribución esperada de frecuencias. En esta sección se quiere probar la

hipótesis de que la distribución es normal, utilizando la prueba de bondad de ajuste para

comparar una distribución observada de frecuencias con una distribución esperada de

frecuencias que es normal. En el capítulo 11, al hacer la prueba para encontrar diferencias entre

dos medias poblacionales, se asume que ambas poblaciones seguían la distribución normal. Se

parte de la misma suposición en el capítulo 12, cuando se probó si varias medias poblacionales

eran iguales.

pág. 52
En el siguiente ejemplo se muestran los detalles de esta prueba de bondad de ajuste para

investigar la razonabilidad del supuesto de normalidad.

Distribución de frecuencia de las ganancias por vehículos vendidos el mes anterior por

Ganancia Frecuencia
$ 200 hasta $ 600 8
600 hasta 1 000 11
1 000 hasta 1 400 23
1 400 hasta 1 800 38
1 800 hasta 2 200 45
2 200 hasta 2 600 32
2 600 hasta 3 000 19
3 000 hasta 3 400 4
Total 180

¿Es razonable concluir que los datos acerca de las ganancias son una muestra obtenida de una

población normal? En otras palabras, ¿los datos de ganancia siguen una distribución normal?

Utilice el nivel de significancia 0.05.

Ganancia Frecuencia Xi Xifi (Xi-X)^2 Z Área fe


menos de 200 - 2,53 0,006 1,03
$ 200 hasta $ 600 8 400 3200 16845787,7 - 1,92 0,022 3,91
600 hasta 1 000 11 800 8800 12153180,2 - 1,30 0,069 12,49
1 000 hasta 1 400 23 1200 27600 9750750,62 - 0,69 0,148 26,69
1 400 hasta 1 800 38 1600 60800 2396158,02 - 0,08 0,223 40,14
1 800 hasta 2 200 45 2000 90000 997555,556 0,53 0,234 42,08
2 200 hasta 2 600 32 2400 76800 9640928,4 1,15 0,173 31,14
2 600 hasta 3 000 19 2800 53200 17107412,3 1,76 0,086 15,46
3 000 hasta 3 400 4 3200 12800 7278004,94 2,37 0,03 5,45
3400 o mas 0,009 1,60
Total 180 333200 76169777,8 1 180

Media 1.851,11
Desviación Típica 652,32621

pág. 53
Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)
H0: La población de ganancias sigue la distribución normal.
H1: La población de ganancias no sigue la distribución normal.

Segundo Paso: Nivel de significancia 0,05

Tercer Paso: Valor estadístico de prueba

Ganancia fo fe (fo-fe)^2/fe
$ 200 hasta $ 600 8 4,94 1,90
600 hasta 1 000 11 12,49 0,18
1 000 hasta 1 400 23 26,69 0,51
1 400 hasta 1 800 38 40,14 0,11
1 800 hasta 2 200 45 42,08 0,20
2 200 hasta 2 600 32 31,14 0,02
2 600 hasta 3 000 19 15,46 0,81
3 000 o mas 4 7,05 1,32
Total 180 180 2
X = 5,05

Cuarto Paso: Plantear la regla de decisión. (Apéndice B3)


Cuando estimamos parámetros poblacionales a partir de datos muestrales, perdemos un grado

de libertad por cada estimación, de modo que perdemos dos grados más de libertad por estimar

la media poblacional y la desviación estándar de la población. Así, el número de grados de

libertad en este problema es 5, calculados por k - 2 - 1 = 8 - 2 - 1 = 5.

De acuerdo con el apéndice B.3, utilizando el nivel de significancia 0.05, el valor crítico de

ji cuadrada es 11.070. La regla de decisión es rechazar la hipótesis nula si el valor calculado

de ji cuadrada es mayor a 11.070.

pág. 54
Acepto Ho rechazo Ho

VC = 11,070

Si X2>11,070 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Como X2(5,05) < 11,070 se acepta la Ho, es decir; La población de


ganancias sigue la distribución normal.

4.5 Pruebas de independencia (tablas de contingencia)

La prueba de Ji Cuadrada también puedes aplicar en un proyecto de investigación relacionado

con dos características que se resumen en una tabla de contingencia (tabla de doble entrada). En

este caso debes seguir los pasos anteriores y para el cálculo de la frecuencia esperada para una

celda debes utilizar la siguiente formula.

(total por fila )(total por columna )


fe 
gran total

Ejemplo 3

pág. 55
Taco Bell realiza una inspección mensual para comparar los precios registrados con los precios

anunciados. La siguiente tabla resume los resultados de una muestra de 500 artículos en el mes

anterior. La administración de la empresa desearía saber si existe alguna relación entre las tasas

de error en mercancía de precio regular y en los artículos de precio especial. Utilice el nivel de

significancia de 0.01

PRECIO TIPO DE COMBUSTIBLE


REGULAR ESPECIAL
Precio Menor 20 10
Sobreprecio 15 30
Precio correcto 200 225

Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio)


Ho: no existe relación entre las tasas de error y el tipo de artículo
H1: existe relación entre las tasas de error y el tipo de artículo

Segundo Paso: Nivel de significancia 0,01

Tercer Paso: Valor estadístico de prueba

PRECIO REGULAR ESPECIAL TOTAL


fo fe fo fe fo fe
Precio Menor 20,00 14,10 10,00 15,90 30,00 30,00
Sobreprecio 15,00 21,15 30,00 23,85 45,00 45,00
Precio correcto 200,00 199,75 225,00 225,25 425,00 425,00
TOTAL 235,00 235,00 265,00 265,00 500,00 500,00

(30)(235)
fe   14,10
500

pág. 56
( 20  14,10) 2 (10  15,90) 2 (15  21,15) 2
X 2
   
14,10 15,90 21,15
(30  23,85) 2 ( 200  199,75) 2 ( 225  225,25) 2
   8,03
23,85 199,75 225,25

Cuarto Paso: Plantear la regla de decisión. (Apéndice B3)


α= 0,01
gl =(filas-1) (columnas-1) = (3-1) (2-1) =2
X2=9,210

Acepto Ho rechazo Ho

VC = 9,210

Si X2>9,210 se rechaza la Ho y se acepta la H1

Quinto Paso: Tomar la decisión

Como X2(8,03) < 9,210 se acepta la Ho

pág. 57
IV. UNIDAD: Control estadístico de calidad

Competencias:

El estudiante estará en capacidad de:

 Analizar la función del control de calidad en las operaciones de producción y de

servicio.

 Elaborar e interpretar un diagrama de Pareto.

 Realizar e interpretar un diagrama de causa y efecto.

 Realizar e interpretar un diagrama de defectuosos y una gráfica de barras

 Elaborar una gráfica característica de operación para diversos planes de muestreo.

Contenidos

5.1 Conceptos principales

5.2 Diagramas de diagnóstico

5.3 Diagrama de Pareto

5.4 Diagrama de control de calidad

5.4.1 Diagramas de control de variables

5.4.2 Diagrama de control de atributos

4.1 Conceptos principales

pág. 58
Diagrama de Pareto. - Es una media aplicada para clasificar el número y tipo de defectos que

se presentan en un producto o servicio.

Diagrama de causa y efecto. - Enfatiza la relación entre una o varias causas posibles de un

problema, las cuales pueden producir un efecto en particular.

Diagramas de control. - Muestran gráficamente la calidad de un producto o servicio.

Variación aleatoria. - Variación que por naturaleza es aleatoria y no puede ser controlada o

eliminada.

Variación asignable. - Variación que no se debe al azar y puede ser eliminada.

4.2 Diagramas de diagnóstico

Los más importantes son:

1. El diagrama de Pareto: el concepto del diagrama es que 80% de la actividad es causada

por el 20% de los factores.

2. El diagrama de causa y efecto: Denominado “espina de pescado”, considera 4 áreas del

problema: métodos, materiales, equipo y personal.

Ejemplo 1

Un fabricante de calzado realizó un estudio acerca de sus nuevos zapatos para trotar. A

continuación, se presenta un listado del tipo y la frecuencia de deficiencias y fracasos

encontrados. Elabore un diagrama de Pareto para mostrar las áreas principales del problema

TIPO DEFICIENCIA FRECUENCIA TIPO FRECUENCIA

pág. 59
DEFICIENCIA
Separación de la suela 34 Rotura cordones 14
Separación del tacón 98 Rotura ojillos 10
Hundimiento suela 62 Otras 16

Elabore un diagrama de Pareto para mostrar las áreas principales del problema

TIPO DEF FREC % % ACUM


Sep. tacón 98 41,88 41,88
Hund. suela 62 26,50 68,38
Sep. suela 34 14,53 82,91
Otras 16 6,84 89,74
Rot.cordones 14 5,98 95,73
Rot ojillos 10 4,27 100,00
TOTAL 234 100,00

%= (98/234)100=41,88

% acumulado = 41,88+26,50=68,38

4.3 Diagrama de Pareto

pág. 60
Conclusión: La separación del tacón, el hundimiento de la suela y la separación de la suela

representan el 82,91% de los daños en los zapatos, por lo que el dueño de la fábrica deberá

resolver primero estos problemas

4.4 Diagramas de control de calidad

Existen 2 tipos de diagramas de control.

 Diagrama de control para variables.

 Diagrama de atributos.

4.4.1 Diagrama de control para variables

Se dan como resultado de una medición. Se consideran dos diagramas de control:

a. Diagrama de media (valor medio). - Muestra la media de una variable. Las siguientes

formulas calculan los límites de control para la media.

LSC (límite superior de control) = X + A2R

LIC (límite inferior de control) = X - A2R

X (Media global) =  X / k

pág. 61
R (media de las amplitudes de variación) = R / k

A2 (se encuentra en el apéndice B8)

b. Diagrama de amplitud de variación. - Indica la extensión de cambio de la variable.

Aquí debes utilizar las siguientes fórmulas para calcular los límites de control para la

amplitud.

LSC (límite superior de control) = D4R

LIC (límite inferior de control) = D3R

NOTA: D4, D3 (se encuentra en el apéndice B8)

Ejemplo 2

Como parte de su proceso de inspección, una empresa prueba la resistencia de las llantas que

fabrica aplicándoles condiciones simuladas de recorrido. Se selecciona 20 muestras de 3

neumáticos cada una, de diferentes turnos laborales durante un mes de operación.

El desgaste de las llantas se indica a continuación, en centésimas de pulgada

MUESTRA DESGASTE DE LLANTAS MUESTRA DESGASTE DE LLANTAS


1 44 41 19 11 11 33 34
2 39 31 21 12 51 34 39
3 38 16 25 13 30 16 30
4 20 33 26 14 22 21 35
5 34 33 36 15 11 28 38
6 28 23 39 16 49 25 36
7 40 15 34 17 20 31 33
8 36 36 34 18 26 18 36
9 32 29 30 19 26 47 26
10 29 38 34 20 34 29 32

 Determine los límites de control para la media y la amplitud de variación.

 Trace los límites de control para la media y para la amplitud de variación.

pág. 62
 Hay algunos puntos que estén fuera de control.

MUESTRA DESGASTE DE LLANTAS MEDIA AMPLITUD


I II III X AV
1 44 41 19 34,67 25,00
2 39 31 21 30,33 18,00
3 38 16 25 26,33 22,00
4 20 33 26 26,33 13,00
5 34 33 36 34,33 3,00
6 28 23 39 30,00 16,00
7 40 15 34 29,67 25,00
8 36 36 34 35,33 2,00
9 32 29 30 30,33 3,00
10 29 38 34 33,67 9,00
11 11 33 34 26,00 23,00
12 51 34 39 41,33 17,00
13 30 16 30 25,33 14,00
14 22 21 35 26,00 14,00
15 11 28 38 25,67 27,00
16 49 25 36 36,67 24,00
17 20 31 33 28,00 13,00
18 26 18 36 26,67 18,00
19 26 47 26 33,00 21,00
20 34 29 32 31,67 5,00
SUMA 611,33 312,00
X = 611,33/20 =30,57
R = 312/20 = 15,60

Límites de control para la media


LSC =30,57 + 1,023(15,60) = 46,53
LIC =30,57 - 1,023(15,60) = 14,61

DIAGRAMA DE CONTROL PARA LA MEDIA


50
LSC
45
40
35
DESGASTE

30 X
25
20
15
10 LIC
5
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
MUESTRAS

pág. 63
Límites de control para la amplitud de variación
LSC = 2,575(15,60) = 40,17
LIC = 0(15,60) = 0

DIAGRAMA DE CONTROL PARA LA AMPLITUD


45
40 LSC
35
DESGASTE

30
25
20
15 R
10
5
0 LIC
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
MUESTRAS

El proceso se encuentra bajo control tanto para la media como para la amplitud de
variación como puedes ver en los diagramas anteriores
RCICIO 8

4.4.2 Diagrama de atributos

Muestra si el producto o servicio es aceptable o no lo es. Se consideran dos diagramas.

a. Diagrama de porcentaje de elementos defectuosos. - Es una gráfica de atributos que


muestra la proporción del producto o servicio que no sigue el estándar. Aquí debes utilizar
las siguientes fórmulas para calcular los límites de control para proporciones.

p(1  p)
LSC (límite superior de control)  p  3
n

p(1  p)
LIC (límite inferior de control)  p  3
n

p = total de defectuosos / total de muestreados

pág. 64
Ejemplo 3

Un fabricante de bicicletas selecciona diariamente 10 armazones y determina la cantidad de


defectos. El número de armazones defectuosos encontrado en los últimos 14 días es: 3, 2, 1, 3,
2, 2, 8, 2, 0, 3, 5, 2, 0, 4.

Elabore un diagrama de control y determine si está bajo control

DÍA NÚMERO DEFECTOS PROPORCIÓN


INSPECCION DEFECTOS
1 10 3 0,30
2 10 2 0,20
3 10 1 0,10
4 10 3 0,30
5 10 2 0,20
6 10 2 0,20
7 10 8 0,80
8 10 2 0,20
9 10 0 0,00
10 10 3 0,30
11 10 5 0,50
12 10 2 0,20
13 10 0 0,00
14 10 4 0,40
TOTAL 140 37

p de defectuosos = 3/10 = 0,30

p = 37/140 = 0,26

0,26(1  0,26)
LSC  0,26  3  0,68
10

0,26(1  0,26)
LIC  0,26  3  0,16  0
10

DIAGRAMA DE CONTROL PARA LA PROPORCIÓN


0,9
0,8
0,7 LSC
PROPORCIÓN

0,6
0,5
0,4
0,3 P
0,2
0,1
0 LIC
1 2 3 4 5 6 7 8 9 10 11 12 13 14
pág. 65 DÍAS
Conclusión: El proceso está fuera de control en el séptimo día.

b. Diagrama c con raya. - Se refiere al número de defectos por unidad. Aquí debes utilizar las
siguientes fórmulas para calcular los límites de control para el número de defectos por
unidad.

LSC (límite superior de control)  c  3 c

LIC (límite inferior de control)  c  3 c

Ejemplo 4

Al final de cada turno, el departamento de calidad selecciona una muestra de baterías para
probarlas. El número de unidades defectuosas durante los últimos 12 turnos es 2, 1, 0, 2, 1, 1, 7,
1, 1, 2, 6 y 1.

Elabore un diagrama de control del proceso y comente si está bajo control.

 X 2 1 0  2 11 7 11 2  6 1


c   2,083
n 12

LSC  2.083  3 2.083 = 6.413

LIC  2.083  3 2.083 = -2.247

Como LCI es negativo, se establece LCI = 0.

pág. 66
LSC

LIC

El turno con 7 defectos está fuera de control

FIN

pág. 67

You might also like