You are on page 1of 166

1 Clase No 1 ( 100 min.

) Unidad I : Generalidades, Recoleccin, Organizacin de Datos y Grficos 1 Generalidades Objetivos de la Clase: Al final de la clase el estudiante ser capaz de determinar los conceptos bsicos estadsticos fundamentales y conocer las diferentes reas de aplicacin. Introduccin: La palabra estadstica se deriva del latn Status por lo que se le atribuyo el siguiente significado Ciencia de las cosas que pertenecen al estado y se ocupa de los fenmenos que pueden favorecer o defender la prosperidad de ste Sin embargo, en la actualidad se dice que Estadstica es la Ciencia que trata de la recopilacin, clasificacin, anlisis e interpretacin de los hechos sujetos a una operacin numrica como base de la explicacin y comparacin de un fenmeno. 1.1. Divisin de la Estadstica

La Estadstica se divide en: Estadstica Descriptiva es aquella que incluye los mtodos de recopilacin, organizacin, presentacin, anlisis e interpretacin de un grupo de datos sin ningn intento por hacer una prediccin basada sobre los datos. Estadstica Inductiva es la que incluye los mtodos de generalizacin, estimacin o prediccin de las caractersticas de una poblacin basados en una muestra. 1.2. Conceptos Bsicos

Datos Estadsticos Es la informacin cuantitativa o numrica que puede encontrarse casi dondequiera, tomando de dicha informacin slo aquellos datos que pueden ser comparados, analizados e interpretados.

2 Poblacin o Universo Es el rea de la cual los datos estadsticos son recopilados Muestra Es el conjunto de elementos representativos de la poblacin Atributos de los Datos Son las caractersticas de los datos en forma cualitativa, las cuales no pueden ser expresadas en cifras como el sexo, estado civil, etc. Variables Son las caractersticas cuantitativas, se basan en la medida y ponderacin de los hechos como el peso, la estatura, etc. Variable Continua Es aquella cuyos valores posibles no tienen interrupcin y tericamente pueden tomar cualquier valor entre dos valores dados, en otras palabras son aquellas que se pueden medir, como el peso, la talla, fechas, etc. Variable Discreta Sus valores se interrumpen o se separan, es decir, la variable no puede tomar cualquier valor entre dos valores dados, en otras palabras, son aquellas que no se miden, sino que se cuentan, como el nmero de escuelas construidas el 1981 en el departamento de La Libertad. PASOS DE UN ESTUDIO ESTADSTICO 1 Paso :Toma o Recoleccin de Datos Es el primer paso de un estudio estadstico, el cual consiste en que despus de que un problema ha sido claramente definido y entendido, se recolectan aquellos hechos relevantes que pueden ser presentados cuantitativamente. 2 Paso : Ordenamiento de Datos La ordenacin u organizacin de datos es el segundo paso de un estudio estadstico, comprende la crtica y correccin de los datos recopilados, la clasificacin y tabulacin de los mismos. 3 Paso : Clasificacin de Datos Paso importante de la organizacin de datos es la clasificacin, la cual consiste en agrupar los datos de iguales caractersticas como tiempo o cronologa, lugar o geografa, cantidad y cualidad.

3 4 Paso : Construccin de Series Despus de haber clasificado los datos, se obtendrn tantas sucesiones de datos estadsticos como modalidades tengan el fenmeno observado. Precisa luego, darle un carcter individual a cada una de estas sucesiones de datos, estableciendo series que midan la intensidad del fenmeno observado, las cuales podran reducir el nmero de datos a una expresin tal que sern fcilmente analizados. Las series se pueden dividir segn el nmero de datos que se obtengan en: Series Simples Son aquellas que contienen un nmero reducido de observaciones, de tal manera que la informacin puede ser expresada al detalle. Series Agrupadas Llamadas tambin Distribucin de Frecuencias son aquellas en las cuales se tiene una cantidad muy numerosa de observaciones, de tal forma que se dificulta la presentacin y anlisis de la informacin, por lo que se agrupan por valor o en clases de acuerdo a alguna caracterstica especfica. Dentro de estas series existen las llamadas series discretas que son las compuestas por variables discretas ( son las que se cuentan ) y las series continuas que son las que se componen por variables continuas ( son las que se miden ). 2. Distribucin de Frecuencias

Los datos recopilados, los cuales no han sido organizados numricamente son llamados Datos Brutos o Crudos. Ejemplo: Los valores 46298488 Son los datos brutos observados de algn fenmeno los cuales pueden ser organizados as: 24468889 A este resultado se le llama Arreglo. En dicho arreglo existen valores repetidos, el nmero que indica las veces que un valor est repetido se llama Frecuencia. As
Variable (x) Frecuencia ( f )

2 4 6 8 9

1 2 1 3 1

4 Cuando los valores son agrupados en varias clases y es indicado el nmero de valores dentro de cada clase, se puede obtener una tabulacin ms compacta de datos, a lo que se llama Distribucin de Frecuencias. El arreglo anterior, lo podemos escribir tambin as: Clase Frecuencia 0 - 3 1 3 - 6 2 6 - 9 4 9 - 12 1 Donde: Clase Es cada grupo que se forma con los datos observados de un fenmeno. Nmero de Clases Este depende de la amplitud de los datos y del tipo de informacin que el investigador desee obtener. En general el nmero de clases no deber ser ni demasiado grande, ni demasiado pequeo. Lmite de Clases Son los valores extremos de cada clase e indican las fronteras de cada una en la distribucin de frecuencias. El valor con el que comienza la clase se llama Lmite inferior y el valor con el que termina la clase se llama Lmite Superior. Punto Medio o Centro de Clase Es el valor equidistante de los lmites o extremos de la clase y es igual a la semi-suma de dichos lmites.

Pm = Lmite Inferior + Lmite Superior 2 O sea: Ejemplo Encontrar los lmites de clase y el valor del punto medio para cada una de las clases dadas. Clase Punto

5 Li 0 3 6 9 Ls 3 6 9 12 Medio 1.5 4.5 7.5 10.5

Los puntos medios se calculan en base a la frmula dada, as: Pm1 = 0 + 3 = 1.5 2 Pm2 = 3 + 6 = 4.5 2 Pm 3 = 6 + 9 = 7.5 2

Intervalo de Clase Es La diferencia entre el lmite superior y el lmite inferior de cada clase, representado por la letra i . Por ejemplo para el ejercicio en cuestin el i = 3 , es decir , el intervalo de clase es 3 ya que: Para la clase de 0 3 30 = 3 Para la clase de 3 6 63 = 3 Para la clase de 6 9 96 = 3 Por lo tanto: i = Ls - Li Sntesis Estadstica es la ciencia que trata de la recoleccin, clasificacin, anlisis e interpretacin de los hechos sujetos a una apreciacin numrica, como base de la explicacin y comparacin de un fenmeno. La Estadstica Descriptiva tiene como funcin principal la descripcin y resumen de la informacin en cambio la Estadstica Inductiva la de obtener conclusiones. Los pasos de un Estudio Estadstico son: a) Toma o Recoleccin de datos b) Ordenacin u Organizacin de datos c) Clasificacin de datos d) Elaboracin de series Punto medio es el valor equidistante de los lmites de cada clase El intervalo de clase es la diferencia entre el lmite superior e inferior de cada clase.

6 Ejercicios Propuestos 1. Se tiene la estatura en metros de 30 alumnos. Ordenar los datos y construir una tabla de frecuencias. 1.69 1.64 1.62 1.66 1.64 1.67 1.66 1.69 1.69 1.66 1.72 1.71 1.62 1.66 1.67 1.71 1.74 1.67 1.69 1.77 1.74 1.66 1.66 1.67 1.66 1.71 1.64 1.67 1.69 1.67 2. Encontrar el lmite de clase, el punto medio y el intervalo de clase para las siguientes distribuciones de frecuencias. C 2 4 6 8 10 12 Frecuencia 4 3 6 2 8 5 10 1 12 3 14 4 Pm 3 5 7 9 11 13 a)

Clase 10 - 20 20 - 30 30 - 40 40 - 50

Frecuencia 12 10 2 11

Pm 15 25 35 45

b)

Clase No 2 ( 100 min )

7 Tema: Distribucin de frecuencias

Objetivos de la Clase: Al final de la clase el estudiante ser capaz de: Calcular la amplitud, frecuencia relativa y acumulada, dada una distribucin de frecuencias. Calcular por diferentes mtodos el intervalo de clase para la elaboracin de una distribucin de frecuencias. Introduccin: Cuando se estudia un fenmeno y se recopilan datos, es necesario ordenarlos en una distribucin de frecuencias, para lo cual, el cmo calcular el intervalo de clase se hace necesario. Teora: 1. Amplitud, Oscilacin o Rango En un conjunto de datos observados siempre existe un valor mayor y uno menor, la amplitud es la diferencia entre estos dos valores de los datos observados. As, en los siguientes datos brutos 4 6 2 9 8 4 8 8 la amplitud es 7, ya que, como 9 es el valor mayor y 2 el valor menor de los valores observados 9 2 = 7 Es decir: Amplitud = Vmayor - Vmenor 2. Frecuencia Relativa Es la relacin que existe entre el nmero de datos observados y cada una de las frecuencias de cada clase. fR = f / n

Donde: fR = Frecuencia Relativa f = Frecuencia absoluta

8 n = Nmero de datos 3. Frecuencia Acumulada ( fa ) Se obtiene sumando a la frecuencia absoluta ( f ) de cada una de las clases, la frecuencia acumulada de la clase anterior. As: fa1 fa2 fa3 fa4 . . . Ejemplo Dada la distribucin de frecuencias de el ejercicio propuesto No 1 de la clase anterior. Calcular la amplitud, la frecuencia relativa y la frecuencia acumulada. Estatura (m) 1.60 - 1.64 1.64 - 1.68 1.68 - 1.72 1.72 - 1.76 1.76 - 1.80 f 2 16 8 3 1 30 fR 0.07 0.53 0.27 0.1 0.03 1.0 fa 2 18 26 29 30 = = = = f1 fa1 + f2 fa2 + f3 fa3 + f4

Para las frecuencias relativas se tiene: fR1 fR2 fR3 fR4 fR5 = = = = = 2 / 30 16 / 30 8 / 30 3 / 30 1 / 30 = = = = = 0.07 0.53 0.27 0.1 0.03 1.0

El proceso para encontrar las frecuencias acumuladas es:

9 fa1 fa2 fa3 fa4 fa5 = = = = = 2 + 10 2 + 16 18 + 8 26 + 3 29 + 1 = = = = = 2 18 26 29 30

Nota: La suma de las frecuencias relativas siempre ser 1.00 y la suma de las frecuencias (absolutas) ser siempre igual al nmero de datos, para este caso es igual a 30. La ltima frecuencia acumulada debe ser igual al nmero de datos. 3. 3.1. Intervalos de Clase Primer mtodo para calcular el nmero de clases

Consiste en decidir arbitrariamente cual ser el intervalo de cada una de las clases; luego para obtener el nmero de clase, bastar con dividir la amplitud entre el intervalo establecido. El nmero de clase estar determinado por el cociente ms uno, ya que el ltimo valor estar fuera de la ltima clase. k = Amplitud + 1 i Donde: k = Nmero de Clases A = Amplitud ( Vmayor - Vmenor ) i = Intervalo de Clase Ejemplo Si se tiene el salario semanal de 60 obreros de una fbrica. Encontrar el nmero de clase y construir una distribucin de clases y frecuencias. 23 78 76 63 102 49 28 95 82 102 108 120 25 90 45 48 61 45 105 94 87 91 69 30 75 74 79 112 78 45 95 56 82 56 57 48 44 50 66 20 54 42 26 115 43 100 35 86 63 97 36 33 64 52 67 56 118 36 89 64

PROCEDIMIENTO GENERAL

10 PASO 1: Ordenar los datos 20 30 42 45 52 23 33 43 48 54 25 35 44 48 56 26 36 45 49 56 28 36 45 50 56

57 61 63 63 64

64 66 67 69 74

75 76 78 78 79

82 82 86 87 89

90 91 94 95 95

97 100 102 102 105

108 112 115 118 120

PASO 2: Se determina la amplitud Amplitud = 120 20 Amplitud = 100 PASO 3: Determinar arbitrariamente el intervalo de clase i = 10 PASO 4: Se calcula mediante la frmula el nmero de clase k = 120 20 + 1 10 k = 11 PASO 5: Con los datos obtenidos se construye una tabla de distribucin de Frecuencias Clases f pm fr fa 20 30 5 25 0.08 5 30 40 5 35 0.08 10 40 50 9 45 0.15 19 50 60 7 55 0.12 26 60 70 8 65 0.13 34 70 80 6 75 0.1 40 80 90 5 85 0.08 45 90 100 6 95 0.1 51 100 110 5 105 0.08 56 110 120 3 115 0.05 59 120 130 1 125 0.02 60 60 0.99

11 3.2. Segundo mtodo para calcular el intervalo de clase

Consiste en la aplicacin de las siguientes frmulas: k = 1 + ( 3.322 x log n ) i = Amplitud k

Donde:

k = n = A= i =

Nmero de Clase Nmero de Datos Amplitud Intervalo de Clase

Ejemplo Encontrar el nmero de clase del ejemplo anterior. PROCEDIMIENTO GENERAL PASO 1: Calcular el nmero de clase k k k k k PASO 2: = = = = 1 + ( 3.322 x log 60 ) 1 + ( 3.322 x 1.77815125) 1 + 5.91 6.91 7 clases

Calcular el intervalo de clase i = 120 20 6.9 i = 14.49 i 15 = 100 6.9

PASO 3:

Construir la tabla de frecuencias

12 Clases 20 35 35 50 50 65 65 80 80 95 95 110 110 125 Sntesis: Amplitud = Valor Mayor Valor Menor La diferencia entre los mtodos estudiados para calcular el nmero de clase es que en el primero el intervalo se elige y en el segundo se calcula mediante a frmula. Ejercicios Propuestos: 1. En base a los datos observados, completar la siguiente tabla: 63 61 41 32 81 81 63 10 21 63 44 44 32 55 61 66 70 71 71 63 Clases 0 - 20 20 - 40 40 - 60 60 - 80 80 - 100 f Pm fa fR F 7 12 12 9 8 8 4 60 Pm 27.5 42.5 57.5 72.5 87.5 102.5 117.5 fr 0.12 0.2 0.2 0.15 0.13 0.13 0.07 1.0 fa 7 19 31 40 48 56 60

2. Calcular la amplitud y el intervalo de clase de las siguientes distribuciones de frecuencias

13 a) Clases 60 - 62 62 - 64 64 - 66 Clases 66 - 68 5 10 68 - 70 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 - 45 45 - 50 50 - 55 F 2 3 7 F 5 2 1 4 6 9 13 11 7 4 3 1 b)

Dados los siguientes datos crudos elaborar la tabla de distribucin de clases por los mtodos estudiados a) Valores de 40 medidas de estaturas en metros de personas adultas. 1.84 1.67 1.69 1.70 1.74 1.68 1.79 1.67 1.64 1.81 1.60 1.77 1.53 1.76 1.75 1.74 1.57 1.71 1.65 1.74 1.55 1.75 1.67 1.68 1.78 1.65 1.66 1.60 1.73 1.60 1.70 1.61 1.52 1.58 1.72 1.62 1.66 1.61 1.69 1.67 b) Calificaciones de un examen estudiantes 6.7 6.3 8.7 7.9 6.6 6.8 7.7 4.6 6.0 7.7 8.1 9.8 6.1 9.4 8.1 5.2 7.8 8.6 7.8 7.0 c) de Estadstica de un grupo de 40 8.8 7.6 7.5 7.9 4.1 9.2 8.1 8.1 8.2 7.0 8.6 9.2 8.2 7.7 7.0 8.3 8.4 8.7 7.7 7.4

Peso en libras de un grupo de 50 estudiantes 100 116 124 131 140 103 117 124 131 141 113 118 124 131 142 110 117 124 132 145 110 117 127 133 148 107 120 125 134 146 108 117 125 135 145 110 121 128 136 162 114 120 128 138 152 115 120 130 138 150

14 d) 40 mediciones del dimetro de arandelas en milmetros 0.19 0.35 0.37 0.25 0.22 0.29 0.19 0.17 0.20 0.23 0.30 0.32 0.37 0.22 0.26 0.27 0.27 0.26 0.27 0.26 0.32 0.39 0.37 0.32 0.27 0.22 0.32 0.27 0.27 0.28 0.22 0.24 0.32 0.34 0.28 0.15 0.27 0.29 0.27 0.27

Clase No 3 ( 100 min ) GRAFICOS Presentar los resultados obtenidos grficamente mediante las tcnicas ms comunes y utilizadas para variables continuas y discretas. Seleccionar el grfico que sea ms adecuado al tipo de datos.

15 Introduccin: La importancia de las representaciones grficas de los cuadros estadsticos consiste especialmente en la posibilidad de asimilar rpidamente y sin mucho esfuerzo las principales caractersticas de las series estadsticas.

Teora: 1. Los Grficos Los grficos tienen por objeto ilustrar en forma clara y prctica mediante el uso de figuras, el comportamiento de un fenmeno del cual se desea tener conocimiento. Por razones metodolgicas se divide el estudio de los grficos en dos grandes ramas: 1.1 Grficas para variables continuas Grfica de Lneas Consiste en la representacin grfica de los datos a travs de la unin de segmentos de recta. Ejemplo:

Las ventas anuales de un almacn de 1996 a 2001 se dan a continuacin. Construir una grfica de lneas mostrando los datos.

Ventas Anuales 1996 - 2001 Ao Ventas ( ) 1996 600 1997 1200 1998 4000 1999 8000 2000 10000

16 2001 12000

Considerando las columnas de las clases en el eje x y la columna de las frecuencias en el eje y tenemos

12000
10000 8000 6000 4000 2000 0 1996 1997 1998 1999 2000 Aos 2001
Unin de segmentos de Recta.

Histograma Conocido tambin como grfico de Pearson, est formado por una serie de rectngulos cuya base es igual al intervalo de cada clase y cuya altura es igual al nmero de frecuencias correspondientes a cada uno de los intervalos. Ejemplo Dadas las calificaciones de 60 alumnos graficar el histograma Correspondiente

Calificacione s 0 - 2 2 - 4 4 - 6 6 - 8 8 - 10 10 - 12

Alumnos 5 10 12 3 25 5

17 60
HISTOGRAMA
30 ALUMNOS 20 10 0 1 CALIFICACIONES 0.0 - 2.0 2.0 - 4.0 4.0 - 6.0 6.0 - 8.0 8.0 -10.0 10.0 - 12.0

Polgono de Frecuencias Resulta de unir por segmento de recta los puntos medios de las partes superior de los rectngulos de los histogramas. As, para el histograma del ejemplo anterior u polgono de frecuencia es:
POLIGONO DE FRECUENCIAS 30 25 20 15 10 5 0
-2 2. .0 0 -4 4. .0 0 -6 6. .0 0 -8 .0 8. 0 -1 10 0.0 .0 12 .0 0. 0

Alumnos

POLIGONO DE FRECUENCIAS

Calificaciones

OJIVAS: Una ojiva es una alternativa grfica para representar una distribucin de clases y frecuencias. Consiste en dibujar en el plano un grfico frecuencias acumuladas contra extremos de cada clase. Existen 2 variantes: a) La ojiva menos que( que se hace utilizando las frecuencias acumuladas en el sentido de la clase menor hacia la clase mayor )

18 b) La ojiva mas que ( que se hace utilizando las frecuencias acumuladas en el sentido de la clase mayor hacia la clase menor ) Veamos como se construye una ojiva menos que y una mas que, usando los siguientes datos:
Calificaciones Alumnos
Fa menos que Fa mas que

0 1 2 3 4 5 6 7 8 9

1 2 3 4 5 6 7 8 9 10

2 4 6 9 12 11 7 4 3 2

2 6 12 21 33 44 51 55 58 60

60 58 54 48 39 27 16 9 5 2

Procedimiento: 1) Calcule las frecuencias mas que y menos que ( hacerlo en la tabla indicada) 2) Escoja una escala y en plano cartesiano ubique en el eje vertical el valor de las frecuencias acumuladas y en el eje horizontal los lmites de las clases: a) para la ojiva menos que asigne cero como valor de frecuencia al limite inferior de la primera clase y luego asigne al resto de limites superiores de cada clase las frecuencias acumuladas menos que respectivas, hecho esto, ubique en el plano los pares ordenados as formados y luego una los puntos por segmentos de recta ( generar una grfica similar a una letra s alargada ) b) para la ojiva mas que asigne cero como valor de frecuencia al lmite superior de la ltima clase y luego asigne al resto de lmites inferiores de cada clase las frecuencias acumuladas mas que respectivas, similarmente proceda como en el literal a) a ubicar los puntos en el plano y a unirlos por segmentos de recta.

19
OJIVA "MENOS QUE"

80 60 40 20 0 1 3 5 7 9 Calificaciones 11

Alumnos

Serie2

Nota: por abajo del cual reprob el 50% de los alumnos

OJIVA " MAS QUE"


80 Alumnos 60 40 20 0 1 2 3 4 5 6 7 8 9 10 11 Calificaciones Serie2

Grficas para variables Discretas Grficos de Barras Este grfico es idntico al histograma en su construccin con la nica diferencia que sus rectngulos no se encuentran unidos y sus respectivas bases no son iguales a los intervalos de clase. El grfico de barras tambin se puede presentar con las barras en forma horizontal.

Ejemplo

20 Dados los datos de matrcula inicial de especialidades de cierta institucin educativa de carcter tcnico, construir un grfico de barras que lo representen Especialidad Matricula A. Elctrica 5023 B. Mecnica 3680 C. Civil 732 D. Computacin 423 Grfico de Barra Vertical Matrcula 6000 5000 4000 3000 2000 1000 A Grfico de Barras Horizontal Especialidades D C B A 1000 2000 3000 4000 5000 6000 Matrcula B C D Especialidades

Diagrama Circular Consiste en una crculo cuya superficie est dividida en sectores circulares. Ejemplo Elaborar el diagrama circular con la siguiente informacin:

Nmero de Centros de Educacin Tcnica Desde 1996 - 1998 Ao Centro de Educ.

21 1996 1997 1998 184 197 171 552

PROCEDIMIENTO GENERAL PASO 1: Por regla de tres se encuentra el valor en grados que corresponde a cada centro educativo. Para 1996 552: 360o :: 184: x x1 = 184 x 360o 552 x1 = 120 552: 360o :: 197: x x2 = 197 x 360o 552 x2 = 128 552 - 360 184 X X = 184 x 360 552

Para 1997

552: 360o :: 171: x x3 = 171 x 360o 552 x3 = 112 PASO 2: Dividir la circunferencia en los grados obtenidos Para 1998
128 1996

112 1998

120 1997

Sntesis: Las grficas tienen por finalidad mostrar por medio de puntos, segmento de recta, curvas, superficies, volmenes, dibujos, etc. Las distintas variaciones que acusan los fenmenos que son susceptibles de medirse o contarse. a) Grficas para variables Continuas

22 b) c) d) e) Grfico de Lneas Histograma Polgono de Frecuencias Ojivas

Grficas para variables Discretas a) Grfico de Barras b) Diagrama Circular

Clase n 4 (100 minutos ) Discusin de ejercicios

23 1. Representar por medio de polgonos de frecuencias, histogramas y ojivas la informacin dada en las siguientes tablas: a)

Clase F pm 1- 2 2 2- 3 Salario ( $ ) 5 Empleados 3300 - 325 15 - 4 5 4325 - 350 - 5 5 18 5- 6 3 350 - 375 28 0 6 375 - 400 36 400 - 425 22 425 - 450 15 450 - 475 4

Fa que

Fa + que

a) b)

Representar por medio de grfico de lneas c) Ao 1971 1972 1973 1974 1975 1976 1977 Inscripcin 1604 4310 4263 2397 3661 5957 2446

ao 1993 1994 1995 1996 1997 1998 1999 2000

ndice de precios 124 142.9 142.7 206.1 340.9 252 279.5 265.5

d)

24

2) Representar mediante un grfico de barras y un diagrama circular las siguientes tablas de datos: a) Quin te ha hablado acerca de drogas? Quin amiga mam hermana profesora otros f 182 229 21 17 15 464

b) Precios mensuales promedios de libra de frijoles al por menor en 1993 Mes E F Mar A May Jun Jul Ag S O N D Precio 0.43 0.45 0.46 0.46 0.62 0.58 0.39 0.42 0.51 0.52 0.51 0.55
( $ )

c) Sumas aseguradas segn ramo en una compaa de seguros Ramo


Accidentes y Enfermedades Incendios Vehculos Robados Siniestros Otros

Primas pagadas( $)
567,1332 4 785,724 3 270,026 2 934,848 900,750

25 d) Transporte mas utilizado por los habitantes de el Gran San Salvador Transporte
Bus Vehculo Propio Microbus Taxi Bus y microbus Bus y Taxi Otros

Miles de personas
87.4 40 10 4 26 8 15

Clase No 5 ( 100 min )

26

Unidad II : Medidas de Posicin y de Variabilidad Tema: Media Aritmtica Objetivos de la Clase: Al final de la clase el estudiante ser capaz de: a) Calcular e interpretar la Media Aritmtica Simple dada una serie de datos. b) Calcular e interpretar la Media Aritmtica Agrupada dada una serie de datos. Introduccin: En la unidad anterior se ha intentado describir algunas caractersticas, pero la descripcin sigue siendo incompleta, por lo que necesitamos de otros recursos que nos den oportunidad de tener medidas que sean capaces de resumir o representar el comportamiento de todos los valores que toma la variable que deseamos analizar. Dentro de estos recursos tenemos las medidas de tendencia central y las medidas de variabilidad.

Teora: 1. Medidas de Tendencia Central o de Posicin Una medida de posicin es un valor de la escala de medidas perfectamente definido, puede ser un valor que corresponda al medio o a la medida que sobrepase a la mitad de observaciones, las cuales generalmente se denominan promedios.

1.1. Media Aritmtica

27 Se simboliza x que se lee equis barra . Es el valor que se obtiene sumando los valores de las cantidades y dividiendo el resultado entre el nmero de ellas. La Media Aritmtica puede calcularse para una serie simple y para una serie agrupada.

Media Aritmtica Simple Si se hacen observaciones cuyos valores son x1 , x2 , x3 ... xn La Media aritmtica es la suma de esas cantidades divididas entre el nmero de esas cantidades.

x
Donde :

= x / n

x = sumatoria de todos los valores n = nmero de datos Ejemplos: Las unidades producidas en una fbrica en una semana son: Das Lunes Martes Mircoles Jueves Viernes Sbado n=6 Unidades 350 400 370 450 430 200 Entonces :

= media aritmtica

x x

= x / n = 350 + 400 + 370 + 450 + 430 + 200 6

= 2200 = 366.67 6

28

= 366.7

unidades diarias.

Este resultado indica que en una semana se han producido un promedio de 366.7 unidades diarias. No2 Dado los puntajes de un examen de rendimiento escolar, calcular la media aritmtica. 6 3 6 8 7 7 9 4 8 8 7 6 7 5 7 9 7 9 4 6 9 8 5 2 9 2 8 1 8 1 8 2 8 6 9 2 8 2 7 7 8 7 7 7 8 1 8 1 8 3 8 4 8 7 7 7 7 8 7 6 7 8 7 0 4 1 7 0 7 0 74 67 66 60 61

Solucin : Para calcular la

no es necesario ordenar los datos, entonces: x = y n = 40

tenemos que:

x x

= 3036 40 = 75.9

Esto indica que el resultado promedio base 100 de los puntajes es : 75.9 Para pensar: Cmo sera la frmula para calcular la media aritmtica de una serie agrupada? ( escribir la frmula y hacer ejemplos) Media Aritmtica Para Distribucin de Clases y Frecuencias Cuando cada valor de la variable x es afectado por una distribucin de frecuencias se multiplica el Pm de cada clase por su frecuencia y la suma de

29 esos productos se divide entre la suma de las frecuencias, es decir, el nmero de datos.

= Pmf n

Ejemplo : Las millas recorridas por 20 estudiantes al venir al ITCA desde sus casas se ha agrupado en la tabla. Calcular el promedio de millas recorridas por los estudiantes. millas 0-2 2-4 4-6 6-8 8 - 10 Estudiantes Pm Pmf 2 1 2 5 3 15 4 5 20 8 7 56 1 9 1 n = 20 Pmf = 102

El Pm se obtiene mediante la frmula Pm = Ls+Li luego cada uno de los Pm 2 se multiplican con sus respectivas frecuencias para obtener la sumatoria de estos productos ( Pmf ) . Teniendo estos datos se aplica la frmula de la Media Aritmtica Agrupada. As:

= Pmf n

x x

= 102 20

= 5.1 millas

N.2 Calcular la

para la siguiente distribucin de frecuencias. Clases f 40 - 41 4 Pm Pmf

30 42 - 43 44 - 45 46 - 47 48 - 49 50 - 51 52 - 53 3 4 0 7 2 2

Sntesis. Medida de tendencia central son aquellas que corresponden al medio o a la medida que sobrepasa la mitad de las observaciones. Medidas de tendencia central = Promedios. Media Aritmtica Simple

= x / n

Media Aritmtica Agrupada Ejercicios Propuestos. No1

= Pmf n

Encontrar la X para las siguientes series de datos: a) 10 , 8 , 6 , 0 , 8 , 3 , 2 , 8 , 0 , 2 , 8 . b) 1 , 3 , 3 , 5 , 5 , 5 , 7 , 7 , 9 . c) 120, 5 , 4 , 4 , 4 , 2 , 1 , 0 . d) 755 , 358 , 662 , 663 , 665 , 669 , 711 , 777 , 833 .

No2 Dado la siguiente serie de puntajes de un examen base 100 de rendimiento escolar; transformar la serie en una distribucin de clases y frecuencias, y calcular la Media Aritmtica Agrupada y comparar el resultado con la media aritmtica simple. 63 88 79 92 86 87 83 78 68 76 46 81 92 77 84 76 77 75 98 81 82 81 87 78 94 79 52 82 77 81 77 70 41 70 70 74 67 66 60 61

No3

Calcular la media aritmtica para las siguientes tablas:

a> Distribucin de calificaciones

31 Clases 0-2 2-4 4-6 6-8 8 - 10 f 1 6 14 8 5

b) Vida til en horas de tubos de TV. Horas Tubos 800 - 1039 25 1039 - 1278 325 1278 - 1517 750 1517 - 1756 310 1756 - 1995 20 1995 - 2234 120 2234 - 2473 30

c) Distribucin de resistencias Ohmios f 3.3 - 3.5 2 3.5 - 3.7 18 3.7 - 3.9 48 3.9 - 4.1 97 4.1 - 4.3 138 4.3 - 4.5 104 4.5 - 4.7 69 4.7 - 4.9 20 4.9 - 5.1 4

32

Clase No 6 ( 100 min. )

Tema:

Mediana y Moda

Objetivo de la clase: Al final de la clase el estudiante ser capaz de calcular e interpretar la Mediana y Moda estadstica. Introduccin : Otras medidas de tendencia central o promedios que estudiaremos son la Mediana y la Moda, adems de determinar su respectiva confiabilidad.

Teora: 1. La Mediana. Es un valor de la variable que separa el total de las frecuencias en dos partes iguales, es decir, que es un valor de la variable que por debajo y por encima de l est el 50% de las observaciones.

Mediana para Series Simples

33 Ejemplo

Dadas las siguientes series calcular la Mediana.

x 50% 50% 3 5 6 10 12

x 3 5 7 9 10 12

Cuando los datos son pares se toman los 2do. En medio y se hace la semi suma

Md = 6

Md = 7 + 9 = 8 2

Mediana Para Distribucin de Clases y Frecuencias La mediana para series agrupadas est dada por la siguiente formula: Md = Li + i n/2 - faa f

Donde: Md = Mediana Li = Limite inferior de la clase que contiene la Md i = Intervalo ( ls li ) faa = Frecuencia acumulada anterior de la que contiene la Md f = Frecuencia de la clase que contiene la Md n = Nmero de datos Ejemplo :

34 Calcular la Mediana de la siguiente tabla. Calificaciones 0-2 2-4 4 -6 6-8 8 -4 - 6 10 Alumnos 2 5 14 8 6 Fa 2 7 21 29 1435
35 = 7.5 2 Se busca en la menos fa que la contenga para el ejemplo es el 21

Clase que contiene la Md

El primer paso ser identificar la clase que contiene la Md, lo cual se hace dividiendo el total de los datos entre 2 y ubicando el resultado en la menor frecuencia acumulada que la contenga: El Li = i = faa = f = n = 4 2 7 14 35
n 35 = = 17.5 2 2

, luego se tiene que:

Entonces Md = Li + i n/2 - faa f Md = 4 + 2 17.5 - 7 14

Md = 4 + 2 (0.75) Md = 4 + 1.5 = 5.5 El resultado significa que 50% de los estudiantes tienen una calificacin menor de 5.5 y la otra mitad de los estudiantes una calificacin mayor de 5.5.

2. La Moda Es la cantidad que se repite con ms frecuencia. Ejemplo:

35 No1 En un concurso de belleza en relacin con la medida de la cintura de las candidatas, se obtuvieron los siguientes resultados: Medida de la cintura N. de candidatas 20 pulgadas 18 22 392 24 26 564 28 159 30 41 32 19

Mo

La moda en el concurso fue 24 pulgadas ya que haban 933 candidatas que tenan dicha medida, es decir, la medida que ms se repite.

No2

La moda de vestir es el estilo que ms se usa .

Esto quiere decir que la moda es el dato que ms se repite. La moda puede no existir, incluso si existe puede no ser nica. La Moda en Series Simples Ejemplo No1 Encontrar la Mo de los valores 1, 4 , 8 , 10 , 10 . Solucin Mo = 10 No2 Encontrar la Mo de 2 , 2 , 5 , 7 , 9 , 9 , 9 , 10 , 10 , 11 , 12 .

Solucin

36 Mo = 9

No3

Encontrar la Mo de 1 , 3 , 3 , 7 , 7 .

Solucin Mo = 3 No4 y Mo = 7

Encontrar la Mo de 2 , 3 , 5 , 4 .

Solucin Mo Una serie de datos que tiene un Mo se le llama UNIMODAL. Cuando hay dos o ms modas los datos son llamados BIMODALES o MULTIMODALES. La Moda para Distribucin de Clases y Frecuencias ( mtodo del punto medio ) La moda de una distribucin de frecuencias es el valor del punto medio de la clase modal. Ejemplo Encontrar la Mo de la siguiente tabla: X f 5-9 9 - 13 13 - 17 17 - 21 21 - 25

3 2 3 1

Mo = 9 + 13 2

= 22 = 11 2

37 La clase modal es la 2da puesto que tiene a ms alta frecuencia. Por lo tanto : Pm = 9 + 13 2 Pm = 22 2 Mo = 11

Entonces

Existen otros dos mtodos para calcular la moda en una distribucin de clases y frecuencias: a) Mtodo de interpolacin algebraica b) Mtodo Emprico Mtodo de Interpolacin Este mtodo se basa en la aplicacin de la siguiente frmula:
M O= Li i

1 1 2

Donde : Li =Lmite inferior de la clase que contiene a la moda (clase modal ) i = intervalo de clase 1 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta anterior 2 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta posterior. Determinar el valor de la moda para los siguientes datos Clases frecuencia pm pmf 20 34 7 27 189 34 48 9 41 369 48 - 62 11 55 605 62 76 9 69 621 76 90 8 83 664 90 104 10 97 970 104 118 4 111 444 118 - 132 2 125 250 60 411 fa 7 16 27 36 44 54 58 60

38 2 a) Se determina la clase modal buscando para ello la frecuencia absoluta mayor, que para el presente ejercicio es: f = 11 b) Se determina el valor de
1 = 11 2 =

9 = 2 9 =2

11 -

c) Se determina el valor del intervalo de clase


i = Ls Li

= 34 - 20

= 14

d) Se sustituyen los valores en la frmula de Mo Mo = 48 + 14 ( 2 ) 2+2 Mo = 55 Mtodo Emprico Para distribuciones de datos que sean unimodales y que sean moderadamente asimtricas, se puede calcular en forma aproximada la moda por medio de la relacin:
M 0 = 3M d 2 X

Para el ejercicio anterior determine el valor de la moda usando el mtodo emprico Mo = 3 (66.67) - 2 (68.53) Mo = 270.01 - 137.06 Mo
=

62.95

Compare el valor de la moda obtenido por los diferentes mtodos. Qu puede concluir?

39 Sntesis La media aritmtica : Basada en todos los valores de un conjunto de datos, es el valor promedio. La mediana : Es un valor promedio de posicin La Moda : Conviene su empleo cuando se desea encontrar rpidamente el valor ms frecuente de la distribucin. Ejercicios Propuestos : Encontrar la Media, la Mediana y la Moda para las siguientes series: a) 78 , 76 , 71 , 73 , 75 , 300 , 700 , 69 , 72 , 78 , 69 , 71 , 72 , 73 , 75 , 76 , 78 , 78 , 300 , 700 b) 1 , 2 , 2 , 2 , 4 , 5 , 11 , 11 c) Estatura (pulg) No personas 60 - 62 2 62 - 64 3 64 - 66 7 66 - 68 5 68 70 1 de fa pm pmf

d) Clases 10 - 12 12 - 14 14 - 16 16 - 18 18 - 20 20 - 22 22 - 24 F 140 15 36 7 42 18 3 Fa Pm Pmxf

40 Clase No 7 (100 min) Tema : Cuartiles

Objetivo de Clase: Al final de la clase el estudiante ser capaz de calcular e interpretar los cuartiles de un conjunto de datos. Introduccin: En muchas ocasiones necesitamos conocer la posicin relativa de los valores individuales de la serie, es decir, una vez ordenados los valores de la variable en estudio Qu rango le corresponde dentro de la serie de datos?

Teora: 1. Los cuartiles Son los valores que dividen a la masa de datos observados en cuatro partes iguales. Si una serie de datos la dividimos en cuatro partes iguales cada una de las partes contendr el 25% de los datos observados. Los puntos o valores que separan entre si cada una de las reas son los CUARTILES. Lo anterior nos indica que habr tres puntos de separacin que coincidirn con el. Cuartil No 1 ( Q1 ) Cuartil No 2 ( Q2 ) Cuartil No 3 ( Q3 ) Entonces : Datos Observados 25% 25% 25% 25% Q1 Q2 Q3

41 Bajo el primer cuartil se tendr el 25% del total de datos. Bajo el segundo cuartil se tendr el 50% y bajo el tercer cuartil el 75%. Ntese que el cuartil dos ( Q2 ) divide los datos en dos reas iguales, por lo que su valor ser exactamente igual al valor de la mediana. Calculo de cuartiles para la serie simple Los cuartiles son valores que dividen a un conjunto de datos en cuatro partes iguales El lugar de posicin de Q1 , Q2, Q3 se calculan con las siguientes relaciones:
N1 = n +1 4 N2 = n +1 2

N3 =

3( n +1) 4

Simple

NQ1 = 1x n 4

NQ1 = 2x n 4

NQ1 = 3x n 4

Agrupada

Nota: Si aparecen valores fraccionarios de estas relaciones, se hace la interpolacin entre los valores correspondientes, a los valores entre los que se encuentra la fraccin. Ejemplo: Dada la serie simple: 2,3,20,13,18,5,7,10, encontrar los cuartiles de la serie: Solucin: 1. Ordenar los datos: 2,3,5,7,10,13,18,20 2. Determinacin de la posicin de Q1
N1 = n +1 4

N1 =

8+1= 9 4 4

= 2.25

42

Q1 se ubica a 2 espacios del inicio de la serie, ms 1/4 de espacio entre el 2do y 3er elemento de la serie, es decir:
Q1 =

3+ (0.25 (5-3) ) = 3 + 0.25 (2) = 3 + 0.5 = 3.5

3. Determinacin de la posicin de Q2
N2 = n +1 2

N2 =

8+1 = 9 = 4.5 2 2

Q2 se encuentra a 4 espacios del inicio de la serie, ms de espacio entre el 4 y 5 elemento de la serie, es decir:
Q2 =

7 + (0.5 (10 - 7) ) = 7 + 0.5 (3) = 7 + 1.5 = 8.5 = Md

Md = 7 + 10 = 8.5 2

4. Determinacin de la posicin de Q3
N3 =
N3 =

3(n +1) 4

3 (8+1) = 3 (9) = 27 = 6.75 4 4 4

Q3 se ubica a 6 espacios del inicio de la serie, ms 3/4 entre el 6 y 7 elemento, es decir:


Q3 =

13 + (0.75 (18-13) ) = 13 + 0.75 (5) = 13 + 3.75 = 16.75

Interpretacin del valor de los cuartiles: Q1 = 3.5 Q2 = 8.5 Q3 = 16.75 Ejercicio de refuerzo:

43 Durante los 20 das hbiles de un mes un mesero recibi las siguientes propinas en dlares: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. 2,2,3,3,4,4,4,4,4,5,5,5,5,5,5,6,6,8,8,8 Determine los valores de los tres Cuartiles correspondientes Q1 , Q2 , Q3

Clculo de los Cuartiles para distribucin de clases y frecuencias Frmula para Q1 Q1 = Li + i Frmula para Q2 Q2 = Li + i Frmula para Q3 Q3 = Li + i 3n/4 faa f n/2 - faa f NQ2 = 2 x n 4 NQ3 = 3 x n 4 n/4 - faa f NQ1 = 1 x n 4

Donde : Li = Lmite inferior de la clase donde estar ubicado el Q I = Intervalo de clase ( LS LI ) n = Nmero de datos faa = Frecuencia acumulada anterior f = Frecuencia de la clase donde estar ubicado el Q Procedimiento General Paso 1 - Determinar el nmero de orden (No) para cada uno de los cuartiles Para Q1 Para Q2 Para Q3 N1 = n/4 N2 = n/2 N3 = 3n/4

44 Paso 2 - Una vez encontrado el No se busca la frecuencia acumulada para determinar la clase donde estar comprendido el cuartil. Paso 3 - Conocida la frecuencia acumulada se determina la faa. Paso 4 - Se sustituyen los datos en la frmula Ejemplo No1 Dada la siguiente tabla, encontrar los cuartiles. Clases 2-4 4-6 6-8 8 - 10 10 - 12 12 - 14 f 5 8 12 7 5 2 39 fa 5 13 25 32 37 39

Q1 Q2 Q3

Q1 = Li + i

n/4 - faa f

N1 = 1 x n = 2 (39) = 9.75 4 4 La fa donde se encuentra N1 es 13 por lo tanto la clase que contiene a Q1 es 2da , su faa = 5 Entonces : Q1 = 4 + 2 Q1 = 5.19 Q2 = Li+ i n/2-fa f 9.75-5 8

N 2 = 2 x n = 2 (39) = 19.5 4 4 La fa donde se encuentra N2 es 25 Por lo tanto la clase que contiene a Q2 es 3ra , faa = 13

45 Entonces: Q2 = 6 + 2 Q2 = 7.08 Q3 = li + i 3n/4-faa f 19.5 - 13 12

N3 = 3 n = 3 (39) = 29.25 4 4 La fa donde se encuentra N3 es 32 Por tanto la clase que contiene a Q3 es 4ta , faa = 2.5 y Entonces: Q3 = 8 + 2 Q3 = 9.21 Ejemplo N0 2 Calcular los cuartiles para la siguiente tabla de distribucin de frecuencia clases 60-62 62-64 64-66 66-68 68-70 Q1 f 2 3 7 5 1 18 fa 2 5 12 17 18 29.25-25 7

N1 = 1x n = 1 x 18 = 4.5 4 4 La fa donde se encuentra N1 es 5 por lo tanto la clase que contiene a Q1 es 2d, faa = 2 Entonces Q1 = 62 + 2 Q1 = 63.67 4.5-2 = 63.67 3

Q2

N2 = 2 x n = 2 x 18 = 9 4 4

46 La faa donde se encuentra N2 es 12 por lo tanto la clase que contiene a Q2 es 3ra y faa = 5 Entonces Q2 = 64 + 2 Q2 = 65.14 Q3 N3 = 3 x n = 3 x 18 = 54 = 13.5 4 4 4 La fa donde se encuentra N3 es 17 por lo tanto la clase que contiene a Q3 es 4ta y faa = 12 Entonces Q3 = 66 +2 Q3 = 66.6 Sntesis : Los cuartiles son los valores que dividen a la masa de datos observados en cuatro partes iguales. # del cuartil x # de datos Q1 = li + i n/4 faa y N1 = n/4 4 f Q2 = li + i Q3 = li + i n/2 faa f 3n/4 - faa f y y N2 = n/2 N3 = 3n/4 # del decil x # de datos 10 # del percent x # de datos 100 13.5 12 5 9-5 7

Ejercicios Propuestos :

47 Encontrar los cuartiles para las siguientes distribuciones de frecuencias. Clases 20-35 35-50 50-65 65-80 80-95 95-110 110-125 f 7 13 11 9 8 8 4 fa pm Pmxf a)

Q1 = 44.23 Q3 = 89.38

Clases 0-10 10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100

F 6 2 5 2 3 2 1 1 0 3

fa

pm pmxf

b)
Q1 = 11.25 Q2 = 29 Q3 = 53.75

Clase No 8 (100 min)

48 Tema : Deciles y Percentiles Objetivo de clase : Al final de la clase el estudiante ser capaz de calcular los deciles y percentiles de una distribucin de frecuencias dada. Introduccin : Segn conveniencia, en ocasiones no necesitamos dividir los datos observados en cuatro partes, sino, en diez o cien segn el estudio, para ello se utilizan los deciles y los percentiles.

Teora : 1. Deciles Son aquellos puntos los cuales dividen en diez partes equivalentes los datos observados y cada parte o rea est separada entre s por un punto o valor llamado DECIL. Esto quiere decir que habrn nueve (9) deciles. Procedimiento General Los pasos a seguir son los mismos que los vistos en los cuartiles con la diferencia de el Nmero de Orden ( No ). X = 5 D = Li + i No faa f

Donde el nmero de orden ( No ) para cada decil ser : No para D1 N1 = n/10

49 No No No No No No No No para para para para para para para para D2 D3 D4 D5 D6 D7 D8 D9 N2 = n/5 N3 = 3n/10 N4 = 2n/5 N5 = n/2 N6 = 3n/5 N7 = 7n/10 N8 = 4n/5 N9 = 9n/10

Ejemplo: Encontrar los deciles para la siguiente tabla de distribucin de frecuencias. Clases 5 - 10 10 - 15 15 - 20 20 - 25 25 - 30 30 - 35 35 - 40 40 - 45 45 - 50 50 - 55 f 2 4 6 9 13 11 7 4 3 1 fa 2 6 12 21 34 45 52 56 59 60

60

D1

N1 = 60 = 6 10 La fa que contiene el N1 es 6 la clase es que contiene a D1 2da , faa = 2 Entonces : D1 = 10 + 5 6-2 4 D1 = 15

D2

N2 = (2)(6) = 12 La fa que contiene el N2 es 12

50 la clase que contiene a D2 3ra ,faa = 6 Entonces : D3 D2 = 15+ 5 12.6 6 D2 = 20

N3 = (3)(6) = 18 La fa que contiene el N3 es 21 la clase que contiene a D3 4ta y faa = 12 Entonces : D3 = 20 + 5 18 - 12 9 D3 = 23.33

D4

N4 = (4)(6) = 24 La fa que contiene el N4 es 34 la clase que contiene a D4 5ta, faa = 21 Entonces : D4 = 25+5 30-21 13 D4 = 26.15

D5

N5 = (5)(6) = 30 La fa que contiene el N5 es 34 la clase que contiene a D5 5ta y faa = 21 Entonces : D5 = 25+5 30 - 21 13 D5 = 28.46

D6

N6 = (6)(6) = 36 La fa que contiene el N6 es 45 la clase que contiene a D6 6to y faa = 34 Entonces : D6 = 30 + 5 36 - 34 D6 = 30.91

51 11 D7 N7 = (7)(6) = 42 La fa que contiene el N7 es 45 la clase que contiene a D7 6ta y faa = 34 Entonces : D8 D7 = 30+5 42 - 34 11 D7 = 33.64

N8 = (8)(6) = 48 La fa que contiene el N8 es 52 la clase que contiene a D8 7ta y faa = 45 Entonces : D8 = 35 + 5 48 - 45 7 D8 = 37.14

D9

N9 = (9)(6) = 54 La fa que contiene el N9 es 56 la clase que contiene a D9 8ta y faa = 52 Entonces : D9 = 40+5 54 - 52 4 D9 = 42.5

2. Percentiles Los percentiles son llamados tambin CENTILES y dividen a la distribucin en 100 reas, por lo tanto habrn 99 percentiles. Procedimiento General

52 Los pasos a seguir son los mismos de los deciles, incluso la misma frmula, con la diferencia del nmero de Orden (No) ya que n se divide entre 100 y el cociente se multiplica por 1,2,3, etc. Segn el percentil del que se trate.

Ejemplo. Para la tabla anterior encontrar el percentil 8,10 y 99. 60/100 = 0.6 Solucin. Para N8 = (8) ( 60 ) = 100 La fa que contiene el N8 es 4.8 La clase que contiene a P8 2da y faa = 2 Entonces : P8 = 10 + 5 4.8 - 2 4 P8 = 13.5 P8 tenemos que el

Para

N10 = (10) ( 60) = 6 100 La fa que contiene el N10 es 6 La clase que contiene a P8 es 2da y faa = Entonces : P10 = 10 + 5 62 4 P10 = 15

P10 tenemos que el

Para

N99 = (99)(60) = 59.40 100 La fa que contiene el N99 es 60 La clase que contiene a P99 es 10 y faa = 59 Entonces : P99 = 50+5 59.4 - 59 P99 = 52

P99 tenemos que el

53 1

Sntesis : Deciles :

Puntos que dividen una distribucin de datos en 10 partes equivalentes.

Percentiles : Puntos que dividen una distribucin de datos en 100 partes equivalentes.

Ejercicios Propuestos : No1 Encontrar los cuartiles Q 1 = 28 , Q2 = 35 y Q3 = 45 en la siguiente serie de datos: 35,20,55,22,50,25,50,28,45,28,42,30,40,35,35.

No2 La siguiente distribucin corresponde a los salarios mensuales en $ de un grupo de 100 personas. Salarios $ 300-350 350-400 400-450 450-500 500-550 f 16 24 30 20 10 100 f 16 40 70 90 100

54 calcular los cuartiles, el decil cinco , el decil ocho , el percentil setenta y el percentil cuarenta.

No3 Calcular para la siguiente distribucin el percentil setenta y dos , el decil seis y el cuartil dos. clases 150-155 155-160 160-165 165-170 170-175 175-180 F 5 18 34 48 20 28 fc No4 Para la siguiente distribucin calcular el cuartil dos , el decil cinco y el percentil cincuenta. Estatura en metro 1.54-1.60 1.61-1.67 1.68-1.74 1.75-1.81 1.82-1.88 1.89-1.95 Personas 5 10 18 26 15 6 Fa

80 Clase No 9 (100 min) Tema: Medidas de Dispersin

Objetivo de la Clase : Al final de la clase el estudiante ser capaz de : 1. Identificar una medida de dispersin 2. Calcular la amplitud o rango de una distribucin dada. 3. Calcular la desviacin media de un conjunto de datos Introduccin : Si analizamos las siguientes series: Serie A : 4 , 4 , 5 , 5 , 6 , 6 Serie B : 15 , 1 , 1 , 2 , 6
x= x=

30/6 = 5 25/5 = 5

Se observa que ambas series tienen el mismo promedio y no obstante existen grandes diferencias en la magnitud de los trminos , por lo que se necesita de otro tipo de medidas para analizar e interpretar de una forma ms profunda los datos recopilados.

55 Teora : 1. Medidas de Dispersin Las medidas de dispersin tiene por objeto mostrar el mayor o menor grado de heterogeneidad de las observaciones hechas. 1.1 Amplitud Total o Rango La amplitud total o rango es la medida ms elemental , como medida de variabilidad o dispersin ya que es la diferencia entre los valores mximo y mnimo que toma la variable. Por ejemplo en la serie: 10 , 12 , 15 , 20 y 34 la amplitud o rango es 34 - 10 = en frmula queda as :

AT = x mayor x menor Donde : AT = amplitud o rango x mayor = valor mayor de todos los datos x menor = valor menor de todos los datos

Sntesis : Amplitud o rango es la medida de dispersin que indica la diferencia entre los valores mximo y mnimo que toma la variable. Ejercicios Propuestos : No1 A continuacin se presentan dos medidas de temperaturas en oC de dos lugares : El salvador y el Estado de Arizona. Temperatura en El Salvador : 19-19-20-21-23-23-22-25-26-26-26-20. Temperatura en Arizona : 2-3-3-5-8-1-15-17-19-25-27-39.

a ) Cul es el rango de las temperaturas en El Salvador? b) Cul es el rango de las temperaturas en Arizona?

56 No2 Dadas las siguientes series calcular su rango. serie A = 50-8-1.2-9.5-6.5 serie B = 60-8.5-1.8-9-6.2 serie C = 55-7.5-2.0-8.4-4.6 No3 Los salarios mensuales de dos empresas son : a) Empresa A : 340-340-350-400-500-650-700-725-725-800-850-900 950-1000-1200. b) Empresa B : 340-400-400-500-700-800-850-900-1000-1100 1300-1400-1500-2000-5000. Calcular la Media aritmtica y Amplitud para cada serie.

Tema : Desviacin Media Objetivo de la Clase : Al final de la clase el estudiante ser capaz de calcular las desviaciones media y tpica de una distribucin dada. Introduccin : La desviacin media es un mtodo basado en las desviaciones de cada uno de los trminos en relacin con la media aritmtica , sin embargo , para realizar sus operaciones no existe fundamento matemtico y se hace en forma convencional , es por eso que surge el calculo de la desviacin tpica o estndar.

Teora: 1. Desviacin Media

57 La desviacin media se define como la media aritmtica de las desviaciones de todos sus trminos. Su clculo es sencillo y se basa en hallar las diferencias de la media aritmtica respecto a cada dato sin considerar el signo que le afecte. Desviacin Media para series simples.

DM =

x x
n

Donde : Dm = desviacin media x = cada una de las observaciones

x = media aritmtica
n = nmero de datos

Ejemplo: No1 Calcular la desviacin media de la siguiente serie: 3-5-6-9-10-15 solucin Paso 1 Calcular la Media Aritmtica 3+5+6+9+10+15 x = ----------------------------------6 x = 48 / 6 = 8 Encontrar las diferencias x 3 5 6 9 10 15
x x

paso 2

x x

x x

x x

-5 -3 -2 1 2 7

5 3 2 1 2 7 = 20

Paso 3

Sustituir en la frmula

58
DM =

x x
n

20 Dm = ------6 Dm = 3.33 Sobre la interpretacin de esta medida, diremos en general, que entre menor sea sta, menos dispersin tienen los datos de la serie.

Desviacin Media para Distribuciones de Clases y Frecuencias

DM =

Pm x f
n

Donde :

Dm = desviacin Media Pm = punto medio

f = frecuencia absoluta n = nmero de datos Ejemplo: Calcular la desviacin media para la siguiente distribucin de frecuencias. Solucin: Para la solucin de ste , es necesario calcular la x y para ello se necesita el Pm , por lo tanto tendremos: clases 5-7 7-9 9-11 11-13 13-15 15-17 17-19 f 3 7 10 12 9 8 5 54 Pm 6 8 10 12 14 16 18 Pmf 18 56 100 144 126 128 90 662 /Pm x / / Pm x / f 6.26 18.78 4.26 29.82 2.26 22.6 0.26 3.12 1.74 15.66 3.74 29.92 5.74 28.7 148.6

x = media aritmtica

59 La
x x

= Pmf n
Pm x f n

662 = ---------54

= 12.26

Entonces :

Dm =

148.6 Dm = ------------54 Dm = 2.75

Clase No10 (100 min) Desviacin tpica o Estndar En la desviacin media , alguna de las desviaciones son positivas y otras negativas , sin embargo , se prescinde de ellos con el uso de las barras de valor absoluto , siendo ste el poco fundamento matemtico. Para que el clculo de la desviacin estuviera basado en la matemtica , se ideo el mtodo de la desviacin standard , mediante el cual cada desviacin se eleva al cuadrado y de esa manera se consigue matemticamente que todos los resultados sern positivos. Desviacin Standard para Series Simples

( x x )
n

Donde : (sigma) = desviacin tpica Ejemplo: Calcular la desviacin estndar de la siguiente serie: 3-5-6-9-10-15

60 Solucin:
x

=
n

48 x = -----------x =8 6 Ahora completaremos la tabla y luego sustituiremos los datos necesarios a la frmula. x xx (x x )
2

3 5 6 9 10 15 Entonces : =

( x x )
n

5 3 2 1 2 7 20
2

25 9 4 1 4 49 92

= 15.33 = 3.92

Desviacin Estndar para Distribucin de Clases y Frecuencias

( Pm x ) =
n

Ejemplo: Calcular la desviacin estndar para la siguiente tabla. Clases 5-7 7-9 9-11 11-13 f 3 7 10 12 Pm 6 8 10 12 Pmf 18 56 100 144 Pm- x 6.26 4.26 2.26 0.26 (Pm-x)2 39.19 18.15 5.11 0.07 (Pm-x)2f 117.57 127.05 51.1 0.84

61 13-15 15-17 17-19 662 = -------54 = 9 8 5 54


x

14 16 18 = 12.26

126 128 90 662

1.74 3.74 5.74

3.03 13.99 32.15

27.27 111.92 164.75 600.5

Entonces :

600.5 = 54

= 3.33

Sntesis: Desviacin Media (Dm) se define como la media aritmtica de las desviaciones de todos sus trminos. Es un clculo sencillo pero con muy poco fundamento matemtico. Desviacin estndar o tpica ( ) creada para solventar la deficiencia matemtica de la desviacin media, elevando al cuadrado para hacer desaparecer los signos negativos.

Ejercicios Propuestos : Calcular la desviacin media y la desviacin tpica para las tablas dadas , observando la diferencia de los resultados. a) 1-2-2-4-5-11-11-20 clases 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100 F 8 6 15 7 10 29 12 8 b) c) clases 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 f 34 68 50 70 100 20 112 38

62

Clase No11 (100 min) Tema : Varianza y Coeficiente de Variabilidad Objetivo de la Clase : Al final de la clase el estudiante ser capaz de calcular e interpretar la varianza y el coeficiente de variabilidad de una distribucin dada. Introduccin: Las medidas de dispersin son nmeros concretos, es decir, son expresadas en las unidades de las variables en estudio. Con ellas se puede conocer la dispersin de los datos de una serie estadstica, pero no se puede comparar de dos o ms variables dadas en diferente unidad de medida. Por ejemplo podemos conocer la desviacin tpica de las variables peso y estatura de un grupo de personas, digamos 5.5lb y 10cm respectivamente. Podra el lector decir, cual de las dos variables (peso y estatura) tiene menor variabilidad?

Teora:

63

1.

Varianza

La varianza es el cuadrado de la desviacin tpica en smbolo 2 = s

La varianza mide esencialmente el promedio de las desviaciones, lo cual ser siempre positivo.

Ejemplo: Calcular la varianza de una distribucin de clase cuya desviacin tpica es 3.33. Solucin. S = 2 S= ( 3.33 )2 s = 11.08

2.

Coeficiente de variabilidad

Una medida de variabilidad, cualquiera que sea, definir mejor dispersin cuanto menor sea su valor. Para establecer diferencia en la variabilidad o dispersin de dos o ms variables utilizaremos el coeficiente de variabilidad, que es una medida relativa abstracta. cv = ( / Donde cv = coeficiente de variabilidad
x

) 100

64 = desviacin tpica x = media aritmtica El cv expresa la desviacin tpica como un porcentaje del promedio alrededor del cual se toman las desviaciones. Ejemplo. En una distribucin donde se analizan los puntajes de 120 estudiantes el valor de la media aritmtica es 44.58 y el de la desviacin tpica 8.13 Calcular el cv de la distribucin. Solucin: Cv = (
8.13 44.58

)100

Cv =18.40

Para interpretar este valor, hacemos uso de la siguiente tabla: Valor del coeficiente de variabilidad De 0 a menos del 10% De 10 a menos del 20% De 20 a menos del 30% De 30 a menos del 40% De 40 ms Grado de representatividad de la en la serie dada Media altamente representativa Media bastante representativa Media tiene representatividad Media representatividad dudosa Media carente de representatividad

Esto indica que la X del ejemplo es media bastante representativa ya que el valor de CV est entre 10 y 20

Sntesis : La varianza es el cuadrado de la desviacin tpica. La varianza mide el promedio de las desviaciones. El coeficiente de variabilidad expresa la desviacin tpica como un porcentaje del promedio.

65 El coeficiente de variabilidad se interpreta mediante representatividad de la Media en la serie.

Clase No12 (100 min) EJERCICIOS PROPUESTOS

Calcular la varianza y el coeficiente de variabilidad de las siguientes series. No1 x f No2 19-20-21-22-23-24-25-26 2 2 1 1 2 0 3

2-3-3-5-8-10-15-17-19-25-27-39

No3 clases 60-75 75-90 90-105 105-120 120-135 f 8 10 16 9 7

No4 clases 150-200 200-250 250-300 300-350 350-400 f 4 7 13 8 2

66

Clase No 13 ( 100 min )

Unidad III : Distribucin Normal Tema: La Curva Normal

Objetivo de la Clase: Al final de la clase el estudiante ser capaz de explicar el concepto y propiedades de la Curva Normal. Introduccin: El concepto de la curva normal parece haber sido ideado primeramente por Abraham De Moivre y lo explic en 1733, creyndose entonces, que no tena ms aplicaciones prcticas que resolver los problemas que surgan en los juegos de azar. Gauss emple ms tarde la curva para describir la teora de los errores accidentales en las medidas que intervienen en el clculo de las rbitas de los cuerpos celestes. Debido al trabajo de Gauss a esta curva se le llamo tambin Curva de Gauss.

67

Teora:

1.

La Curva Normal

La curva Normal puede considerarse como el lmite de un histograma o representacin grfica de una distribucin de frecuencias, cuando el nmero de clases se hace muy grande y el nico factor que interviene es la probabilidad.

1.1

Partes de la Curva Normal

Eje de Simetra

Altura Mxima

Origen

Base del eje de Simetra

1.2

Propiedades de la Curva Normal

68 Las principales caractersticas de la Curva Normal son: 0 La Curva Normal tiene forma de Campana. Es una Curva Uniforme con ordenadas siempre positivas. Es Montona decreciente hacia ambos lados del punto mximo. Es Simtrica. Debido a su simetra la ordenada mxima est sobre el eje que la divide en dos partes iguales. Como la media aritmtica es el centro de cualquier distribucin, en la curva normal la media aritmtica se encuentra en el pie del eje de simetra. El rea bajo la curva normal representa el 100% de las observaciones; el 50% estar a cada lado de la media aritmtica.

Las curvas simtricas pueden ser ms o menos puntiagudas o aplanadas que la curva normal. Las curvas simtricas que son ms puntiagudas que la normal se llaman Leptocrtica y las ms planas se llaman Platicrticas.

Leptocrtica

Platicrtica

69

Sntesis : Curva Normal es el lmite de un histograma cuando el nmero de clase se hace muy grande y el nico factor que interviene es la probabilidad. La Curva Normal es simtrica, con ordenadas siempre positivas. La media aritmtica divide en mitad la Curva Normal Sobre el valor de la media aritmtica se encuentra la altura mxima de la Curva Normal.

Tema :

Ecuacin de la Curva Normal

Objetivo de la Clase : Al final de la clase el estudiante ser capaz de aplicar la ecuacin de la curva en el ajuste de distribucin de frecuencias. Introduccin : La Curva Normal tiene su propia ecuacin, la cual significa que es posible analticamente obtener valores para dos variables los que llevados a un grfico nos reproducirn el trazo de la curva dada. Teora : 1. Ecuacin de la Curva Normal Las variables que se usan son x y y La x nos representar la variable estadstica de que se trate y la y representar la frecuencia.

70 La frmula que nos permite determinar las ordenadas para cada abscisa es: y= ni 2 Donde: y = n= i = = = e = x = Ordenada correspondiente al valor de x Nmero de Observaciones Intervalo de Clase Desviacin Tpica de la distribucin Constante ( 3.14159 ) Constante base del sistema de logaritmo natural ( 2.7118 ) Variable independiente . e x 2 /22

1.1

Ajuste de la Curva Normal

Dentro de las propiedades de la curva, hemos mencionado que sta tienen forma de campana, de tal manera, que cuando una serie de datos, al elevarlos a un grfico, tenga esta forma podemos considerar que su distribucin se ajusta a la curva normal. Sin embargo, existen serie de datos que su grfico no es una curva normal, es entonces que debemos ajustar dicha distribucin para obtener una curva normal. Al ajustar una distribucin de frecuencias lo hacemos con la siguiente finalidad: Averiguar si la curva dada describe o no la forma general de la distribucin Obtener generalizaciones respecto a las proporciones de los trminos, que debe esperarse queden por encima, por debajo o entre determinados valores. Partiendo de una curva ajustada, podemos determinar la distribucin probables de los valores de una serie de datos. El mtodo que usaremos para ajustar la curva normal ser mediante la frmula que hemos dado anteriormente y haciendo uso de tablas.

71 Ejemplo No 1 Dado los salarios en colones por hora de 25 empleados y partiendo que han sido seleccionados como una muestra, usaremos los datos muestrales para encontrar el nmero terico de empleados en cada intervalo de clase. ( en otras palabras, se har un ajuste al comportamiento normal de estos datos ) Salarios () Empleados 0 - 3 1 3 - 6 4 6 - 9 9 9 - 12 6 12 - 15 2 15 - 18 3 Sugerencia: Hacer el histograma de estos datos para observar el comportamiento de estos y ver la necesidad de ajustarlos a comportamiento normal Solucin: PRIMER PASO : Determinar el valor de la media aritmtica y la desviacin tpica Salarios () 03 3-6 6-9 9 - 12 12 - 15 15 18 Empleados 1 4 9 6 2 3 Pm 1.5 4.5 7.5 10.5 18.5 16.5 Pmf 1.5 18 67.5 63 27 49.5 226.5 = Pmf n 226.5 = -------25 Pm x (Pm 7.56 4.56 1.56 1.44 4.44 7.44
x

57.15 20.79 2.43 2.07 19.71 55.35

)2 (Pm x )2f 57.15 83.16 21.87 12.42 39.42 166.05 380.07

Media Aritmtica

72
x

= 9.06 ( Pm x )2 f n 380.07 ---------25

Desviacin Tpica

= = = 3.9

SEGUNDO PASO: Determinar la altura mxima de la curva. El valor de la media aritmtica coincide con el punto de origen de la curva normal, en este punto el valor de la variable x es cero , ya que, es el punto de partida para los valores que toma tanto a la izquierda como a la derecha de la media aritmtica. Por lo que en: y= ni 2 al sustituir los datos tenemos: 25 x 3 y = ------------ . e (o) 2 /22 3.9 2 75 y = --------------9.78 y = 7.67 Entonces la mayor altura, o sea, la altura de la media aritmtica es TERCER PASO : Determinar los valores tericos para cada clase 7.6 1 e
o

. e x 2 /22

73 a) Los valores tericos que tratamos de encontrar corresponden al Pm de cada clase, de tal manera que, primero se calcular la distancia de cada punto medio con la siguiente frmula: x =
Pm x

Para la primera clase 0 3 Para la segunda clase 3 6 Para la tercera clase 6 9 Para la cuarta clase 9 12 Para la quinta clase 12 15 Para la sexta clase 15 18 b)

-7.54 x1 =---------3.9 -4.56 x2 = ---------3.9 - 1.56 x3 =----------3.9 1.44 x4 =----------3.9 4.44 x5 =-----------3.9 7.44 x6 =-----------3.9

x1 = - 1.94 x2 = - 1.17 x3 = - 0.4 x4 = 0.37 x5 = 1.14 x6 = 1.91

Cuando ya tenemos los valores de x se recurre a la tabla de Ordenadas de la Curva de Probabilidad Normal
x

Uso de la Tabla : Para la clase 0 3 : x 1 = -1.94 , luego en la columna de la tabla se busca los dos primeros dgitos, es decir, 1.9 y como el siguiente dgito es 4 , en la columna No 4 al mismo nivel de x 1 1.9 estar el valor de e x 2 /2 que en este caso es 0.15232 As, para las otras clases tenemos: Para clase Para clase Para clase Para clase Para clase 36 69 9 12 12 15 15 18 x2 = x3 = x4= x5 = x6 = - 1.17 -0.4 0.37 114 191 0.50437 0.92312 0.93382 0.52214 0.16137

74 c) Los valores tericos se encontrarn multiplicando el valor de la altura mxima por el valor de e x 2 /22 encontrado para cada clase. Para la primera clase 0 3 7.67 ( 0.15322) 1.17 1 Para la segunda clase 3 6 7.67 ( 0.50437) 3.87 4 Para la tercera clase 6 9 7.67 (0.92312) 7.08 7 Para la cuarta clase 9 12 7.67 ( 0.93382) 7.16 7 Para la quinta clase 12 15 7.67 (0.52214) 4 4 Para la sexta clase 15 18 7.67 (0.16137) 1.24 2
Es posible que este valor sea aproximado Convencionalmente para no alterar el Nmero de datos

Entonces: Salarios () 0 - 3 3 - 6 6 - 9 9 - 12 12 - 15 15 - 18 f real 1 4 9 6 2 3 25 f terica 1 4 7 7 4 2 25

Por lo tanto:

75
y
8 6

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

Clase No14 (100 min) Ejemplo No2 Graficar la curva normal para la siguiente serie, ajustando las frecuencias de ser necesario. Clases 0-2 2-4 4-6 6-8 8-10 Solucin: PRIMER PASO : f 1 3 4 10 2

76 Determinar el valor de la media aritmtica y la desviacin tpica Salarios () 0-2 2-4 4-6 6-8 8-10 Empleados 1 3 4 10 2
x

Pm

Pmf

Pm x

(Pm x )2

(Pm x )2f

Media Aritmtica

= Pmf N

= --------x

Desviacin Tpica

= =

( Pm n

)2 f

---------- = SEGUNDO PASO : Determinar la altura mxima de la curva. 0 y= . e


(o) 2 /22

77 y= y = Entonces la mayor altura,o sea,la altura de la media aritmtica es : TERCER PASO : Determinar los valores tericos para cada clase a) x =
Pm x

Para la primera clase 0 2 Para la segunda clase 2 4 Para la tercera clase 4 6 Para la cuarta clase 6 8 Para la quinta clase 8 10

x1 =-----------x2 = -----------x3 = ------------x4 = ------------x5 =--------------

x1 = x2 = x3 = x4 = x5 =

b)

Cuando ya tenemos los valores de x se recurre a la tabla de Ordenadas de la Curva de Probabilidad Normal 02 24 46 68 8 10 x= x= x= x= x=

Para clase Para clase Para clase Para clase Para clase

c) Multiplicar el valor de la altura mxima______ e x 2 /22 encontrado para cada clase.

por el valor de

78

Para la primera clase 0 2 Para la segunda clase 2 4 Para la tercera clase 4 6 Para la cuarta clase 6 8 Para la sexta clase 8 10


Es posible que este valor sea aproximado Convencionalmente para no alterar el Nmero de datos

Entonces:

Salarios () 0-2 2-4 4-6 6-8 8-10

F real 1 3 4 10 2 20

f terica

20

Por lo tanto:

79
y
8

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

Ejemplo No 3 Graficar la curva normal para la siguiente serie ajustando las frecuencias de ser necesario. Clases 0-10 10-20 20-30 30-40 40-50 Solucin: PRIMER PASO : Salarios () 0-10 10-20 20-30 30-40 40-50 Empleados 2 5 1 6 1 Pm Pmf Pm
x

f 2 5 1 6 1 15

(Pm

)2 (Pm x )2f

80 Media Aritmtica
x

= -------x

Desviacin Tpica =

SEGUNDO PASO : calculando ymax 15 x 10 y= 1236 2 y= y =

0 e
(o) 2 /22

1 e
0

TERCER PASO : Frecuencias Reales 2 5 1 6 1 15


Pm x

Clases 0-10 10-20 20-30 30-40 40-50 15

x=

Altura Ordenada Mxima Encontradas por en Tabla Ordenada de tabla

Frecuencias Tericas

81 Entonces:
y
8

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

Sntesis : 0 Una distribucin de frecuencias se ajusta cuando al graficarla no da la forma de una curva normal. 1 Para calcular la altura mxima, la variable x de la frmula es cero. 2 La altura mxima de la curva normal se encuentra sobre el valor de la media aritmtica. 3 La sumatoria de las frecuencias tericas debe ser igual a la sumatoria de las frecuencias reales, es decir, al nmero de datos. 4 Por lo menos un dato de las frecuencias tericas se aproxima a conveniencia para no alterar el nmero de datos. ( cuando as se requiere ) Ejercicios Propuestos: Graficar la curva normal para las siguientes distribuciones, ajustando las frecuencias de ser necesario. No1 Clases 0-25 25-50 50-75 75-100 f 10 50 20 30 Pmf Pm
2

e x 2 /
22

Y =ymax e x 2
/22

Fajust.

82 No2 Clases 0-20 20-40 40-60 60-80 80-100 f 2 6 3 8 2 Pmf ( Pm


x

)2

( Pm x )2 f

X=Pm - x

e x 2 /
22

Clase No 15 ( 100 min ) Tema: CURVA NORMAL ESTANDAR (reas bajo la Curva)

Objetivo de la Clase: Al final de la clase el estudiante ser capaz de: -Conocer la representacin grfica de la curva normal y sus equivalencias porcentuales. -Manejar la tabla de reas bajo la curva normal. Tema: CURVA NORMAL ESTANDAR

83 Como se ha podido observar todo conjunto de datos correspondiente a una distribucin de frecuencias se puede asociar a una curva normal, no obstante, es incmodo el tener que estar construyendo una curva especfica para cada conjunto de datos. Para evitar eso se ha establecido una curva nica denominada curva normal estndar, la cual se caracteriza por tener una media aritmtica igual a cero y una desviacin estndar igual a uno.

x =0

1.

reas bajo la Curva

El rea bajo la curva normal representa el cien por ciento de todas las observaciones. Debido a la simetra de la curva, se tiene el 50% de las observaciones a cada lado de la media aritmtica. El rea comprendida entre la media aritmtica y un valor cualesquiera de la escala estandarizada, es dado por la frmula:

z=

x x

Donde:

z = valor estandarizado de la variable x = Punto cualquiera de la escala x = Media Aritmtica = Desviacin Tpica

Para determinar el valor del rea bajo la curva correspondiente a un z dado , es necesario auxiliarse de la tabla correspondiente (ver anexo 1). A continuacin se plantean una serie de ejercicios que ilustran la manera de obtener tal informacin. NOTA: Si Z es negativo, el rea est a la izquierda de X Si Z es positivo, el rea esta a la derecha de la X

84

Dada una distribucin N(0,1) halle las reas que cumple con las siguientes condiciones: 1) Z > 1.53 Solucin: - Se ubica z en la curva

z > 1.53 - Se busca el valor del rea bajo correspondiente al valor de Z dado:

- Se determina el valor del rea buscada: A (z > 1.53) = 0.5 0.4370 =0.63 x 100 = 6.3 %

2) Z < 1.95 Solucin: - Se ubica z en la curva

Z < 1.95 - Se busca el valor del rea bajo correspondiente al valor de Z dado: 0.4744

85

- Se determina el valor del rea buscada: A = 0.5 + 0.4744 =0.9744 3) 1.85 < Z < 1.60 Solucin: - Se ubica los valores de z en la curva

0.4678 0.4452 1.85 1.60

- Se busca el valor del rea bajo correspondiente a los valores de Z dados:


z = 1.85 = 0.4678 z = 1.60 = 0.4452

- Se determina el valor del rea buscada: 04678 + 0.4452 = 0.9130 4) 0.85 < Z < 2.23 Solucin: - Se ubican los valores z en la curva - Se busca el valor del rea bajo correspondiente a los valores de Z dados:

z= 0.85 0.4871

0.3023 , z= 2.23

86

- Se determina el valor del rea buscada: 0.4871 0.3023 = 0.1848

Ejercicios de Refuerzo 1) Dada una distribucin N (0,1) halle las reas que cumple con las siguientes condiciones: a) b) c) d) e) f) g) h) Z > 3.22 Z > 1.45 Z < 0.45 Z < 2.34 Z > 1.59 Z > -2.78 Z < -1.32 Z < 2.53

87 i) Z < 1.38 j) Z < -1.45 k) Z < -2.38 l) 0.53 < Z < 0.79 m) 0.35 < Z < 1.03 n) -2.45 < Z < -2.01 o) -1.00 < Z < 1.00 p) -2.00 < Z < 2.00 q) -3.00 < Z < 3.00 r) 1.5 < Z < 1.78 s) Z < 1.26 o Z > 2.00 t) Z < -2.34 o Z > 2.34 u) Z > 1.50 v) Z > 0.43

2) Halle los valores de Z para los cuales las reas entre Z e infinito son iguales a: a) 0.3821 b) 0.2518 c) 0.2119 d) 0.2300 f) 0.3800 k) 0.9830 p) 0.9876 g) 0.4801 l) 0.9000 e) 0.0985

h) 0.7900 i) 0.9788 j) 0.8200 m) 0.5120 n) 0.9900 o) 0.8186

Clase No 16( 100 min. ) EJERCICIOS DE APLICACION Ejemplo No 1 En un examen de Estadstica calificado base 100, la media fue 72 y la desviacin tpica 15. Determinar el porcentaje de estudiantes que obtuvieron puntuaciones a) Entre 60 y 72 b) Entre 72 y 93 Solucin del literal a): PRIMER PASO:

88 Se encuentran los valores de z. z =


X X

60 -72 z1 = ------ = -0.8 15 72 - 72 z2 = ------ = 0 / 15 = 0 15 SEGUNDO PASO: Ilustrar en la curva normal el rea buscada

TERCER PASO: Se buscan los valores de z en la tabla de reas bajo la Curva Normal. z1 = - 0.8 z2
= 0

0.2881
0

0.2881 X 100 = 28.81 %

Este porcentaje quiere decir que el 28.81 % obtuvieron calificaciones entre 60 y 72

de el total de estudiantes

89

Solucin del literal b) PRIMER PASO:

72 - 72 z1 = -------- = 0 15 93 - 72 z2 = --------- = 1.4 15

SEGUNDO PASO:

TERCER PASO: Se buscan los valores de z en la tabla de reas bajo la Curva Normal. z1 = 0 z2
= 1.4

0
0.4192

0.4192 x 100 = 41.92 %

Conclusin:

90 Ejemplo No 2 En una distribucin correspondiente al salario semanal de los trabajadores, la media aritmtica fue de 29.70 y la desviacin tpica de 7.34. Qu porcentaje de obreros tiene un salario entre 20 y 29.70 dlares? Solucin: PRIMER PASO: 20 29.7 z1 = -------- = - 1.32 7.34 20 -20 Z2 = -------- = 0 15

SEGUNDO PASO:

TERCER PASO: Se buscan los valores de z en la tabla de reas bajo la Curva Normal. z1 = -1.32 z2
= 0

0.4066
0.0000

0.4066 x 100 = 40.66 %

Ejemplo No 3:

91 La media de los pesos de 500 estudiantes de cierto departamento es 151 libras y la desviacin tpica 15 libras. Suponiendo que los pesos se distribuyen normalmente, hallar cuntos estudiantes pesan: a) entre 120 y 155 libras b) Ms de 185 libras Solucin para a): En este caso se nos dan dos valores de x y estos se encuentran uno a la izquierda y otro a la derecha de la media aritmtica, por lo que necesitaremos de dos valores de z. PRIMER PASO: 120 155 z1 = ----------15 z1 = - 2.07 155 - 151 z2 = -----------15 z2 = 0.27

SEGUNDO PASO:

por tablas: TERCER PASO: z1 = -2.07 z2 = 0.27 0.4808 0.1064 0.5872 Por lo tanto el 58.72% de los estudiantes pesan entre 120 y 155 libras, es decir la suma de los porcentajes de las dos reas encontradas.; luego el nmero de estudiantes entre 120 y 155 libras se obtiene as: N de estudiantes =

92

x = 293.6 Solucin para b): PRIMER PASO: SEGUNDO PASO:

# es 294 185 - 151 z1 = ------- = 2.27 15

por tablas: TERCER PASO: z1 = 2.27 0.4884

El rea correspondiente es 0.5 - 0.4884 = 0.0116 Conclusin: 1.16 % tienen ms de 185 lb. 100 - 500 Sntesis: El rea bajo la curva normal representa el cien por ciento de todas las observaciones. Debido a la simetra de la curva, se tiene el 50% de las observaciones a cada lado de la media aritmtica. El signo negativo en el valor de z indica que el rea est a la izquierda de la media aritmtica. R / 6 est.

Ejercicios Propuestos:

93 No1 En un examen de estadstica la media fue de 78 y la desviacin tpica de 10. Determinar el % de estudiantes cuyas puntuaciones fueron entre 93 y 62. No2 Si la longitud de 300 alambres conductores de electricidad se distribuyen normalmente con media de 68 mm y desviacin tpica de 3 mm. Cuntos alambres tienen longitud de: a) b) c) Mayor de 72mm Menor de 64 mm Entre 75 y 71 mm 28 alambres 28 alambres 45 alambres

Clase No 17 y 18 ( 200 min ) Tema: Taller Sobre Manejo de la Curva Normal

Objetivo de la Clase: Al final de la clase el estudiante ser capaz de aplicar los conocimientos adquiridos en la resolucin de la Gua de Ejercicios dada. Introduccin:

94 En la presente clase, resolveremos una gua de ejercicios, aplicando los conceptos y frmula sobre la curva normal.

1.

Gua de Ejercicios

N1 Supongamos que el ingreso mensual promedio de 10000 trabajadores en una ciudad es $ 500.oo y la desviacin tpica de $ 100.oo Si la distribucin es normal, encontrar el nmero de trabajadores que tienen un ingreso mensual: a) Inferior a $ 500.oo b) Superior a $ 500.oo pero inferior a $ 600.oo c) Superior de $ 600.oo N2 Si en una distribucin cualquiera, la media aritmtica es 400 y la desviacin tpica es 100, Cul es la probabilidad (rea de valores): a) Entre 250 y 500 b) Menos de 250 N3 Si en una distribucin cualquiera, la media aritmtica es 300 y la desviacin tpica es 100, Cul es la probabilidad (rea de valores): a) Entre 200 y 225 b) Entre 350 y 400 c) N4 Supongamos que el ingreso mensual promedio de 10000 trabajadores en una ciudad es $ 500.oo y la desviacin tpica de $ 100.oo Si la distribucin es normal, cul es la cantidad de ingreso arriba del cual estn los salarios del 60% de los trabajadores? N 5 Si X = 1000 millas y = 200 millas. Encontrar: a) El punto x sobre el cual habr el 10% del rea bajo la curva b) El punto x abajo del cual habr el 10% del rea bajo la curva N 6 Las dimetros en centmetros de 80 tubos para determinada obra se enumeran a continuacin: Dimetros 20-30 30-40 Tubos 3 6

95 40-50 50-60 60-70 70-80 80-90 90-100 5 7 10 29 12 8

Se pide: a) Calcular el nmero terico de tubos en cada intervalo de clase ( con 2 decimales ) b) Dibujar una curva normal para ajustar los datos observados. c) Examinar la curva normal y la curva que representa los datos reales de la muestra. Cree que los dimetros estn normalmente distribuidos? d) Si se espera utilizar 100 tubos, cuntos se estima que tengan un dimetro entre 69 y 89 cm de acuerdo a la curva normal? N 7 Suponga que el promedio de produccin de 800 trabajadores de una fbrica de resistencias es 40 resistores por minuto y la desviacin tpica 10 resistores. Encontrar el nmero de trabajadores que tienen una produccin de: a) De 20 a 60 resistores b) Mayor de 40 resistores pero menor de 50 resistores c) De 25 a 50 resistores d) Mayor que 20 pero menor que 35 resistores

Clase No 19 ( 100 min ) Unidad VI: Diseos Muestrales Tema: Teora Elemental de Muestreo Objetivos de la Clase: Al final de la clase el estudiante ser capaz de desarrollar habilidades y conocimientos para extraer muestras de una poblacin. Introduccin:

96 La teora del muestreo es un estudio de las relaciones que existen entre una poblacin y las muestras obtenidas de la poblacin. Es de gran valor en muchas conexiones. Por ejemplo, es til en la estimacin de cantidades desconocidas de la poblacin, tambin en la determinacin si las diferencias observadas entre dos muestras se deben a una variacin al azar o si en verdad estas diferencias son significativas.

Teora: 1. Conceptos Bsicos del Muestreo Poblacin En los estudios estadsticos una poblacin est constituida por TODAS las observaciones posibles en las cuales se est interesado. La poblacin puede ser INFINITA cuando presenta un nmero infinitamente grande de unidades elementales. Por ejemplo, las piezas producidas en un proceso productivo. Puede tambin ser FINITA cuando tiene un nmero finito de unidades elementales. Por ejemplo, los estudiantes de una determinada institucin.

Muestra Se llama muestra a una parte de la poblacin. Parmetros Son los datos que caracterizan a toda la poblacin. Estadgrafos Son los datos que caracterizan a una muestra. Por ejemplo, el nmero de alumnos aprobados en la materia de Estadstica en el ITCA es un parmetro, mientras que el nmero de alumnos aprobados en la materia de estadstica del departamento ( Mencionar el departamento en el cual usted est dando esta clase ) es un estadgrafo.

97 Para poder distinguir los estadgrafos y los parmetros, se usan convencionalmente diferentes notaciones, por ejemplo: Estadgrafos Media Aritmtica Muestral ( X ) Desviacin Tpica Muestral ( ) Varianza Muestral ( S ) Parmetros Media Aritmtica Poblacional ( ) Desviacin Tpica Poblacional ( ) Varianza Poblacional ( )

En las investigaciones estadsticas se busca encontrar verdades concernientes a toda la poblacin, pero ante la imposibilidad de investigar a toda la poblacin, lo que se hace es tomar una o varias muestras de dicha poblacin y en ella efectuar la investigacin. Lo importante es saber obtener las muestras que nos conduzcan a conclusiones verdaderas y no a conclusiones falsas. Medicin Es la etapa intermedia que consiste en contar, medir y/o formular preguntas para la extraccin de una muestra. Estimacin Es el proceso de hacer deducciones sobre el grupo total, partiendo de la informacin de la muestra. Listas Son un inventario de unidades de una poblacin, identificados por su nombre o cdigo. Muestreo Rama de la Estadstica que estudia las distintas tcnicas para poder obtener muestras. Muestreo Aleatorio Es un proceso de seleccin de muestras en el cual los elementos son escogidos por mtodos aleatorios, la seleccin de la muestra se realiza por procedimientos al azar. Muestreo no Aleatorio Incluye todos los mtodos en que las unidades elementales de la poblacin no se seleccionan al azar.

98 Para este curso nicamente se abordar el muestreo Aleatorio. TIPOS DE MUESTREO ALEATORIO a) Muestreo Aleatorio Simple El muestreo aleatorio simple, es una tcnica de muestreo, en el cual los elementos de la muestra se seleccionan de uno en uno de manera azarosa. En este mtodo cada miembro de la poblacin tiene una oportunidad igual de ser incluido en la muestra. ( es decir la probabilidad de escogitacin de cada elemento es
n N

, siendo n el tamao de la muestra y N el tamao de la

poblacin). Una tcnica para obtener una muestra aleatoria es asignar un nmero a cada miembro de la poblacin, escribir estos nmeros en papeles pequeos, colocarlos en una urna y luego extraer nmeros de la urna, teniendo cuidado de mezclar bien la urna antes de cada extraccin. Cuando los elementos a partir de los cuales se va a obtener la muestra se encuentran enumerados y no queremos hacer uso de urna, entonces el muestreo aleatorio simple se puede efectuar haciendo uso de los Nmeros Aleatorios por medio de una calculadora. Las calculadoras proporcionan los nmeros de manera aleatoria d 1 al 1000. Ejemplo No1: Del nmero de alumnos del grupo ( Mencionar el departamento en el cual usted est dando esta clase ) que cursan Estadstica, se desea obtener, haciendo uso de los nmeros aleatorios una muestra de 9 estudiantes. Solucin: PRIMER PASO Se asigna a cada estudiante de la poblacin un nmero empezando del 1 SEGUNDO PASO Se escogern 9 alumnos, para ello se oprimen las teclas INV RAN# En la pantalla aparecer un nmero de tres dgitos ( no a todos les aparecer el mismo valor ) por ejemplo, 0.895 De acuerdo con esto el primer alumno seleccionado es el que tiene el nmero 895. Sin embargo si el nmero de alumnos de la poblacin es menor de 100, no se consideran tres cifras si no solo dos, que pueden ser las dos primeras, las dos ltimas o una mezcla de ambas, de tal manera que el estudiante seleccionado puede ser, el nmero 89 o

99 el 95 o el 85 o porque no los tres. As solo nos faltara encontrar 6 de los 9. Para ello volvemos a teclear INV RAN# Debemos de observar que no todos tendremos los mismos nmeros seleccionados. b) Muestreo Aleatorio Sistemtico Este tipo de muestreo se caracteriza porque establece un punto de partida para iniciar la escogitacin de los elementos de la muestra. En esencia consiste en seguir los siguientes pasos: -Conseguir un listado de los N elementos de la poblacin -Determinar el tamao n de la muestra -Definir un intervalo
k= N n

-Elegir un nmero aleatorio r entre 1 y k ( r = arranque aleatorio ) -Seleccionar los elementos de la lista. Ejemplo: Suponga que queremos escoger una muestra de 5 estudiantes de una poblacin de 60 y se desea hacerlo de forma aleatoria y sistemtica. Solucin: Se sabe que N = 60 y que n = 5

2) Elegir el nmero de arranque r

r=7

3) Listar los elementos de la muestra ( se supone que la poblacin ha sido previamente listada y enumerada ) :_______________________________

c) Muestreo Aleatorio Estratificado En ciertas ocasiones resulta conveniente estratificar la muestra segn ciertas variables de inters. Para ello debemos conocer la composicin estratificada de la poblacin objetivo a muestrear. Una vez calculado el tamao muestral apropiado, ste se reparte de manera proporcional entre los distintos estratos definidos en la poblacin usando una simple regla de tres. Ejemplo: Suponga que se necesita hacer un estudio acerca de los ingresos monetarios de los grupos familiares a los cuales pertenecen los estudiantes del ITCA, de la regin central, con la intencin de ajustar las cuotas de escolaridad.

100 Si suponemos que previamente se ha calculado el tamao de la muestra como n = 150 y dado que sabemos que la poblacin estudiantil est distribuida por departamentos de especialidad con las siguientes poblaciones parciales: Alimentos : 350 alumnos Automotriz : 400 alumnos Elctrica : 300 alumnos Mecnica : 250 alumnos Sistemas y Redes : 380 alumnos Civil y Arquitectura : 200 Confeccin : 150 Lo que hace una poblacin total N = 2030. Como se puede apreciar la poblacin est estratificada por lo que la muestra puede ser construida en forma proporcional a esa estratificacin, siguiendo el siguiente proceso: -Establecer la fraccin que cada departamento es de la poblacin total Alimentos : 350 alumnos Automotriz : 400 alumnos Elctrica : 300 alumnos Mecnica : 250 alumnos

350 = 2030
400 = 2030

0.17 0.20

------ = 0.15 ------ = 0.12

Sistemas y Redes : 380 alumnos ------ = 0.19 Civil y Arquitectura : 200 Confeccin : 150
------ = 0.10 ------ = 0.07

-Obtenida la proporcin de cada departamento, se obtiene el nmero de elementos a escoger por cada de estos, para ello multiplicar la proporcin de cada estrato por el tamao de la muestra.

101 Alimentos : Automotriz :


350 (150) 2030
400 (150 ) 2030

= 0.17 = 0.2

25.5

30

Elctrica : Mecnica : Sistem. y R. : Civil y Arq. Confeccin :

300 (150) 2030


250 (150) 2030

= 0.15 = 0.12 0.19

22.5

18

380 (150) = 2030


200 (150) 2030

28.5
15

= 0.1 = 0.07

150 (150) 2030

10.5
n = 152

Clase No 20 ( 100 min ) Tamao de la Muestra Objetivo de la Clase: Al finalizar la clase los estudiantes sern capaces de determinar el tamao adecuado de una muestra considerando los elementos que determinan su tamao. Antes de llevar a cabo una investigacin por muestreo, el investigador debe conocer el tamao de la muestra con la cual har la investigacin, para evitar costos elevados cuando maneja muestras grandes que talvez no aporten mayor informacin o exactitud en los resultados, o si la muestra es muy pequea puede llagar a resultados no validos. 0 Proceso Para Calcular el tamao de una Muestra.

102 Para calcular n debemos de conocer: Error Muestral ( E ) Es el error mximo permisible en la investigacin. Si conociramos las medias aritmticas muestral y poblacional el error muestral es: E =
x

Si desconocemos alguna o ambas medias E se estima convenientemente segn el criterio del investigador que valores son los ms adecuados. Valor Crtico de z ( z ) El valor crtico de z para un determinado nivel de confianza, se obtiene dividiendo entre 2 el nivel de confianza expresado previamente en trminos decimales, luego se busca en la tabla de reas Bajo la Curva Normal la porcin de rea que ms se aproxime para ver que valor de z le corresponde. Ejemplo No1: Encontrar el valor de z para un nivel de confianza del 95%. Solucin: PRIMER PASO: Se divide entre el 100% el nivel de confianza dado. 95% 100% = 0.95 SEGUNDO PASO: El resultado del primer paso se divide entre 2 0.95 2 = 0.4750 TERCER PASO: Se busca en tabla un valor igual o aproximado

103 Para nuestro ejemplo tenemos que: Fila columna 1.9 6 -------------------------------------------------- .4750 Por lo tanto el valor de z para un nivel de confianza del 95% es 1.96 Ejemplo No2: Determinar el valor de z para una confianza del 99.73% Solucin: 99.73% = 0.9973 = 0.9973 100% 2 fila columna 3.0 0 ----------------------------------------0.4987 Por lo tanto el valor de z = 3.00
~ Desviacin Tpica Poblacional ( ) La desviacin tpica o estndar poblacional

0.49865 0.4987

Por lo tanto n se calcula mediante la siguiente frmula:


z 2 2 n= E2

Ejemplo No1: La comisin de cuotas diferenciadas de una Institucin Educativa Privada, desea conocer el ingreso promedio de los estudiantes con el objeto de

104 proponer una nueva estrategia para establecer la cuota que pagarn los estudiantes. Para hacer esta investigacin por muestreo se necesita determinar el tamao adecuado de la muestra, para lo cual se indica las siguientes restricciones: 0 El mximo error muestral no deber ser mayor a 25.00 1 El nivel de confianza deseado es del 95% 2 La desviacin tpica o estndar, segn archivos es de 325.00 Calcular el tamao adecuado de la muestra de acuerdo a las restricciones anteriores. Solucin: PRIMER PASO: Determinacin de los datos E = 25 95 % = 0.95 100% = 325 0.95 2 = 0.475 z = 1.96

SEGUNDO PASO: Sustituir datos en la frmula )2 ( 325 ( 25 )2 n = 649.2 649 n = ( 1.96 )2

Pero n debe ser un nmero entero, entonces: Ejemplo No2:

n = 649

El director de una escuela, desea conocer el coeficiente promedio de inteligencia de sus alumnos. Para tal fin desea hacer la investigacin por

105 muestreo. Determinar el tamao de la muestra, tomando en cuenta las siguientes restricciones: 0 El error muestral mximo 0.5 1 El nivel de confianza del 99% 2 La desviacin tpica poblacional 1.9 Solucin: PRIMER PASO: E = 0.5 = 1.9 0.99 99 % = --------- = 100% 2

z = 257

SEGUNDO PASO: n = ( 257 )2 ( 1.9 )2 ( 0.5 )2 n = entonces: n = 95.37 ; n = 95

Sntesis 0 En los estudios estadsticos una Poblacin est constituida por TODAS las observaciones posibles en las cuales se est interesado. 1 2 Se llama Muestra a una parte de la poblacin. 3 4 Muestreo es la rama de la Estadstica que estudia las distintas tcnicas para poder obtener muestras.

106 Ejercicios Propuestos No1 El gerente de un banco desea estimar el promedio de depsitos a la vista para conocer el grado de liquidez del banco. Para tal propsito encarga al jefe de contabilidad que haga un estudio por muestreo, atendiendo las siguientes restricciones: 0 El error muestral mximo no debe ser mayor a 98 1 El coeficiente de confianza del 95% 2 La desviacin tpica de 1000 No2 El colegio de economistas est interesado en conocer la proporcin de sus miembros que estaran de acuerdo en aumentar la cuota social vigente. Para ganar tiempo se dispone pasar una encuesta a slo un grupo de los miembros. Cul es el tamao de la muestra a tomar, si se especifca que el error muestra mximo debe ser de 0.05, con una confiabilidad del 99% y una desviacin de 0.20 ?

Clase No 21 ( 100 min ) Tema: La Distribucin t Student

Objetivo de la Clase: Al final de la clase el estudiante conocer el significado del modelo t de Student y adems podr utilizarlo para determinar el intervalo de confianza dentro del cual se puede estimar el valor de la media poblacional por medio de muestras de tamao menor de 30. Introduccin:

107 A veces es necesario hacer anlisis de muestras pequeas por razones de tiempo y reduccin de costos, para ello fue descubierta la distribucin t por William Gosset, publicada en 1908 con el seudnimo de Distribucin t Student. Teora: 1. La Distribucin t de Student

Esta distribucin es prcticamente una distribucin normal en pequeo que es empleada cuando el tamao de la muestra es menor de 30. Los usos para los cuales es idnea esta distribucin son los siguientes: 1) Para determinar el intervalo de confianza dentro del cual se puede estimar la media de una poblacin a partir de muestras pequeas (n < 30 ) 2) Para probar hiptesis cuando una investigacin se basa en muestreo pequeo. 3) para probar si dos muestras provienen de una misma poblacin. En ste curso solo abordaremos las dos primeras aplicaciones.

Como determinar el Intervalo de Confianza para la estimacin de la Media Conceptos Previos: a) Estimador Puntual: Valor que se calcula a partir de la informacin de la muestra y que se usa para estimar el parmetro de la poblacin. Ejemplo : la media de la muestra x es un estimador puntual de la media de la poblacin b) Intervalo de Confianza: Es un rango de valores que se construye a partir de datos de la muestra de modo que el parmetro ocurre dentro de dicho rango con una probabilidad especfica. La probabilidad especfica se conoce como nivel de confianza.

108 Nos interesa en nuestro caso particular poder establecer el intervalo de confianza para estimar la media poblacional, para ello haremos uso de la siguiente frmula: =
x

t(/2,v) n

donde:

= media poblacional = media muestral t ( / 2 , v ) = valor obtenido de la tabla de la distribucin t = desviacin tpica poblacional n = tamao de la muestra = nivel de confianza v = grados de libertad
x

Para poder utilizar sta frmula es necesario explicar el significado de algunos conceptos y la manera de cmo calcular su valor as como de conocer el uso de la tabla t de Student. Lo cual haremos a continuacin: 1) La distribucin tpica de la poblacin se calcula por la frmula:

( x x) =
n 1

2) El nivel de confiabilidad utilizado es: = 100% - Confiabilidad 100% Recordar que la confiabilidad se refiere a la probabilidad especfica de estimacin del parmetro, en este caso de la media poblacional. 3) Los grados de libertad : Concepto un tanto difcil de definir pero debe entenderse como un indicador del grado de acercamiento que cada curva de la distribucin t presenta con respecto de la curva normal ( obsrvese que esto pone de manifiesto que la distribucin t no es nica y existen tantas como los grados de libertad cumplan la condicin v < 30 ) Su valor se obtiene por la frmula:

109

V = n1
4) Los valores t ( / 2 , v ) se encuentra en tabla de la distribucin t Student ( el docente ensear su uso a los alumnos, ver anexos, pg 165 ). Para entender ste proceso, desarrollaremos los siguientes ejemplos: Ejemplo No1: Dada la serie, determinar el intervalo de confianza para estimar la media poblacional con un nivel de confianza del 95% 2.3 2.1 1.9 1.5 1.7 2.0 2.1 1.6 1.5 1.3 1.8 1.6 1.8 1.5 1.1 1.3

PRIMER PASO Calcular la Media Aritmtica. 27.1 x = 1.69 = ------16

SEGUNDO PASO Calcular La Desviacin Tpica Poblacional. = 1.66 15 = 0.33

TERCER PASO Determinar el valor de t ( / 2 , v )


100 - 95

Para ello:

= -----------100

= 0.05

110 y:

V = 16 1

V = 15

Por lo tanto: t ( / 2 , v ) ser : t (0.05 / 2 , 15 ) ; t (0.025 , 15 ) = 2.130 CUARTO PASO Calcular el intervalo de confianza =
x

( Valor sacado de tabla )

t(/2,v) n
0.33 ) 16

= 1.69

2.130

= 1.69

0.18 + 0.18 = 1.87 Lmite Superior 0.18 = 0.15 Lmite Inferior , 1.87 )

Por lo tanto: 1.69 1.69 As: I = ( 1.51 Ejemplo No 2 :

Se cree que la vida en horas de una bombilla elctrica de 60 watt se distribuye normalmente. Una muestra de 20 bombillas produjo valores de x = 1004 horas y = 25 horas. Calcular el intervalo de confianza para 90%. Solucin: Como ya se tiene el valor de se inicia con el paso tres. TERCER PASO 100 - 90 = ----------x

y , que son los pasos 1 y 2 del proceso,

= 0.1

111 100

V = 20.1
Por lo tanto : t (/2

V = 19
,v )

= ( 0.05 , 19 )

( Valor sacado de tabla ) 1.730

CUARTO PASO =
x

t(/2,v) n 1.730 x
25 20

= 1004

= 1004 9.67 Por lo tanto: 1004 1004 As: I = ( 994.33 + 9.67 9.67 , 1013.67 = 1013.67 = 994.33 ) Lmite Superior Lmite Inferior

Sntesis: La distribucin t Student se aplica solo a muestras pequeas donde n < 30 La distribucin t Student se emplea para probar si dos muestras provienen de una misma poblacin. Para calcular el intervalo de confianza para estimar la media poblacional.

Ejercicios Propuestos:

112 No1 Un fabricante de llantas quiere conocer la calidad de su produccin. Para ello somete 10 llantas a prueba de resistencia al uso, obteniendo los siguientes resultados en millas de kilmetros recorridos: 101 95 96 108 91 86 89 92 79 94 Calcular el intervalo de confianza para la duracin promedio de una llanta para una confiabilidad del 95% No2 En un estudio sobre la utilizacin del agua en una pequea ciudad, tomando una muestra de 25 casas dio los siguientes datos en galones de agua utilizados por da 175 150 180 172 183 185 190 200 145 169 186 178 189 192 172 118 137 200 191 178 158 175 180 181 210

Hallar el intervalo de confianza para estimar el consumo promedio de agua para una confiabilidad del 90%.

Clase No 22( 100 min ) Tema: Formulacin de Hiptesis

Objetivo de la Clase: Al final de la clase el estudiante ser capaz de formular una hiptesis nula y alterna para una situacin dada. Introduccin:

113 Muy frecuentemente tenemos que tomar decisiones respecto a un fenmeno con base a la informacin que nos arrojan las muestras. Tales decisiones se llaman DECISIONES ESTADSTICAS. Por ejemplo, si queremos decidir sobre la base de datos de las muestras, si un nuevo suero es realmente efectivo para curar una enfermedad, si un procedimiento educacional es mejor que otro, o si un material es mejor conductor en cierta instalacin que otro. Para poder llegar a tomar cierto tipo de decisiones resulta til hacer supuestos o conjeturas acerca de dicho fenmeno.

Teora:

1.

Hiptesis

Las hiptesis son supuestos que pueden ser o no verdaderos, los cuales generalmente son planteados respecto a las distribuciones de probabilidades de la poblacin. Metodolgicamente, una prueba de hiptesis estadstica se formula planteando dos hiptesis: HIPTESIS NULA ( Ho ) que es la que el investigador est interesado en rechazar. HIPTESIS ALTERNATIVA O ALTERNA ( Ha ) investigador est interesado en aprobar o aceptar. que es la que el

Ambas hiptesis son complementarias, ya que el rechazo de una de ellas conduce automticamente a la aceptacin de la otra. Ejemplo No 1: Formular la hiptesis nula y alterna de la siguiente situacin: Una mquina debe llenar y empacar bolsas de azcar refinada con 2 libras de producto. Se cree que se estn llenando con menos Solucin: Las bolsas deben tener 2 libras, entonces:

114 Ho Ha Cantidad de Producto = 2 libras Cantidad de Producto 2 libras ya que se cree que est llenando con menos.

Ejemplo No 2: Una firma independiente que realiza encuestas de opinin, asegura que el candidato del partido x solo tiene el 35% del electorado a su favor. El partido que apoya al candidato desea probar que el porcentaje es mayor. Formular las hiptesis para iniciar dicho estudio. Solucin: El porcentaje del electorado es del 35%, entonces: Ho Porcentaje del Electorado = 35 Ha Porcentaje del Electorado 35, ya que se cree que es de 35 Ejemplo No 3: Interesa demostrar que los rendimientos promedios por manzana cultivada medidas en quintales de produccin, son diferentes cuando se usa fertilizante a o el fertilizante b. Formular las hiptesis de la demostracin. Solucin: El rendimiento en quintales de produccin dependiendo del fertilizante, entonces: Ho Ha No de qq producidos con el fertilizante a = No de qq producidos con el fertilizante b No de qq producidos con el fertilizante a No de qq producidos con el fertilizante b, ya que se cree que lo producido es con el cambio del fertilizante.

Sntesis:

115 Hiptesis es un supuesto que puede o no ser verdadero. Hiptesis Nula (Ho) es la que el investigador est interesado en rechazar. Hiptesis Alterna o Alternativa (Ha) es la que el investigador est interesado en aprobar o aceptar. Las hiptesis nula y alterna son complementarias, ya que, el rechazo de una conlleva a la aceptacin de la otra.

Ejercicios Propuestos: Formular las hiptesis nula y alterna en cada una de las siguientes situaciones: No1 Un ndice de dureza para el acero se determina al rayar el acero con un punzn de diamante y medir la profundidad de la penetracin. En 50 muestras de cierto tipo de acero el promedio de dureza fue de 61. El productor afirma que este tipo de acero tiene un ndice de dureza promedio de por lo menos 64. No2 Una nueva mezcla de fertilizantes fue utilizada en un cultivo de maz, la cual mejor la produccin en ms de un 20%. No3 Una compaa televisora afirma que el 60% de la tele-audiencia entre las 6:30 y 7:30 pm miran su telenovela Yo soy Bety la fea No4 Se emplean dos mquinas para llenar botellas de plstico con un volumen neto de 16 oz. Los Ingenieros de control de calidad piensan que las mquinas llenan el mismo volumen sin importar que las botellas sean de 16 oz. No5 Para estudiar el efecto del alcohol sobre los reflejos, se pasa un test de destreza a 14 individuos antes, durante y despus de haber consumido 100 mililitros de vino. Se espera que a medida que la cantidad de consumo de vino aumente ser mayor la lentitud de los reflejos. No6 Una asociacin cooperativa afirma que los ingresos semestrales de sus afiliados promedian los 40000 colones.

116 No7 Una fbrica produce tornillos que empaca en cajas de 100. Un estudio de control de calidad quiere demostrar que de cada 50 tornillos, 7 salen defectuosos. No8 Un investigador cree que al enjuagar un hilo en un compuesto especial, se aumenta en un 65% su resistencia a la tensin. No9 El gerente de un restaurante de comida rpida, tiene la impresin que las ganancias recientemente son inferiores a las que se tena en el pasado. No10 Se cree que solo el 10% de las personas dentro de una poblacin estn en desacuerdo con el cambio de estructura del mercado elctrico nacional ( privatizacin ).

117 Clase No 23 ( 200 min )

Tema:

Prueba de Hiptesis (segunda aplicacin de la distribucin t )

Objetivo de la Clase: Al final de la clase el estudiante ser capaz de rechazar o aceptar una hiptesis dada utilizando la distribucin t Introduccin: Todo estudio cientfico requiere una serie de etapas para su realizacin: Etapa 1: Planeamiento de Hiptesis sobre un determinado problema que requiere una respuesta. Etapa 2: Recoleccin de Datos Experimentales de una muestra, siguiendo una metodologa establecida. Etapa 3: Aceptacin o Rechazo de la Hiptesis planteada, mediante el anlisis y comparacin de los resultados muestrales. Prueba de Hiptesis Referente a una Media Poblacional Una hiptesis acerca de una media poblacional puede ser probada, utilizando una pequea muestra, slo si se puede suponer que la muestra ha sido seleccionada de una poblacin distribuida con tendencia normal. La prueba se hace utilizando una distribucin t con n 1 grados de libertad. Para probar la hiptesis nula Ho se calcula el valor t mediante la siguiente frmula: tc =
x

n1

Donde:

tc x n

= = = = =

t calculada Media Aritmtica Muestral Media Aritmtica Poblacional Desviacin Tpica Muestral No de Datos de la Muestra

118

Criterio de Rechazo o Aceptacin de la Hiptesis La Ho es rechazada solo si el valor absoluto de t calculada ( t c ) es mayor que el valor crtico de t para un determinado nivel de significacin

Ejemplo No 1: Una empresa fabrica baleros de acero, con un dimetro promedio de 4 pulgadas. El gerente sospecha que la mquina que fabrica los baleros est desajustada. Para salir de dudas toma una muestra de 10 mediciones del dimetro de 10 baleros. Al calcular la media y la desviacin tpica de la muestra result que X = 4.08 pulgadas y = 0.05 pulgadas Ser cierta la sospecha del gerente con una confiabilidad del 99% ? Solucin PRIMER PASO Formular las Hiptesis de Estudio Ho Ha dimetro = 4 dimetro 4

SEGUNDO PASO Calcular el valor de tc tc =


x

n 1

tc =

4.08 4 10 1 0.05

tc = 4.8

119

TERCER PASO Estimar en tabla el valor de t t , v 2


99 100 = 0.01 100

donde:

= 0.01 Entonces: t 0.01 , 9 2

v = n-1 v = 10 1 v = 9

t ( 0.005 CUARTO PASO

, 9)

t = 3.250

Comparar tc con t tc > t Ho se Rechaza

QUINTO PASO Conclusin: La maquina est desajustada ya que la medida es de 0.08

Ejemplo No 2:

120 La Casa Bayer que fabrica cierto tipo de pastillas multivitamnicas asegura que cada pastilla contiene en promedio 2.48 miligramos de vitamina B12. La Direccin General de Salud analiz una muestra de 28 pastillas y encontr una media de 2.45 mg y una desviacin tpica de 0.15 mg A luz de estos resultados Rechazara la afirmacin de la Casa Bayer ? Usar un nivel de significacin de 0.05 Solucin PRIMER PASO Ho Ha Contenido de vitamina B12 = 2.48 mg Contenido de vitamina B12 2.48 mg

SEGUNDO PASO tc =
x

n 1

tc =

2.45 2.48 0.15

28 1

tc = -1.04

TERCER PASO t , v 2 = 0.05


0.05 2

donde:

v = n-1 v = 28 1 v = 27
, 27

Entonces:

t ( 0.025

27 )

t = 2.05

121 CUARTO PASO tc < t 1.04 < 2.05 QUINTO PASO Conclusin: Es cierto lo que asegura la casa Bayer sobre el contenido de la vitamina B 12 en las pastillas. Ho se acepta

Ejemplo No 3: El peso promedio de cierto tipo de tornillos debe ser 30 mg. Para revisar el peso de dicho tipo de tornillos se peso una muestra de 10 tornillo. Las mediciones fueron: 28 30 31 32 26 30 31 29 28 30

Utilizando un nivel de significacin de 0.01 Podremos concluir que el peso medio por tornillo no se mantiene en su valor apropiado ? Solucin PRIMER PASO Ho Ha peso medio = 30 mg Peso medio 30 mg

SEGUNDO PASO En este caso habr que calcular la x y As:

122 x 28 30 31 32 26 30 31 29 28 30
x =

x- x 1.5 0.5 1.5 2.5 3.5 0.5 1.5 0.5 1.5 0.5

( x x )2 2.25 0.25 2.25 6.25 12.25 0.25 2.25 0.25 2.25 0.25 28.5 = =

x x

= =

n 295 10

( x x )
n 1 28.5 9

29.5

= 1.78

Por lo tanto: tc =
x

n 1

tc =

29.5 30 1.78

10 1

tc = 0.84

TERCER PASO t , v 2 = 0.01

donde:

v = n-1 v = 10 - 1

123 Entonces: t
0.01 2

, 9

t ( 0.005

,9

t = 3.250

CUARTO PASO tc < t 0.84 < 3.25 QUINTO PASO Conclusin: El precio promedio por tornillo se mantiene en su valor apropiado Ho se Acepta

Sntesis: Parmetros, es decir, constantes arbitrarias, las cuales son cantidades a las que se pueden asignar valores numricos y que durante un proceso limitado, conservan los valores asignados; estos valores se desconocen y son estimados a travs de un estudio muestral de la poblacin. La Ho es rechazada solo si el valor absoluto de t calculada ( t c ) es mayor que el valor crtico de t para un determinado nivel de significacin

Clase N 24 ( 100 minutos ) Ejercicios Propuestos:

124 No1 Un contratista ha construido un gran nmero de casa de aproximadamente el mismo tamao y precio. El contratista asegura que el valor promedio de estas casa no excede a los 60,000. Un corredor de bienes y races seleccion 15 de las casa y encontr que el precio promedio es de 61,500 con una desviacin tpica de 1,125 Cree que est en lo cierto el contratista a un nivel de significacin del 95% ? No2 Se desea acelerar el tiempo que toma una droga en entrar al torrente sanguneo. Un farmacutico agreg otro ingrediente a la frmula original, la cual tena un tiempo medio de 32 min. En 20 observaciones de la nueva mezcla se obtuvo un tiempo medio de 30 min con una desviacin tpica de 2.5 min Ser ms eficiente la droga con el nuevo ingrediente a un nivel de significacin de 0.01 ? No3 El jefe de una oficina gubernamental llam la atencin a su personal diciendo que haba un promedio de 15 quejas diarias por parte del pblico. Uno de los empleados tom del registro del jefe el siguiente nmero de quejas ocurridas en 9 das 18 14 10 13 9 13 8 7 16

Segn esta informacin Cree que el jefe de la oficina ha exagerado en su reclamo ? Determine quien tiene la razn utilizando un nivel de significacin del 0.05

Clase No 25 ( 100 min )

125

Unidad V: Regresin y Correlacin Tema: Correlacin

Objetivo de la Clase: Al final de la clase el estudiante ser capaz de asociar variables y desarrollar correlaciones interpretando los resultados Introduccin: Los requerimientos de las ciencias van ms all del comportamiento de una variable y en muchos de sus problemas se necesita investigar la relacin entre dos o ms variables. Por ejemplo: Existe alguna relacin entre la estatura y el peso de las personas ? Hay alguna relacin entre el tiempo dedicado al estudio y las notas obtenidas en los exmenes ? La altura de un rbol est relacionado con el dimetro del tronco ? La cantidad de maz que produce una mazorca est relacionada con la cantidad de sol y agua que recibe la planta ? Si existe relacin de asociacin entre dos variables, entonces es posible hacer estimaciones del valor de una de ellas conociendo el valor de la otra, siendo este el estudio de la CORRELACION Teora: 1. La Correlacin La correlacin estudia algn tipo de relacin entre dos o ms variables. Para investigar esta relacin necesitamos recordar el estudio de la lnea recta en el plano cartesiano.

1.1. La lnea Recta en el Plano Cartesiano Recordemos que:

126 El plano es un conjunto de pares ordenados de valores ( X , Y ) en el cual si existe alguna relacin entre los valores, ella puede graficarse. Si la relacin es de primer grado, su grfica es una lnea recta, si no es de primer grado su grfica ser una lnea curva. Ejemplo No1: Graficar la relacin Y = 2X + 3 Solucin: Primero tabulamos, obteniendo los siguientes datos: X -2 -1 0 1 2 Entonces
y
8
f(x)=2x+3

Y=2X+3 ( X,Y ) 2(-2)+3=-1 (-2,-1) 2(-1)+3=1 (-1,1) 2(0)+3=3 (0,3) 2(1)+3=5 (1,5) 2(2)+3=7 (2,7)

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

De lo que concluimos que Y = bX + c tiene por grfica una lnea recta y para trazarla basta con tabular dos puntos ( X , Y ) Ahora bien, si la ecuacin es

127 Y = bX + c Tenemos que: b = Pendiente de la recta y su signo define la direccin c = Intercepto de la recta, es decir, define la posicin de la recta

Ejemplo No 2: Las rectas: L1: Y = 2X + 3 L2: Y = 2X + 1 L3: Y = 2X 1 Tenemos que:


y
8

L1 L2 L3
f(x )=2 x +3 f(x )=2 x +1 f(x )=2 x -1

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

En primer lugar, observamos que las tres rectas tienen el mismo valor de b, esto implica que tienen la misma pendiente, es decir, son paralelas. En segundo lugar, los valores de c nos indican el punto que la recta cortar el eje Y , dndonos as la posicin de cada lnea recta. Ejemplo No 3: Las rectas: L1 : Y = 2X + 3 L2 : Y = X + 3

128 L3 : Y = - 3X + 3 Tenemos que: L3


y
8

L1

L2
f(x )=2 x +3 f(x )=x +3 f(x )=-3 x+3

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

En este caso las rectas no son paralelas, ya que el valor de b son diferentes, pero si observamos las ecuaciones todos pasan por el mismo punto Y = 3 1.1. Coeficiente de Correlacin

Para investigar la correlacin entre dos variables, se han creado los coeficientes de correlacin que permiten expresar cuantitativamente el grado de relacin que existen entre las dos variables. Los Diagramas de Dispersin que son planos cartesianos en los que se marcan los puntos correspondientes a los pares ( X , Y ) nos dan una estimacin del grado de correlacin de las dos variables investigadas. Entonces tenemos:

No existe Correlacin

129 En este caso el coeficiente de correlacin r = 0

Existe Correlacin Positiva Al crecer X, crece Y o al decrecer X, decrece En este caso el coeficiente r estar cercano a +1

Existe Correlacin Negativa Al crecer X, decrece Y o al decrecer X, crece En este caso el coeficiente r estar cercano a -1

Los coeficientes de correlacin r son medidas que indican la situacin de los sucesos respecto a las dos variables y son nmeros que varan entre los lmites +1 y -1 . Si r = 0 indica que no existe relacin entre las variables, por otro lado; si el valor de r se acerca al +1 o al 1 indica el tipo de relacin que las variables tienen, es decir, si al crecer una crece la otra o al decrecer una crece la otra etc. Clase N 26 ( 100 minutos ) Clculo del Coeficiente de Correlacin Lineal o de Pearson

130

r =

xy ( x2 ) ( y2 )

Donde:

r = Coeficiente de Correlacin lineal o de Pearson x = X - X y = Y - Y

Ejemplo No 4: Sean los valores ( X , Y ): ( 1 , 1.5 ) ; ( 2 , 2.2 ) ; ( 2.5 , 2 ) ; ( 3 , 2.5 ) ( 4 , 4.5 ) ; ( 4.5 , 4 ) ; ( 5 , 5 ) ; ( 6 , 5 ) Calcular el coeficiente de correlacin lineal . Solucin: PRIMER PASO: Diagrama de dispersin.
y
8
f(x )=0 .81 7 94 9* x +0 .474 67 9 Series 1

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

SEGUNDO PASO:

131 Calcular el coeficiente de correlacin lineal r, necesitamos los valores de la media aritmtica para X y Y
X X

para ello

= 28/8 = 3.5 x2 6.25 2.25 1.00 0.25 0.25 1.00 2.25 6.25 19.50 Y 1.5 2.2 2 2.5 4.5 4 5 5

Y = 26.7/8 Y = 3.34 y = Y -Y -1.84 -1.14 -1.34 0.84 1.16 0.66 1.66 1.66 y2 3.39 1.30 1.80 0.71 1.35 0.44 2.76 2.76 14.51 xy 4.6 1.71 1.34 0.42 0.58 0.66 2.49 4.15 15.95

X 1 2 2.5 3 4 4.5 5 6 28

x=X- X -2.5 -1.5 -1.0 -0.5 0.5 1.0 1.5 2.5

Por lo tanto:

r =

xy ( x2 ) ( y2 )

r =

15.95 ( 19.5 ) ( 14.5 )

r = 0.95 En este caso el coeficiente de correlacin lineal est muy cercano a +1, esto quiere decir, que la relacin existente entre las dos variables es bastante grande, y que a medida que X crece, tambin Y crece Ejemplo No 5: Preparar un diagrama de dispersin y calcular el coeficiente de correlacin lineal para la siguiente serie de valores (X,Y)

132 ( 3 , 1.5 ) ; ( 4 , 1 ) ; ( 5 , 0.75 ) ; ( 6 , 0.5 ) ; ( 7 , 0.25 ) Solucin: PRIMER PASO:


y
8
f(x )=-0 .3 * x+2 .3 Series 1

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

SEGUNDO PASO:
X X

= 25/5 = 5

Y = 4/5 Y = 0.8

X 3 4 5 6 7 25

x=X- X -2 -1 0 1 2

x2 4 1 0 1 4 10

Y 1.5 1 0.75 0.5 0.25 4.0

y = Y -Y 0.7 0.2 -0.05 -0.3 -0.55

y2 0.49 0.04 0.0025 0.09 0.3 0.92

xy -1.4 -0.2 0 -0.3 -1.1 -3.0

Por lo tanto:

r =

xy ( x2 ) ( y2 )

133 r = -3 ( 10 r = -0.99 Ejemplo No 6: Calcular r para: ( 1 , 2 ) ; ( 2 , 5 ) ; ( 3 , 1.5 ) ; ( 4 , 2.5 ) ; ( 5 , 4 ) ; ( 6 , 3.5 ) Solucin: PRIMER PASO:
y
8
Series 1

) ( 0.92 )

x
-8 -6 -4 -2 -2 2 4 6 8

-4

-6

-8

Existe muy poca correlacin SEGUNDO PASO:


X X

= 21/6 = 3.5 x2 6.25 Y 2

Y = 18.5/6 Y = 3.08 y = Y Y

X 1

x=XX

y2 1.17

xy 2.7

-2.5

-1.08

134 2 3 4 5 6 21 Por lo tanto: -1.5 -0.5 0.5 1.5 2.5 2.25 0.25 0.25 2.25 6.25 17.5 xy ( x2 ) ( y2 ) r = 2.75 ( 17.5 ) ( 8.73 ) r = 0.22 5 1.5 2.5 4 3.5 18.5 1.92 -1.58 -0.58 0.92 0.42 3.69 2.50 0.34 0.85 0.18 8.73 -2.88 0.79 -0.29 1.38 1.05 2.75

r =

1.1.1. Clculo del Coeficiente de Correlacin por Rangos de Spearman Se utiliza cuando ambos conjuntos de datos corresponden a medidas ordinales, es decir, a posiciones. El Coeficiente de correlacin por rangos ( rs ) se calcula aplicando la siguiente frmula: rs = 1 - 6 ( X Y )2 n ( n2 - 1 )

Ejemplo No 7:

135 Los examenes de 8 alumnos fueron ordenados, tanto los de admisin como sus calificaciones en el primer ciclo, de la siguiente forma: ( 1,2 ) ; ( 2,3 ) ; ( 3,1 ) ; ( 4,5 ) ; ( 5,7 ) ; ( 6,4 ) ; ( 7,8 ) ; ( 8,8 ) Calcular el coeficiente de correlacin por rangos rs Solucin: PRIMER PASO: Calcular ( x y )2 X 1 2 3 4 5 6 7 8 Y 2 3 1 5 7 4 8 8 X-Y -1 -1 2 -1 -2 2 -1 0 (X Y)2 1 1 4 1 4 4 1 0 16 SEGUNDO PASO: Aplicar la frmula rs = 1 - 6 ( X Y )2 n ( n2 - 1 ) rs = 1 6 ( 16 ) 8 ( 82 - 1 )
( 96 ) = 0.81 504

rs = 1 -

136 Ejemplo No 8: Cinco atletas compitieron en una carrera de 100 metros planos sin tener entrenamiento previo. Despus de siete meses de entrenamiento volvieron a competir. Las posiciones que cada uno de ellos obtuvo antes y despus del entrenamiento fueron: Antes : 1er 2do 3er 4o 5o Despus: 1er 2do 3er 5o 4o Encontrar el coeficiente de correlacin de rangos. Solucin: PRIMER PASO: X 1 2 3 4 5 Y 1 2 3 5 4 X-Y 0 0 0 -1 1 (X Y)2 0 0 0 1 1 2

SEGUNDO PASO: rs = 1 - 6 ( X Y )2 n ( n2 - 1 ) rs = 1 6( 2) 5(5 2 1)

=1-

12 ) 120

rs = 0.98

Sntesis:

137 0 La Correlacin estudia si existe algn tipo de relacin entre dos variables. 1 Los coeficientes de correlacin son una medida que indica la situacin de los sucesos respecto a las variables 2 Los lmites de los coeficientes de correlacin son 1 3 El coeficiente de correlacin por rangos de Spearman, se utiliza cuando ambos pares de datos, corresponden a medidas ordinales, es decir, de posicin.

Clase No 27 ( 100 min ) Tema: Regresin

138 Objetivo de la Clase: Al final de la clase el estudiante ser capaz de asociar variables y desarrollar regresiones lineales. Introduccin: Cuando entre dos variables existe correlacin rectilnea quiere decir que dichas variables se relacionan siguiendo la tendencia de una lnea recta, pero la correlacin en la mayora de los casos no es perfecta se presenta el problema de averiguar cul es la lnea recta que describe de mejor manera dicha relacin. Teora: 1. La Regresin La regresin tambin examina la relacin entre dos variables pero restringiendo una de ellas con el objeto de estudiar las variaciones de una variable cuando la otra permanece constante. En otras palabras, la REGRESIN es un mtodo que se emplea para predecir el valor de una variable en funcin de valores dados a la otra variable. Esto es necesario porque para un mismo diagrama de dispersin pueden trazarse varias lneas rectas. Por ejemplo:

En este caso cabe preguntarse: Cul de todas las rectas es la que mejor describe la relacin entre las variables ? Lgicamente es la que en promedio pasa ms cerca de todos los puntos.

139 Sin embargo, de todas las rectas la mejor es aquella que tiene la propiedad de que la suma de los cuadrados de las distancias verticales de los puntos de dichas rectas es mnima. En otras palabras, la recta que mejor se ajusta a los puntos es la que cumple con la siguiente propiedad: d12 + d22 + d32 + d42 . . . + dn2 es un mnimo Donde: d1

d2

dn

A esta recta se le conoce con el nombre de RECTA DE MINIMOS CUADRADOS Si se considera a X como variable independiente y a Y como variable dependiente, entonces la ecuacin de la lnea recta es: Y = a + bX A esta ecuacin se le llama ECUACIN DE MINIMOS CUADRADOS donde: a = Intercepto b = Pendiente Estos valores se obtienen de las llamadas ecuaciones normales: Y = na + bX XY = aX + bX2

Sin embargo, para obtener los valores de a y b se necesitara de simultanear ecuaciones. Por lo que se puede de una forma directa encontrar los valores de a y b con el uso de las siguientes ecuaciones:

140 a = ( Y )( X2 ) - ( X )( XY ) n( X2 ) - ( X )2 b = n( XY ) - ( X )( Y ) n( X2 ) - ( x )2

Ejemplo No 1: Cinco aspirantes a ingresar al ITCA se sometieron a un examen de admisin de matemtica general, dos meses despus ya alumnos del ITCA realizaron su primer examen de Matemtica I. Obtener para los datos dados, la ecuacin de regresin de mnimos cuadrados. Examen de Admisin Examen Matemtica I Solucin: PRIMER PASO: Calcular las sumatorias necesarias: X 6.0 6.5 6.7 7.0 9.5 35.7 SEGUNDO PASO: Sustituir y resolver las frmulas para a y b a = ( 23.1 )( 262.39 ) - ( 35.7 ) ( 181.66 ) 5 ( 262.39 ) - ( 35.7 )2 b = 5( 181.66 ) - ( 35.7 ) ( 23.1 ) 5 ( 262.39 ) - ( 35.7 )2 a = -11.32 b = 2.23 Y 1.5 1.2 4.8 6.2 9.4 23.1 X2 XY 36 9 42.25 7.8 44.89 32.16 49 43.4 90.25 89.3 262.39 181.66 (X) (Y) 6.0 1.5 6.5 1.2 6.7 4.8 7.0 6.2 9.5 9.4

141 TERCER PASO: Sustituir a y b en la ecuacin de mnimos cuadrados Y = a + bx Y = - 11.32 + 2.23 X

Utilidad de la Ecuacin de la Recta de Mnimos Cuadrados

La ecuacin de la recta de mnimos cuadrados se utiliza para poder predecir o estimar el valor desconocido de una variable Y, en base al valor conocido de otra variable X Por ejemplo, si se conoce la estatura de una persona, entonces, se puede predecir su peso. Si se conoce la medida del tronco de un rbol, se puede predecir su altura y as muchos casos. Ejemplo No 2: Los pesos en libras y las estaturas en centmetros de siete personas son las siguientes: Pesos en libras Estaturas en cms a) 105 155 113 160 118 164 125 169 140 160 145 168 160 167

Encontrar el coeficiente de Correlacin rectilnea

142
600

f(x )=2 .3 5 3 0 5* x +(-2 54 .7 9 ) Series 1

500

400

300

200

100

x
-500 -400 -300 -200 -100 100 200 300

-100

-200

-300

Estaturas X 105 113 118 125 140 145 160

x x

= 90.6 / 7 = 129.43 x -24.42 -16.43 -11.43 -4.43 10.57 15.57 30.57 x2 596.82 269.94 130.64 19.62 111.72 242.42 934.52 2305.68

y -8.29 -3.29 0.71 5.71 -3.29 4.71 3.71

y y

= 11.43 / 7 = 163.29 y2 68.72 10.82 0.50 32.60 10.82 22.18 13.76 159.40 xy 202.52 54.05 -8.12 -25.30 -34.78 73.33 113.41 375.11

Pesos Y 155 160 164 169 160 168 167

Por lo tanto: r = 375.11 ( 2305.64 ) ( 159.4) r = 0.62 Conclusin: a) Como r es ms cercano a + 1 la correlacin es + entre los pesos y Estatura.

143 b) Obtener la ecuacin de la recta de mnimos cuadrados, considerando el peso como variable dependiente de la estatura. Solucin: El enunciado quiere decir que las sumatorias relacionadas a los pesos sern ahora nuestra Y y las de la estatura las X. As: X 155 160 164 169 160 168 167 1143 Entonces: a = ( 906 )(186795 ) - ( 1143 ) (148312) 7 ( 186795 ) - ( 1143 )2 b = 7( 148312 ) - ( 1142 ) ( 906 ) 7 ( 186795 ) - ( 1143 )2 Por lo tanto: Y = a + bX Y = -254.79 + 235 X a = -254.79 b = 2.35 Y 105 113 118 125 140 145 160 906 X2 24025 25600 26896 28561 25600 28224 27889 XY 16275 18080 19352 21125 22400 24360 26720

186795 148312

c) Calcular el peso correspondiente a una estatura de 158 cms Solucin:

144 158 cms = X nos piden el peso = Y por lo tanto:

Y = -254.79 +2.35 ( 158 ) = 117 Y = 117 lb Nos podemos dar cuenta que con respecto a los datos dados para una estatura de 158 cms es lgico un peso de 116.5 libras.

d) Calcular la estatura correspondiente a 110 libras Solucin: Ahora 110libras = Y nos piden estatura = X Y = -254.79 + 2.35 X 110= -254.79 + 2.35 X 110 + 254.79 = 2.35 X

X = 110 + 254.79 2.35 X = 155.23 cm

Sntesis 5 Regresin es el mtodo que se emplea para predecir el valor de una variable en funcin de valores dados a la otra variable.

Clase No 28 ( 100 min )

145 Tema: Gua de Ejercicios de Unidad

Objetivo de la Clase: Al final de la clase el estudiante ser capaz de aplicar los conocimientos adquiridos en la resolucin de la Gua de Ejercicios dada. Introduccin: En la presente clase, resolveremos una gua de ejercicios, aplicando los conceptos y frmulas sobre regresin y correlacin.

No1 Nueve estudiantes obtuvieron en sus exmenes de Estadstica y matemtica las siguientes notas. Estadstica Matemtica 3.5 5.6 3.7 3.8 4.3 7.6 5.5 8.4 6.0 8.5 6.0 7.4 7.2 7.8 7.3 9.6 8.5 7.7

Presentar los datos anteriores por medio de un diagrama de dispersin y obtener su coeficiente de correlacin rectilnea. 0 Podemos concluir que existe correlacin rectilnea? 1 La correlacin es positiva o negativa? No2 Se midieron el largo y ancho de siete llaves, obteniendo en cms, los siguientes datos: Largo Ancho 4.3 1.2 6.5 2.7 7.6 2.5 11.1 4.2 12 4.7 15.2 7.1 15.9 6.7

Presentar los datos anteriores por medio de un diagrama de dispersin y obtener su coeficiente de correlacin rectilnea. 0 Podemos concluir que existe correlacin rectilnea? 1 La correlacin es positiva o negativa? No3 Las estaturas en cms y los pesos en libras de ocho personas se dan a continuacin: Estatura 163 164 165 167 169 170 182 182

146 Peso 124 127 136 134 140 150 155 171

Cul es el coeficiente de correlacin rectilnea para los datos anteriores. No4 Siete estudiantes decidieron competir entre s y las posiciones que cada uno de ellos obtuvo, tanto en estadstica como en matemtica son las siguientes: Estadstica Matemtica 1er 1er 2do 3er 3er 2do 4o 7o 5o 6o 6o 5o 7o 4o

Encuentre el coeficiente de correlacin por rangos. No5 A ocho personas se les midieron en cms las longitudes, tanto de antebrazo ( desde la mueca al codo ) como de la pierna ( desde el tobillo a la rodilla ). Obtenindose las siguientes medidas: Antebrazo Pierna a) b) c) 17 30 21 37 22 39 13 38 25 45 26 43 27 46 28 45

Calcular el coeficiente de correlacin rectilnea Obtener la ecuacin de mnimos cuadrados considerando a la longitud de la pierna como variable dependiente. Estimar la longitud de la pierna de una persona cuyo antebrazo mide 19 cms.

No6 Las edades en aos cumplidos y las estaturas en cms de cinco nios se presentan a continuacin: Aos Estatura 0 52 8 123 11 145 13 155 17 159

a) Calcular el coeficiente de correlacin rectilnea b) Obtener la ecuacin de mnimos cuadrados considerando a la estatura como variable dependiente. c)Estimar la estatura que se espera tenga un nio cuya edad sea de 10 aos.

147

No7 Se pregunt a cinco estudiantes que cuntas horas diarias dedicaban a or msica o ver televisin y qu cul era su promedio de notas. Obtenindose la siguiente informacin: Msica o TV Prom. Notas 0.5 9 1 7 3 5.5 4 4 6 2

a) Encontrar el coeficiente de correlacin rectilnea b) Si un estudiante dedica cinco horas diarias a ver TV o or msica Cul es la nota promedio que probablemente obtendr en sus estudios?

Clase No 29 ( 100 min. )

148 Unidad VII: Herramientas de Control Estadstico de Calidad CARTA DE CONTROL OBJETIVO: Que al final de este tema puedas llevar a cabo la elaboracin de las cartas X-R efectuando para ello los clculos necesarios. INTRODUCCIN Existen tantas caractersticas de calidad de tipo continuo en un producto o en un proceso, que interesa controlar su variabilidad y su tendencia central. Por ejemplo, las dimensiones de cierta pieza deben ser de 10 cm, con una tolerancia de 0.2 cm, por lo que la tendencia central de estas piezas debe estar muy prxima a 10, y su variabilidad debe ser tal que todas las piezas tengan una dimensin que caiga entre 9.8 y 10.2 cm. Generalmente, mediante una carta de control X se controla la tendencia central de este tipo de caractersticas de calidad, y mediante una carta R (u ocasionalmente una S) su variabilidad. EJEMPLO En una empresa que elabora agroqumicos, una caracterstica importante de los costales de fertilizantes es su peso, el cual, para cierto producto, debe ser de 50 kg. Adems, el cliente ve muy mal que los costales pesen mucho menos de 50 kg, por lo que se establece como especificacin o tolerancia inferior de 49 kilos, y como proteccin de la empresa se establece una especificacin superior de 51 kilos. De esta manera el valor nominal del peso es de 50 kilos, y si cae entre 49 y 51 se considerara aun tolerable. A continuacin utilizaremos la carta X - R para evaluar el desempeo del proceso de llenado tanto en relacin con la tendencia central como la variabilidad.
X R
__

Carta X. La forma operativa de construir esta carta inicia determinando la caracterstica de calidad a estudiar. En el caso del ejemplo, tal caracterstica es el peso de los costales de fertilizantes.

149 Para hacer un estudio inicial del desempeo del proceso sobre el tiempo en cuanto a la caracterstica de calidad, es necesario primero pesar costales que de alguna manera reflejen el comportamiento del proceso de llenado en un lapso de tiempo suficientemente representativo, por ejemplo 3 das, una semana o un mes. Usualmente esto se logra midiendo la caracterstica de calidad de una cantidad pequea de productos consecutivos (subgrupo de productos) cada determinado periodo y, en lugar de analizar la mediciones individuales, se analizan las medias y los rangos de los subgrupos (o muestras). En el ejemplo que nos ocupa, se decide pesar cada hora una muestra de 4 costales que han sido llenados consecutivamente. Los datos obtenidos en tres das se muestran en la tabla, en la que se incluye la media y el rango de cada muestra. La carta analizar el comportamiento sobre el tiempo de la columna de medias, con lo cual se tendr informacin sobre la tendencia central y sobre la variacin entre las muestras. Para calcular los lmites de control, en un estudio inicial como el que estamos haciendo, es necesario contar con las medias y rangos de alrededor de 20 muestras (puntos). TABLA: Peso de los costales de fertilizante Muestra o subgrupo 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Pesos de los costales 50.2 49.9 49.0 50.3 50.2 50.0 49.8 50.0 50.0 50.0 49.4 50.1 50.2 49.8 49.1 49.2 50.7 49.1 49.6 49.9 49.5 50.2 49.8 49.5 50.1 49.3 49.0 50.8 49.6 49.8 50.7 48.8 49.7 50.3 49.6 49.4 49.3 49.3 49.2 50.2 50.5 50.2 48.8 50.2 49.5 50.9 49.5 49.3 Medias Rango 49.80 1.2 49.95 1.0 49.88 0.3 50.00 1.1 49.75 1.1 49.70 1.6 49.73 0.4 50.03 1.1 49.43 1.1 50.15 1.2 49.83 1.9 49.65 1.0 49.58 1.3 50.45 0.7 49.53 1.4 49.90 1.6

50.1 49.3 49.7 50.5 49.9 49.8 49.9 50.6 49.3 50.4 50.1 49.3 50.5 50.9 49.6 49.9

150 17 18 19 20 21 22 23 24 49.7 49.4 49.9 49.7 50.6 49.9 49.6 49.6 48.8 49.3 49.7 49.2 49.6 49.9 50.2 48.9 49.6 49.4 49.9 49.4 49.6 50.0 49.9 50.2 49.5 50.2 49.1 49.7 49.9 49.7 48.7 49.0 49.40 49.58 49.65 49.50 49.93 49.88 49.60 49.43
__

0.9 0.9 0.8 0.5 1.0 0.3 1.5 1.3

medias

1194.28 R = 25.2 =49.76 1.05

=49.76

__

R=

1.05

De esta manera, los lmites de control para una carta un estudio inicial, se obtendrn de la siguiente

de control manera:

, en

LCS = +2 R X A Lineacentral = X LCI = 2 R X A


__ __ __ __ __

__ __

__

Para el presente ejemplo los lmites de control estn dados por:


LCS = 49.76 + (0.729 * 1.05) = 50.526 Lineacentral = 49.76 LCI = 49.76 (0.729 * 1.05) = 48.996

Donde A2 esta dado por valores predeterminados en tablas que en este caso es 0.729 para una muestra de 4, la carta en este caso ser:

151

Carta R. Este diagrama es utilizado para estudiar la variabilidad de una caracterstica de calidad de un producto o un proceso, y en ella se analiza el comportamiento sobre el tiempo de los rangos de las muestras o subgrupos. Los lmites de control para una carta R se obtienen de la siguiente manera:
LCS = D4 R Lneacentral = R LCI = D3 R
__ __ __

Donde las constantes D3=0 y D4 = 2.282 estn dados por valores en tablas para varios valores de nuestras n. Entonces los lmites de control para la carta R son los siguientes:
LCS = 2.282 * 1.05 = 2.3963 Lneacentral =1.05 LCI = 0 * 1.05 = 0

La carta en este caso ser:

152

Anlisis En la grfica de la carta X vemos que el proceso est bajo control estadstico en cuanto a tendencia central, con lo que se puede afirmar que el peso de los costales flucta de manera estable alrededor de 49.76 kilogramos. De aqu podemos ver dos hechos un positivo, la estabilidad y otro negativo, el promedio del proceso que es menor de 50 kilogramos que es lo deseado. En la grfica R vemos que la variabilidad del peso de los costales es estable. De lo anterior inferimos que los lmites de control calculados pueden servir para controlar las producciones futuras de envasado en a lnea de produccin. Sntesis Como se puede apreciar en este ejemplo nos interesa controlar la variabilidad y la tendencia central en un producto o en un proceso, cuyas caractersticas de calidad son de tipo continuo, o sea caractersticas que requieren un instrumento de medicin para medirse (pesos, volmenes, voltajes, longitudes, resistencias, temperaturas, humedad, etc). Para lo cual se utilizan las cartas de control X R.

153 CLASE 30( 100 Minutos) TEMA: CARTAS p OBJETIVO: Que al final de este tema puedas llevar a cabo la elaboracin de las cartas p efectuando para ello los clculos necesarios. INTRODUCCIN Debes saber que existen muchas caractersticas de calidad del tipo pasa o no pasa, donde de acuerdo con stas un producto es juzgado como defectuoso o no defectuoso, dependiendo de si se posee ciertos atributos. En estos casos, a un producto que no rene ciertos atributos no se le deja pasar a la siguiente etapa del proceso y se le segrega denominndolo artculo defectuoso. Tambin se acostumbra llamar a estos productos como no conformes. Carta p (proporcin de artculos defectuosos). Esta carta nos muestra las variaciones en la fraccin o proporcin de artculos defectuosos por muestra. La usamos ampliamente para reportar la proporcin (o porcentaje) de productos defectuosos en un proceso. En esta carta revisamos cada uno de los artculos de una muestra (o subgrupo), y cada uno de stos tiene una calidad aceptable o no, es decir, un artculo pasa o no pasa. En la carta p tomamos una muestra o subgrupo de n artculos, que puede ser la totalidad o una parte de las piezas de un pedido, un lote, un embarque o cierta produccin. Se revisamos cada uno de estos n artculos y se encuentra cules son defectuosos; entonces, en la carta p graficamos la proporcin de artculos defectuosos, que se obtiene al dividir la cantidad de artculos defectuosos encontrada en cada muestra entre el tamao de muestra, n. Cuando hacemos un estudio inicial para establecer los lmites de control en una carta p, entonces, lo que tenemos que hacer es estimar la media y la desviacin estndar de la variable que se grafica en la carta; que en el caso de la carta p, es pi. Considerando esto, si tomamos varias muestras (aproximadamente 20), los lmites de control para una carta p estn dados por:
p (1 p ) LCS = p + 3 n
__ __ __

Lnea central =

__

p (1 p ) LCI = P 3 n
__

__

__

154 donde n es el tamao de muestra y p es la proporcin promedio de artculos defectuosos, que se obtiene al dividir la cantidad de artculos defectuosos en todas las muestras entre la totalidad de productos inspeccionados. Como se puede apreciar en la frmula para calcular los lmites, la raz cuadrada de la expresin anotada es la estimacin de la desviacin estndar de pi EJERCICIO EJEMPLO En una empresa del ramo metal-mecnico se fabrican Vlvulas. Despus del proceso de fundicin se hace una inspeccin y las piezas que no cumplen con ciertas caractersticas son rechazadas. Las razones por las que pueden ser rechazadas son diversas: piezas incompletas, porosas, mal formadas, etctera. Para evaluar la variabilidad y la magnitud de la proporcin de piezas defectuosas en el proceso de fundicin se decide implantar una carta p. El proceso de fundicin se hace por lotes. En la tabla se muestran los datos obtenidos durante una semana para cierto tipo de vlvulas.
Muestra o lote Tamao de lote, ni Artculos defectuosos, Di Proporcin pi
__

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

300 300 300 300 300 300 300 280 290 300 300 300 300 300 300 300 300 300 300 300 300 __ n = 300

15 12 15 7 16 6 18 10 9 25 9 4 7 9 5 15 19 7 12 10 4

0.05 0.04 0.05 0.02 0.05 0.02 0.06 0.04 0.03 0.08 0.03 0.01 0.02 0.03 0.02 0.05 0.06 0.02 0.04 0.03 0.01 __ p=

155 0.03714 Aunque regularmente el tamao de lote es fijo, n = 300, en ocasiones por diferentes motivos en algunos lotes se hacen unas cuantas piezas de ms o de menos, como se aprecia en la tabla lotes 8 y 9. DESARROLLO Para analizar estos datos mediante un estudio inicial con la carta p lo primero que tienes que hacer es calcular sus lmites de control provisionales: El primer paso para calcular los lmites provisionales con tamao de muestra promedio es calcular n:
n=

n
21

6270 = 298.57 300 21

De la tabla se obtiene n = 300. As en la formula para calcular los lmites de __ control, n se sustituye por n .
n = n = 300
__
__

Tambin es necesario calcular p , que se obtiene sumando todos los artculos defectuosos, los D1 y dividindolos entre el total de artculos inspeccionados, la suma de los ni.
__

p = Di ni = 234 6300 = 0.03714

De esta manera los lmites de control son:


LCS = 0.03714 + 3 0.03714(1 0.03714) = 0.06989 300

Lnea central = 0.03714


0.03714(1 0.03714) = 0.00439 300

LCI = 0.03714 3

156 ANLISIS DE RESULTADOS.

En esta carta se aprecia que el proceso de fundicin no estuvo en control estadstico, ya que en el lote 10 se dio una proporcin de artculos defectuosos mayor que el lmite superior. De aqu que en la fabricacin de tal lote hubo alguna situacin especial que caus una proporcin de artculos defectuosos anormalmente grande. Tal causa debe ser identificada para que en el futuro no se vuelva a presentar. Sntesis Hay ciertas caractersticas de calidad de los productos que si se cumplen o no, dan como resultado que al revisarlos se considere que pasan o no pasan a la siguiente etapa del proceso de produccin y se les considera artculos defectuosos. Para llevar a cabo este anlisis se utilizan la cartas p que muestra la variaciones en la fraccin o proporcin de artculos defectuosos por muestra.

157 CLASE 31 ( 100 minutos) GRAFICO OBJETIVO: Que al final de este tema puedas llevar a cabo la elaboracin de las cartas X-S efectuando para ello los clculos necesarios. INTRODUCCIN Una forma de apreciar ms claramente el significado de la desviacin estndar como medida de dispersin en torno a la media, es a travs de la relacin entre la media y la desviacin estndar, cuando se tiene un conjunto de datos y se desea saber lo disperso que estn entre si o que tan esparcidos estn respecto a su tendencia central. La medida ms usual es la desviacin estndar muestral, que est definida por:
S= ( X 1 X ) 2 + ( X 2 X ) 2 + ..... + ( X n X ) 2 n 1
__ __ __

como se puede apreciar, S mide la dispersin de los datos en torno a la media, y entre ms grande sea el valor de S mayor variabilidad habr entre los datos y por ende ms mala calidad. EJEMPLO: Se est elaborando cereales en paquetes de 1 Kg. Se extraen muestras de tamao n = 6, cada media hora. En el cuadro se ven los resultados.

___

X =X

__

__

__

S
K

158 =17.67/25 = 0.71 = 75.55/25 = 3.02

Aplicando estos valores encontrados en las formulas de los lmites superior e inferior, tenemos:

LCS = x + A3 s

__

LCI = x A3 s

__

LCS = 0.71 + (1.287 * 3.02) = 4.60 LCI = 0.71 (1.287 * 3.02) = - 3.18

LCS LCI

los lmites de control para el grfico de las desviaciones estndar ser:


LSCS = B4 S = 1.97 * 3.02 = 5.95 LICS = B3 S = 0 * 3.02 = 0
__ __

Grfico de S
6.00 5.00 4.00 3.00 2.00 1.00 0.00 1 3 5 7 9 15 21 23 25 11 13 17 19

LCS
S

159 Conclusin del problema. Cmo podemos comprobar el grfico de las medias est fuera de control. Cuando esto sucede es posible que el personal de produccin pueda descubrir y eliminar las causas que provocan la aparicin de esos puntos. Mientras no se corrijan esos problemas no podremos seguir adelante tratando de averiguar cual es la capacidad del proceso ya que eso solo lo podremos efectuar cuando el proceso est bajo control. EL DIAGRAMA S2 Por contraste con la prctica de la ingeniera, los estadgrafos matemticos aconsejan el uso de un diagrama S2 para controlar la variabilidad del proceso cuando las muestras son grandes. La cantidad S2 es una estadstica no sesgada, y para un universo normal los lmites de probabilidad correspondientes, pueden ser deducidos fcilmente de la distribucin X2. As para
S2 = j

( X ij X j )2
n 1
__ 2

__

la lnea central del diagrama de control sera 0.001 caeran en libertad. Sntesis
Sj 2 X 0.9999 ( n 1)
__ 2 __ 2

y los lmites de probabilidad para (n-1) grados de

Sj 2 X 0.001 (n 1)

Cuando se trabaja con tamaos de muestra n > 10 se recomienda trabajar con los grficos X S en cuyo caso los lmites de control estn dados por las siguientes frmulas:

Donde A3 es una constante dado en tablas, para cierto valor de n.

160 Para el diagrama S2 los valores de X Y X son valores que se encuentran en las tablas correspondientes de las distribucin t student considerando los grados de libertad.
2 0.9999 2 0.001

Pasos para la construccin de grficos Se toman k muestras de tamao n. Se calcula la media y la desviacin estndar de cada muestra.
1 n X i = xij n j =1 Si =
j =1

xij X i n 1

Se calculan los parmetros poblacionales.

X =

1 k X i k i =1

S =

1 k Si k i =1

Clase 32 ( 100 minutos)

161 DESARROLLO DE LAS CARTAS X S Objetivo Que los alumnos pongan en prctica los conocimientos tericos sobre el calculo y desarrollo de cartas X S, mediante la resolucin de problemas de aplicacin industrial. Introduccin Como ya se dijo antes, en la industria siempre es necesario establecer como se estn llevando a cabo los procesos productivos, esto se logra mediante el control estadstico de la calidad. Para poner en prctica la teora antes vista sobre las variables continuas de los procesos, sus clculos y sus grficos, se dan a continuacin los ejercicios que has de resolver en esta sesin de clase. Ejercicio 1: La compaa Aluminio de El Salvador, produce una variedad de productos de aluminio, la cual abastece a los fabricantes de partes. Un producto de la compaa es una barra de aluminio, la cual deber tener de dimetro 25 0.5 mm. Para cumplir con las especificaciones de diseo de sus clientes. La compaa compra barras de aluminio las cuales son estiradas a travs de tres matrices. Las matrices estiran la barra hasta el dimetro requerido. El operador de la mquina toma 11 medidas para verificar su longitud a intervalos especficos de tiempo y registra los resultados. Los cuales se pueden apreciar en la siguiente tabla

Hacer los clculos y construir la carta de control X S para este ejercicio.

__

162 Est el proceso bajo control? Ejercicio 2: Conforme se llenan las cajas de cereal en una fbrica, se pesan sus contenidos en una bscula automtica. El valor objetivo es que en cada caja se tengan 10 onzas de cereal. Para propsitos de control de calidad se pesan 20 muestras de 11 cajas cada una. El peso de llenado de cada caja es el siguiente:

a) Calcule los lmites de control para una grfica X S b) Determine cuales de las muestras estn fuera de control c) Piensa usted que el proceso es la suficientemente estable para comenzar a utilizar estos datos como base para los clculos posteriores. ANEXOS.

__

163

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6

0 0.00 00 0.03 98 0.07 93 0.11 79 0.15 54 0.19 15 0.22 58 0.25 80 0.28 81 0.31 59 0.34 13 0.36 43 0.38 49 0.40 32 0.41 92 0.43 32 0.44 52 0.45 54 0.46 41 0.47 13 0.47 72 0.48 21 0.48 61 0.48 93 0.49 18 0.49 38 0.49 53

1 0.00 40 0.04 38 0.08 32 0.12 17 0.15 91 0.19 50 0.22 91 0.26 12 0.29 10 0.31 86 0.34 38 0.36 65 0.38 69 0.40 49 0.42 07 0.43 45 0.44 63 0.45 64 0.46 49 0.47 19 0.47 78 0.48 26 0.48 64 0.48 96 0.49 20 0.49 40 0.49 55

2 0.00 80 0.04 78 0.08 71 0.12 55 0.16 28 0.19 85 0.23 24 0.26 42 0.29 39 0.32 12 0.34 61 0.36 86 0.38 88 0.40 66 0.42 22 0.43 57 0.44 74 0.45 73 0.46 56 0.47 26 0.47 83 0.48 30 0.48 68 0.48 98 0.49 22 0.49 41 0.49 56

3 0.01 20 0.05 17 0.09 10 0.12 93 0.16 64 0.20 19 0.23 57 0.26 73 0.29 67 0.32 38 0.34 85 0.37 08 0.39 07 0.40 82 0.42 36 0.43 70 0.44 84 0.45 82 0.46 64 0.47 32 0.47 88 0.48 34 0.48 71 0.49 01 0.49 25 0.49 43 0.49 57

4 0.01 60 0.05 57 0.09 48 0.13 31 0.17 00 0.20 54 0.23 89 0.27 04 0.29 96 0.32 64 0.35 08 0.37 29 0.39 25 0.40 99 0.42 51 0.43 82 0.44 95 0.45 91 0.46 71 0.47 38 0.47 93 0.48 38 0.48 75 0.49 04 0.49 27 0.49 45 0.49 59

5 0.01 99 0.05 96 0.09 87 0.13 68 0.17 36 0.20 68 0.24 22 0.27 34 0.30 23 0.32 89 0.35 31 0.37 49 0.39 44 0.41 15 0.42 65 0.43 94 0.45 05 0.45 99 0.46 78 0.47 44 0.47 98 0.48 42 0.48 78 0.49 06 0.49 29 0.49 46 0.49 60

6 0.02 39 0.06 36 0.10 26 0.14 06 0.17 72 0.21 23 0.24 54 0.27 64 0.30 51 0.33 15 0.35 54 0.37 70 0.39 62 0.41 31 0.42 79 0.44 06 0.45 15 0.46 08 0.46 86 0.47 50 0.48 03 0.48 46 0.48 81 0.49 09 0.49 31 0.49 48 0.49 61

7 0.02 79 0.06 75 0.10 64 0.14 43 0.18 08 0.21 57 0.24 86 0.27 94 0.30 78 0.33 40 0.35 77 0.37 90 0.39 80 0.41 47 0.42 92 0.44 18 0.45 25 0.46 16 0.46 93 0.47 56 0.48 08 0.48 50 0.48 84 0.49 11 0.49 32 0.49 49 0.49 62

8 0.03 19 0.07 14 0.11 03 0.14 80 0.18 44 0.21 90 0.25 18 0.28 23 0.31 06 0.33 65 0.35 99 0.38 10 0.39 97 0.41 62 0.43 06 0.44 29 0.45 35 0.46 25 0.46 99 0.47 61 0.48 12 0.48 54 0.48 87 0.49 13 0.49 34 0.49 51 0.49 63

9 0.03 59 164 0.07 54 0.11 41 0.15 17 0.18 79 0.22 24 0.25 49 0.28 52 0.31 33 0.33 89 0.36 21 0.38 30 0.40 15 0.41 77 0.43 19 0.44 41 0.45 45 0.46 33 0.47 06 0.47 67 0.48 17 0.48 57 0.48 90 0.49 16 0.49 36 0.49 52 0.49 64

165 reas Bajo la Curva Normal Estndar

166

You might also like