You are on page 1of 48

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

I UNIDAD

ESTADSTICA DESCRIPTIVA

Jaime Hernndez Mata

Pgina 1

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

I: ESTADSTICA DESCRIPTIVA
1.1 INTRODUCCIN, NOTACIN SUMATORIA

La estadstica estudia los procedimientos y tcnicas para recolectar los datos relativos a las caractersticas (variables) de inters, organizarlos, representarlos y analizarlos. Esto sirve de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales. En Estadstica usualmente interesa conocer algo sobre una caracterstica (variable) de un grupo grande (poblacin), examinando nicamente algunos de sus elementos (muestra). Para su estudio la estadstica se clasifica en: Estadstica Descriptiva y Estadstica Inferencial. La Estadstica Descriptiva se refiere a los mtodos de recoleccin, ordenamiento, clasificacin, presentacin, anlisis e interpretacin de un conjunto de datos, con el fin de resumir stos con uno o dos elementos de informacin que describan apropiadamente las caractersticas de ese conjunto. La Estadstica Inferencial se refiere al proceso de generalizar las caractersticas del conjunto de datos muestreado (muestra) a toda la poblacin, lo cual lleva implcito una serie de riesgos, analizados al estudiar la estadstica inferencial. Algunos trminos de uso frecuente en estadstica son: Datos son las observaciones recolectadas. Estos forman un conjunto de datos para cada caracterstica (variable). En general, forman el conjunto de los n datos . Datos es sinnimo de muestra. Ejemplo 1.1.- Los datos relativos a las estaturas, en centmetros, de cinco estudiantes de probabilidad, son: Variables son las caractersticas que se desea estudiar de una poblacin. Es usual denotarlas con letras maysculas, por ejemplo: X, X1, X2, Y, Z, etc. Ejemplo 1.2.- Son variables cuantitativas: la edad, la estatura, el ingreso de una persona, etc.; y son variables cualitativas: el sexo, nmero de filiacin al IMSS, la preferencia por un partido poltico, etc. Poblacin es el conjunto completo de todos los elementos de inters para un estudio.
Jaime Hernndez Mata Pgina 3

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Muestra es un subconjunto de la poblacin, donde los datos estn tomados aleatoriamente. Datos es sinnimo de muestra. Muestreo aleatorio es aquel en el cual todos los elementos de la poblacin tienen igual posibilidad de ser elegidos para la muestra. Parmetro es un valor que se refiere a una caracterstica de una poblacin. Estadstico es un valor que se refiere a una caracterstica de una muestra. Anlisis estadstico es el proceso completo de organizacin, procesamiento, reduccin e interpretacin de los datos para realizar inferencias.

TIPOS DE DATOS Otro aspecto importante usado en la estadstica es el tipo de datos. Los datos estadsticos pueden ser cualitativos y cuantitativos Datos cualitativos son datos no numricos. Tambin son llamados datos categricos o de atributos. Ejemplo 1.3.- Son datos cualitativos: 1) la marca de un producto, los meses del ao, el nmero de la cartilla militar, el numero de control de los alumnos de los Institutos Tecnolgicos, etc. Debemos notar que los nmeros de cartilla y de control de alumnos en realidad no son nmeros como tales, ya que no se suman, ni se les saca un promedio, y solo son un cdigo. Estos datos cualitativos se asocian a variables que, en consecuencia, son variables cualitativas. Datos cuantitativos son datos numricos. Estos pueden ser de dos tipos: discretos y continuos. Datos discretos son aquellos que resultan de un conteo. Los datos discretos se asocian a variables que por lo tanto son llamadas variables discretas. En general, podemos decir que son nmeros que definen exactamente el valor del dato. Ejemplo 1.4.- Son variables y datos discretos
1) El nmero de habitantes por casa ( X= 0, 1, 2, 3, 11), 2) el nmero de autos vendidos diariamente en una agencia (X= 0,1, 2,..23), 3) El nmero de artculos defectuosos fabricados en una lnea de produccin (X= 0, 1, 2, 3, 4, ..8), etc.

Datos continuos son aquellos que resultan de una medicin. Estos datos son asociados a variables llamadas variables continuas.
4

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Ejemplo 1.5.- Son variables y datos continuos:


1) la distancia recorrida diariamente por un taxi, (200 km X 1,000 km), 2) el tiempo que tarda en llegar un estudiante desde su casa al Instituto, (4 min X 90 min), 3) los kilogramos de mango vendidos semanalmente, etc. (250 kg X 1500 kg).

En general, podemos decir que son nmeros que definen aproximadamente el valor del dato, as por ejemplo, la distancia recorrida diariamente por un taxi es un valor continuo porque la medicin estar dentro de un intervalo, digamos entre 200 km y 1000 km, que aproximamos anotando, por ejemplo, 667.8 km, es decir, que al hacer esto lo estamos discretizando. Pero no debemos perder de vista que es la medicin de una distancia y, por ende, es de tipo continuo, que ha sido aproximado a un valor, pero que lo ms probable es que sea otro tal como, digamos, 667.812345km.

REDONDEO otro aspecto importante es el redondeo de datos. El resultado de redondear 234.7 a la unidad ms cercana, es 235, debido a que est ms cerca de 235 que de 234. Igualmente, redondear 367.4513 a centsimas (dos decimales) resulta en 367.45, y redondear $ 137, 250, 000 a millones resulta en $137 millones. Cuando el digito a redondear es el 5 entonces se redondea al nmero par ms cercano. As, por ejemplo, el resultado de redondear a dcimas 146.65 es 146.6, y el de redondear 147.75 es 147.8. NOTACIN SUMATORIA, . La notacin sumatoria, denotada con la letra griega sigma mayscula, , se usa para indicar de manera general las sumas algebraicas de los datos. Es muy til cuando los datos son muchos. Para sumar los n datos de un conjunto X , usamos la notacin . Si no se causa confusin alguna puede usarse solamente , es decir:

en vez de

EJEMPLO 1.6.- Consideremos el siguiente conjunto de datos: , el cual puede representarse simblicamente como , (donde: x1=8, x2=3, x3=2; x4=4 y x5=7), entonces la sumatoria de los 5 datos (n=5) se representa y determina como sigue:

Jaime Hernndez Mata

Pgina 5

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

= 8 + 3 + 2 + 4 + 7 = 24

Y, la suma de los cuadrados de los datos es:

= 82 + 32 + 22 + 42 + 72 = 142

El operador cumple las siguientes propiedades: 1.


El resultado de una suma de dos o ms variables es igual a la suma de las sumatorias de estas variables

2.
La sumatoria de una constante es igual que sumar la constante a s misma tantas veces como lo indique la sumatoria

3.
Propiedad distributiva.- cuando se multiplica cada uno de los trminos que componen una suma por la misma constante, es posible primero efectuar la suma de los trminos y luego multiplicar el resultado por la constante.

1.1.1 DATOS NO AGRUPADOS.


Los datos no agrupados es el conjunto de datos obtenidos en una muestra, , los cuales no han sido clasificados en clases o categoras. Es usual ordenar en forma creciente (o decreciente) los datos cuantitativos, ya que esto ayuda a agrupar los datos y a hacer el anlisis estadstico. En lo sucesivo se asume que cuando los datos estn ordenados lo estn en forma ascendente, pero siguen siendo datos no agrupados mientras no se agrupen en clases o categoras. Para hacer un anlisis estadstico es usual determinar algunos valores representativos de los datos, tales como las que se tratan a continuacin en los puntos 1.1.2, 1.1.3, 1.1.4 y 1.1.5.

1.1.2 MEDIDAS DE TENDENCIA CENTRAL.


Las medidas de tendencia central son estadsticos cuyas magnitudes tienden a ubicarse en el centro de los datos cuando estn ordenados por magnitud. Las medidas de tendencia central son: a) la media, b) la mediana, y c) la moda.

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

a) LA MEDIA, : La media aritmtica, o simplemente la media o promedio, es un valor estadstico que equilibra los datos menores y mayores que ella, cuando estos imaginariamente son puestos en un sube y baja. En la siguiente figura 1.1 se puede apreciar esto, donde la media de 5 datos es 7.2.

Figura 1.1.- La media como punto de equilibrio de los datos.

La media de un conjunto de n datos

, se denota y calcula por: ec 1.1

Ejemplo 1.7.-: La media del conjunto de datos: X = {4, 10, 5, 5, 12}, es:

LA MEDIA PONDERADA, es la media aritmtica cuando el dato x1 tiene un peso o una frecuencia f1, el dato x2 tiene un peso o una frecuencia f2, , y xn tiene un peso o frecuencia fn, de modo que la media ponderada puede calcularse por: ec. 1.2

Ejemplo 1.8.- El pasado semestre Juan y Luis cursaron el mismo nivel escolar. Las calificaciones obtenidas por ellos, as como los crditos de las asignaturas aparecen en la siguiente tabla:

Asignatura Qumica Liderazgo Metodologa de la Investigacin Matemticas


Jaime Hernndez Mata

Crditos 10 6 4 10

Calif. Juan 100 80 70 90

Calif. Luis 80 90 100 70


Pgina 7

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Para ambos, la media sin ponderar es la misma, puesto que el conjunto de calificaciones es el mismo para los dos, y es:

Pero el promedio ponderado por el nmero de crditos es: Para Juan: Para Luis:
Como puede verse, el promedio es 85 para ambos, pero el promedio ponderado es diferente para ellos, en razn de la importancia de los crditos de cada materia.

b) LA MEDIANA, : Cuando los datos estn ordenados por magnitud, la mediana es el valor central que divide a los datos en dos partes iguales, es decir, es el valor que divide los datos en 50% menores que ella y 50% mayores que ella. Hay dos casos: a) Cuando n es impar: la mediana,
, es el valor central, es decir:

ec. 1.3

Ejemplo 1.9.-En {4, 5, 5, 10, 12}, la mediana es Esto indica que hay 50% de datos menores o iguales a datos mayores o iguales que . y 50% de

b) Cuando n es par: la mediana es la media de los dos datos centrales. ec. 1.4

Ejemplo 1.10.- En {4, 5, 5, 8, 10, 12}, La mediana es .

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Este valor indica que hay 50% de datos menores o iguales a 50% de datos mayores o iguales a

c) LA MODA, : La moda es el valor ms frecuente en un conjunto de datos, es decir, es el que se repite ms veces. Un conjunto de datos puede no tener moda (amodal), tener una moda (unimodal), dos modas (bimodal) o varias modas (polimodal). As: Ejemplo 1.11: en X = {4, 5, 10, 12}, el conjunto es amodal,
en y en X = {4, 5, 5, 10, 12}, la moda es , .X = {4, 5, 5, 10, 12, 12, 15}, hay dos modas: y .

1.1.3 MEDIDAS DE POSICIN.


Cuando los datos estn ordenados por magnitud, las medidas de posicin nos permiten obtener estadsticos para los cuales un determinado porcentaje j de los n datos, ( ), es menor que el j%, y, en consecuencia el complemento (100 )% es mayor que esa medida de posicin. La mediana es una medida de posicin con j=50 %. Las medidas de posicin usuales son: Percentiles, Deciles y Cuartiles, las cuales se presentan a continuacin. Percentiles. El percentil j-simo, denotado Pj, es el valor del cual el j % de los datos ordenados son menores que l, y el (100 j) % son mayores que l. Un conjunto de datos puede dividirse en 100 partes por medio de los 99 percentiles: P1, P2, P3, , P99, cada parte conteniendo el 1% de los datos. El clculo del percentil se muestra con el siguiente ejemplo. Ejemplo 1.12.- Determine el percentil 25, P25, en X = {4, 4, 5, 5, 10, 12, 12, 15, 16, 17, 18}. Solucin: Como hay n = 11 datos, la posicin del percentil 25, est en el 25 % de los 11 datos, pos= , es decir, se encuentra un 75% despus del 2 dato. Y, para calcular el valor del percentil 25, P25, al segundo dato le sumamos la diferencia entre los datos 3 y 2, la cual multiplicamos por el residuo del valor de la posicin, pos, es decir:
Jaime Hernndez Mata Pgina 9

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

4.75 As entonces, al 25 % de los datos del conjunto X son menores o iguales que el valor 4.75.

Ahora se generaliza la frmula del percentil: La posicin del percentil j es: Y la magnitud del percentil j es: ec. 1.6
Donde ent(valor) indica el subndice, y es solo la parte entera del (valor)

pos=

ec. 1.5

Deciles. Los deciles son 9, D1, D2, , D9, y dividen a los datos ordenados por magnitud en 10 partes iguales, cada una con el 10% de los casos. El decil siete, denotado D7, nos indica el valor del cual 7 dcimas partes de los datos son menores o iguales que el D7, y que 3 dcimas partes son mayores que l. Para calcular los deciles tmese en cuenta que: D1=P10, D2 = P20, ,D9 = P90. Cuartiles. Los cuartiles son 3: Q1, Q2, y Q3. Cuando los datos estn en orden de magnitud, los cuartiles los dividen en 4 partes iguales, , cada una con el 25% de los casos. Para calcular los cuartiles considrese que: Q1= P25, Q2 = P50 = , y Q3 = P75.

1.1.4 MEDIDAS DE DISPERSIN.


Las medidas de dispersin sirven para medir la extensin o distanciamiento de los datos en una distribucin. Existen varias medidas de dispersin. A continuacin se presentan las ms importantes y al final de este se presenta un ejemplo que incluye el clculo de todas estas. EL RANGO, R, de un conjunto de datos es la distancia entre el valor mximo y el valor mnimo:

R = Xmax X min = Xmin Xmax

ec 1.7

El rango puede dejarse indicado con los dos valores extremos del conjunto de datos, a fin de recordar entre qu valores se encuentran estos, o bien, puede
10

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

obtenerse la resta. EL RANGO SEMIINTERCUARTILICO , Q, o desviacin cuartil, se define como: ec 1.8

LA DESVIACIN,

, es una de las medidas de dispersin ms importantes de la estadstica, y es la distancia que tiene cada dato respecto de la media . ec 1.9 Una desviacin negativa significa que el dato se encuentra a la izquierda de la media, y una desviacin positiva significa que el dato se encuentra a la derecha de la media. La desviacin tiene la propiedad de que la suma de las desviaciones es cero: ec 1.10

LA DESVIACIN MEDIA, dm, tambin llamada desviacin promedio, es el promedio del valor absoluto de las desviaciones, es decir: ec 1.11 LA DESVIACIN ESTNDAR. Puede decirse que la desviacin estndar es una medida de desviacin de los datos que es semejante a la desviacin media. La desviacin estndar, s, de una muestra, se define como: ec 1.12 Una formula abreviada para calcular la desviacin estndar, que ayuda a simplificar los clculos, especialmente cuando la media tiene decimales, es: ec 1.13 La desviacin estndar, , de una poblacin, se define como: ec 1.14 Donde es la media de la poblacin.
Jaime Hernndez Mata Pgina 11

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Cuya frmula abreviada es:

ec 1.15 LA VARIANZA se define como el cuadrado de la desviacin estndar. As, la varianza tiene las unidades al cuadrado. En una muestra, la varianza, , es: ec 1.16 Cuya frmula abreviada es: ec 1.17 EN una poblacin, la varianza, , es: ec 1.18 Cuya frmula abreviada es: ec 1.19

COEFICIENTE DE VARIACIN,

, de Pearson.

Es la medida de dispersin relativa ms usada. Se define como la relacin de la desviacin estndar respecto a la media, y es adimensional. Para una muestra: Para una poblacin: ec 1.20 ec 1.21

El coeficiente de variacin tiene la desventaja de que cuando las medias (divisor) tienen un valor cercano a cero, el CV tiende a ser muy grande.

EJEMPLO 1.13.- Calculo de estadsticos para datos no agrupados.


El nmero de televisores vendidos en una muestra de 5 das, seleccionados aleatoriamente, el mes pasado en la mueblera La Parota fue: X = {5, 12, 4, 10, 5}. Determinar a) el rango, b) 12

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

la desviacin de cada dato, c) la desviacin promedio, d) la desviacin estndar, e) la varianza, y f) el coeficiente de variacin.

SOLUCIN:

a)

El rango es: R = Xmax X min = 12 4 = 8.


Lo que significa que, de los das muestreados, el da que se vendieron ms televisores fueron 12; el da que menos se vendieron fueron 4 televisores, con un rango de 8 tvs entre estos dos das.

b) :

Para calcular las desviaciones necesitamos primero calcular la media:

Y las n desviaciones son:


= 5 7.2 = 12 7.2 = 4 7.2 = 10 7.2 = 5 7.2 = = = = = -2.2 4.8 -3.2 2.8 -2.2

Lo cual significa que, de los das muestreados, el primero y quinto da se vendieron 2.2 tvs por abajo del promedio de 7.2 tvs, que el segundo da se vendieron 4.8 tvs por arriba del promedio, el tercer da muestreado 3.2 tvs menos que el promedio y el cuarto da muestreado se vendieron 2.8 tvs ms que en un da promedio. c) La desviacin media es:

Que significa que, en promedio, se vendieron 3.04 tvs por arriba o por debajo de la media de 7.2 tvs. Es decir, es la diferencia o desviacin promedio respecto de la media.. d) La desviacin estndar para una muestra es:

TVs
O, por la frmula abreviada 1.17:

TVs

Jaime Hernndez Mata

Pgina 13

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

e)

La varianza:

TVs2
f) El coeficiente de variacin:

(o, 174%). El coeficiente de variacin permite comparar las d isp e rsio n e s de dos distribuciones distintas, siempre que sus m ed ia s sean p o sit iva s . La ma yo r d isp e rsi n corresponder al valor del coef icie n te de va ria ci n m a yo r .

Ejemplo 1.14.- Una distribucin tiene


SOLUCIN:

= 140 y = 35 y otra las dos presenta mayor dispersin?

= 150 y

= 40. Cul de

(o 400%), (o 375%),
Respuesta: La primera distribucin presenta mayor dispersin.

1.1.5 MEDIDAS DE FORMA.


Nos permiten evaluar la forma que adopta la distribucin de frecuencias de los datos respecto al grado de distorsin (inclinacin) que registra respecto a valor promedio tomado como centro de gravedad, el grado de apuntamiento (elevamiento) de la distribucin de frecuencias. A mayor elevamiento de la distribucin de frecuencia significar mayor concentracin de los datos en torno al promedio, por tanto, una menor dispersin de los datos. Estas medidas son: 1) Asimetra o sesgo, y 2) Curtosis 1.1.5.1.- Asimetra o Sesgo El sesgo de una distribucin de datos es su grado de asimetra. Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central, es decir, respecto de media aritmtica, . La asimetra presenta tres estados diferentes, (Fig.1-2), cada uno de los cuales define de forma concisa cmo estn distribuidos los datos respecto al eje de asimetra.
14

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Si la cola mayor est a la derecha de la moda la curva es sesgada a la derecha (sesgo positivo)

Si los datos son equidistantes al mximo central, coinciden media, mediana y moda (sin sesgo)

Si la cola mayor est a la izquierda de la moda la curva es sesgada a la izquierda (sesgo negativo)

Figura 1-2 Asimetra o sesgo.

Se dice que la asimetra es positiva cuando la mayora de los datos se encuentran concentrados abajo del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como asimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores mayores que la media. Ejemplo 1.15.- La venta de frutas en una bodega es ejemplo de sesgo
positivo, ya que en fresco estas se venden rpidamente y despus ya muy lentamente. Los salarios diarios tambin tienen sesgo positivo, ya que la mayora de los salarios son pequeos y solo unos pocos sern mayores que la media; en tanto que la venta de casas en un nuevo fraccionamiento suele tener sesgo negativo, ya que al principio las casas se venden muy lentamente.

El Coeficiente de asimetra ms preciso es el de Fisher, dado por la ecuacin 1.22:

ec 1.22

Donde representa el coeficiente de asimetra de Fisher, cada uno de los valores, la media de la muestra y la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan como sigue: (-0.50 ( ( 0.50): La distribucin es Simtrica. (Hay aproximadamente igual
cantidad de datos a la izquierda y a la derecha de la media). izquierda que a la derecha de la media.)

> 0.50): La curva tiene sesgo positivo. (Cola derecha. Hay ms datos a la < 0.50): La curva tiene sesgo negativo. (Cola izquierda. Hay ms datos a la derecha que a la izquierda de la media.)

Jaime Hernndez Mata

Pgina 15

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Cuanto mayor es la magnitud de aglomeracin de los datos. 1.1.5.2.- Curtosis

mayor es la distancia desde la media hasta la

Esta medida determina el grado de concentracin (apuntalamiento) que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

a) Leptocrtica

b) Mesocrtica Figura 1-3 Curtosis.

c)

c) Platicrtica

Para calcular el apuntalamiento se utiliza la ecuacin del coeficiente de Curtosis de Fisher:

ec 1.23

Donde:
muestra y
(

representa el coeficiente de Curtosis, cada uno de los valores, la media de la la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:
= 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (Los datos tienen una dispersin normal) > 0.5) la distribucin es Leptocrtica. (Los datos tienen poca dispersin) < - 0.5) la distribucin es Platicrtica. (Los datos estn muy dispersos)

( (

Cuando la distribucin de los datos tiene con un coeficiente de asimetra ( = 0.5) y un coeficiente de Curtosis de ( = 0.5), se le denomina Distribucin Normal. Esta es de la mayor importancia en estadstica, ya que para la mayora de los procedimientos de la estadstica inferencial se requiere que los datos se distribuyan normalmente. La ventaja principal de la distribucin normal radica en el supuesto que el 95% de los datos se encuentra dentro de una distancia de dos desviaciones estndar, , desde la media aritmtica (Fig.1.4); y que el 68% de los datos se alejan de la media cuando mucho en una desviacin estndar, , es decir,

16

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Figura 1-4 La Distribucin normal es simtrica

PRACTICAS PARA DATOS NO AGRUPADOS.


1.1 Recopilar un conjunto de ms de 40 datos y calcular: a) la media aritmtica, b) media geomtrica, c) moda, d) mediana, e) desviacin media absoluta, f) varianza, g) desviacin estndar, h) cuartiles 1 y 3, e i) percentiles 10 y 80. Brenda Torres, fue la presidenta del comit organizador de la biblioteca municipal durante diez aos, de 2001 a 2010. Afirma que durante la ocupacin del cargo administr el presupuesto para el mantenimiento de la biblioteca ambulante del municipio mejor que su antecesora. A continuacin presentamos los datos relativos al gasto de la biblioteca ambulante durante quince aos: Ao 2010 2009 2008 2007 2006 Presupuesto $30,000 28,000 25,000 27,000 26,000 Ao 2005 2004 2003 2002 2001 Presupuesto $24,000 19,000 21,000 22,000 24,000 Ao 2000 1999 1998 1997 1996 Presupuesto $30,000 20,000 15,000 10,000 9,000

1.2

a) Calcule el presupuesto promedio anual para los ltimos cinco aos (2006-2010). b) Calcule el presupuesto promedio anual para los primeros cinco aos de la gestin de la seora Torres (2001-2005). c) Calcule el presupuesto promedio anual para los 5 aos de su antecesora (19962000) d) Basndose en los resultados que obtuvo en los incisos a), b) y c), podra usted concluir que ha habido una tendencia a aumentar o a disminuir en el presupuesto quinquenal? e) se ahorraron los fondos del municipio durante la administracin de la seora Torres? 1.3. La Compaa Llantas del Pacfico tiene fondos de reserva en valores negociables a corto plazo. El saldo diario de cierre (en millones de dlares) de la cuenta de valores negociables en un lapso de dos semanas es el que mostramos a continuacin: Pgina 17

Jaime Hernndez Mata

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Semana 1 Semana 2

$ 1,973 1,969

$ 1,970 1,892

$ 1,972 1,893

$ 1,975 1,887

$ 1,976 1,895

Cul fue la cantidad promedio invertida en valores negociables durante a) La primera semana? b) La segunda semana? c) El periodo de dos semanas? d) Un saldo promedio en las dos semanas mayor a 1.970 millones de dlares obtendra tasas de rendimiento ms altas. La cuenta recibir mayores intereses? e) Si la respuesta al inciso d) es negativa, cunto debera ascender la cantidad invertida el ltimo da para que la cuenta reciba la tasa de rendimientos ms alta? f) Si la respuesta al inciso d) fue positiva, cunto puede retirar el tesorero de la compaa del fondo de reserva el ltimo da y todava seguir recibiendo la tasa de inters ms alta? 1.4. Mara Prez recorre la parte Occidente de Mxico como representante de ventas del editor de un libro de texto. Recibe una comisin proporcional al volumen de las ventas que haga. Sus ganancias trimestrales durante los ltimos tres aos son las siguientes: 1 er. trimestre $10,000 20,000 30,000 2do. trimestre $ 5,000 10,000 15,000 3er. trimestre $25,000 20,000 45,000 4to. trimestre $15,00 0 10,000 50,000

Ao 1 Ao 2 Ao 3 a) b) c)

Calcule por separado las ganancias promedio de la representante en cada uno de los cuatro trimestres. Calcule por separado las ganancias trimestrales promedio en cada uno de los tres aos. Muestre que la media de las cuatro cantidades que obtuvo en el inciso a) es igual a la media de las tres cantidades que obtuvo en el inciso b). Adems, muestre que estas dos cantidades son iguales a la media de los 12 nmeros que se presentan en la tabla. (sta es la ganancia promedio trimestral que obtuvo la seorita Prez durante un periodo de tres aos.)

1.5.- En la redaccin de un diario, el tiempo requerido para formar la primera pgina completa fue registrado durante 50 das. Los datos, redondeados a la dcima de minuto ms cercana, se dan a continuacin: 19.8 22.8 21.9 22.0 20.7 20.9 25.0 22.2 22.8 20.1 25.3 20.7 22.5 21.2 23.8 23.3 20.9 22.9 23.5 19.5 23.7 20.3 23.6 19.0 25.1 25.0 19.5 24.1 24.2 21.8 21.3 21.5 23.1 19.9 24.2 24.1 20.8 23.9 22.8 23.9 19.7 24.2 23.8 20.7 23.8 24.3 21.1 20.9 21.6 22.7 Para los datos no agrupados de la tabla dada, obtenga: a) La media, mediana, moda, b) El rango, la varianza y desviacin estndar del tiempo para formar la pgina. c) El percentil 85, el decil 4 y el cuartil 1, y de la interpretacin correspondiente. d) Construya el diagrama de dispersin y anote comentarios. 1.6. Eduardo Lpez, superintendente minero de PC, tiene registro del tiempo muerto, en 18

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

minutos, por turno, en su Seccin de Trabajo, al hacer trabajos in situ de ajustes y reparaciones a su maquinaria. A continuacin se presentan los datos correspondientes a los ltimos 40 turnos de trabajo: 72 66 121 116 99 126 101 93 114 139 110 75 87 107 108 91 93 119 113 128 115 129 111 119 84 60 80 113 102 110 36 112 120 105 80 97 96 100 50 99

Para los datos no agrupados de la tabla dada, obtenga: a) b) c) d) La media, la mediana, y la moda, El rango, la varianza y la desviacin estndar de los tiempos muertos. El percentil 35, el decil 6 y el cuartil 3, y anote su interpretacin, Construya el diagrama de dispersin y anote comentarios.

1.7 Cconsidere los datos de la tabla de abajo, los cuales representan la resistencia a la tensin, en lb/pul2 (psi), de 80 muestras de una nueva aleacin de aluminio y litio, que est siendo evaluada como posible material para la fabricacin de elementos estructurales de aeronaves. Los datos fueron registrados conforme se realizaba la prueba. Resistencia a la tensin de 80 muestras de aleacin de aluminio-litio 105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141 245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133 207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146 218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158 160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149 Para los datos no agrupados de la tabla dada, obtenga: a) b) c) d) e) La media, mediana, moda. El rango, la varianza y desviacin estndar de la resistencia. El percentil 5, el decil 6 y el cuartil 3, y anote su interpretacin, El diagrama de dispersin La tabla de frecuencias de 8 categoras iguales.

Jaime Hernndez Mata

Pgina 19

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

1.2

DATOS AGRUPADOS

Cuando el nmero de datos recolectados en una muestra es grande es conveniente organizarlos y sintetizarlos, construyendo una tabla que enliste los datos, xi, (en forma individual o por grupos) junto con sus frecuencias correspondientes, fi. Esta tabla es llamada Distribucin de Frecuencias. Existe software que puede realizar esta tabla, adems de sus estadsticos y grficos correspondientes. Enseguida se muestra el procedimiento bsico para obtener de forma manual la distribucin de frecuencias, el clculo de sus estadsticos y sus grficos.

1.2.1 TABLA DE DISTRIBUCIN DE FRECUENCIAS


Esta tabla consta de solo 2 columnas. En la primera columna se anota la clase, Xi, y en la segunda columna la frecuencia correspondiente, fi, como se muestra en la tabla 1.1, donde se resume el ingreso mensual, de 200 trabajadores de las microempresas de la ciudad, muestreados aleatoriamente
(1) Ingreso mensual por trabajador, en pesos.
Xi (Clase)

(2) Nmero de trabajadores fi


(Frecuencia)

$ 1800-1999 12 $ 2000-2199 24 $ 2200-2399 36 $ 2400-2599 50 $ 2600-2799 34 $ 2800-2999 28 $ 3000-3199 16 Total 200 Tabla 1.1: Distribucin de frecuencias de los salarios de 200 trabajadores en las microempresas de la ciudad.

Los trminos usados en las distribuciones de frecuencias, son: Clase, Xi: es un valor o un intervalo de valores de la variable X. En la tabla 1.1 aparecen
7 clases, todas del mismo tamao, $2000, y son las de la primera columna, la (1).

Frecuencia, fi: es el nmero de casos (conteo) que se presentan en la i-sima clase. En la tabla 1.1 aparecen las frecuencias fi en la segunda columna, la (2). Lmites de clase inferiores, LI, son los valores menores de cada clase. En la tabla 1.1 los LCI son: 1800, 2000, 2200, 2400, 2600,2800, y 3000.

20

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Lmites de clase superiores, LS, son los valores mayores de cada clase. En la tabla 1.1 los LS son: 1999, 2199, 2399, 2599, 2799, 2999, y 3199. Fronteras de clase, F, (o Lmites reales, LR) son los valores usados para separar dos clases contiguas. Para obtener las Fronteras de Clase: 1) Al lmite de clase inferior de la clase i-sima, LIi, restarle el lmite de la clase superior de la categora inmediata anterior, LSi-1, y dividir entre dos, es decir: ec 1.24 2) Para obtener la Frontera inferior de la clase i: El valor aj obtenido por la frmula 1.24, en 1) se resta al lmite inferior de esa clase, y 3) Para obtener la frontera superior de la clase i se suma el valor aj al lmite superior de la clase. Ejemplo 1.16.- Para la segunda clase de la tabla 1.1, las fronteras de clase son: 1)
= 0.5

2) La frontera inferior de la clase 2 es 3) La frontera superior de la clase 2 es

Nota: la frontera de clase superior de una clase (i) es exactamente la misma que la frontera de clase inferior de la clase siguiente (i+1), ya que es el mismo valor que separa a dos clases contiguas.

Ancho de clase ci (o amplitud, o tamao de la clase): es la diferencia entre las dos fronteras de una clase, o tambin es la diferencia entre los dos lmites de clase inferiores contiguos, o los dos lmites de clase superiores contiguos. ec 1.25 ec 1.26 Marcas de clase, , son los puntos medios de cada clase. La ma rca d e cla se , , e s e l va lo r qu e re p re se nt a a t o do e l int e rva lo de la cla se p a ra el c lcu lo de a lgu n os p a rm e t ro s, e n vi rt u d d e que lo s d a t o s o rigin a le s n o ap a re ce n e n la t a b la d e d ist rib u ci n de f re cu e n cia s.

1 . 2 .1 . 1 CO NS TRUCCI N DE UN A DI S TRI BUCI N DE FRE C UE NCI AS . P a ra su co n st ru cci n ma nu a l e s co n ve n ie nt e o rde n a r p rim e ro lo s da t os p o r ma gn it u d , d e l m e no r a l m a yo r. E l p ro ce d im ie nt o e s:

Jaime Hernndez Mata

Pgina 21

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

1 . De cid a e l n mero d e cla se s, k, qu e d e sea te n e r. E s re co me n da b le un n me ro e nt e ro k en t re 5 y 2 0 . Ta mbi n p u ed e u sa rse la re gla d e S t u rge s , p rop u e sta p o r Herbert Sturges en 1926: K= 1 + ln(n) ec. 1.27

Donde k es el nmero de clases, redondearlo al entero ms cercano, y, n es el tamao de la muestra 2 . Ca lcu le e l ta ma o (a n ch u ra ) d e la clase , c: e c . 1 . 28 De t e rm ine c red on d ea n do a u n nm e ro a de cu ad o ma yo r qu e se a f cil d e e n t e nd e r y m a n e ja r, a n cu a nd o se mo d if iqu e e l ra n go . 3 . E st a b le zca co mo p u n to de p a rt id a p a ra e l lm it e inf erio r d e la p rim e ra cla se e l x m i n u o t ro n m e ro a d e cu a do me n o r. 4 . Usa n d o como p u nt o d e pa rt id a e l lm it e in f e rio r d e la p rim e ra cla se , sum a rle la a n chu ra d e la clase , c, un a y o t ra ve z, p a ra o b t en e r t od o s lo s lm it e s inf e rio re s de ca da cla se , a no t n do lo s a la izqu ie rd a d e la p rim e ra co lum na de la t a b la de d ist rib u ci n de f re cu e n cia s. 5 . A n o te lo s lm it e s su p e rio re s d e ca da cla se a la d e rech a , e n la p rim e ra co lu mn a . E st o s pu ed e n o bt en e rse f cilm en t e . 6 . Ha ce r e l co n te o d e lo s da t o s qu e co rre sp o nd e n a ca d a cla se , p a ra a s ob t en e r la s f re cue n cia s f i . 7 . A n o te lo s e n ca b eza d o s d e ca da u na d e la s d o s co lum n a s y e l p ie d e la ta b la. E l re su lt a do e s la t a b la d e Dist rib u ci n d e f re cu e n cia s, (seme ja n te a la t ab la 1.1 ). E J E MP LO 1 . 17 . - A c o n t i n u a c i n s e p r e s e n t a n l a s e d a d e s d e 5 0
p r of e s or e s d e l I n s t i t u t o T ec n o l g i c o de C o l i m a . S e d e s e a a g r u par e s t o s d at o s e n u n a t a b l a d e D i s t r i b u c i n d e Fr e c u e n c i a s . Edades de 51 33 40 60 44 53 28 56 43 55 5 0 p r of es o r e s d e l 56 62 35 38 56 45 52 38 45 31 46 44 28 61 43 ITC 28 48 49 55 39

46 40 36 72 32

37 42 42 26 48

55 40 74 30 31

39 44 42 35 48

Solucin: E n p r i m e r t r m i n o l o s o r d e n a m os p o r m ag n i t u d , r e s u l t a d o q u e a p ar e ce e n l a s ig u i e n t e t a b l a : 22

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

26 35 42 46 55

28 36 42 46 55

E d a d e s d e 5 0 p r of es o r e s d e l I T C 28 28 30 31 31 32 37 38 38 39 39 40 42 43 43 44 44 44 48 48 48 49 51 52 56 56 56 60 61 62

33 40 45 53 72

35 40 45 55 74

Ah o r a a p l i c a m o s es p r o c e d i m i e nt o d ad o : 1 . D e c i d i r e l n m er o de c l a s e s , k , p o r l a r e g l a d e S t ur g e s : K= 1 + ln(n) = 1+ ln(50) = 4.91 k=5

2 . C a l c u l e e l t a m a o ( a n c h u r a ) d e l a c l a s e , c: c=10 3 . E s c o g em o s c o m o pu n t o d e p a r t i d a L I 1 = 2 6. ( N t e s e q u e t a m b i n p u d o e s c og e r s e un L I 1 = 2 5) . 4 . P a r a o b t e n er t o d o s l o s l m i t e s i nf e r i o r e s d e c a d a c l a s e su m a r l e la a n c h u r a d e l a c l a se , c = 1 0 , u n a y o t r a ve z, , a n o t nd o l o s a l a i zq u i e r d a d e l a p r i m e r a c o l u m n a d e l a t a b l a d e d i s t r i b u c i n d e f r e c u e n c i a s, q u e d a nd o : Clase 26 36 46 56 66 frecuencia

5 . A n o t e l o s l m i t e s s u p e r i o r e s d e c a d a c l a s e a l a d e r e c h a , e n l a p r i m e r a c o l u m n a. Es t o s p u e d e n o bt e n er s e f c i l m e n t e. Clase 26 - 35 36 45 46 55 56 65 66 - 75 6. frecuencia

H a c e r e l c o n t e o d e l o s d a t o s q u e c o r r e s p o n d e n a c a d a c la s e , p ar a a s o b t e n e r l a s f r e c u e n c i a s f i . D e l o s d a t o s o r d e n a d os p u e d e h a c e r s e f c i l m e nt e e l c o n t e o : 26 35 42 28 36 42 E d a d e s d e 5 0 p r of es o r e s d e l I T C 28 28 30 31 31 32 37 38 38 39 39 40 42 43 43 44 44 44 33 40 45 35 40 45 Pgina 23

Jaime Hernndez Mata

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

46 55

46 55

48 56

48 56 Clase 26 - 35 36 45 46 55 56 65 66 - 75

48 56

49 60

51 61

52 62

53 72

55 74

frecuencia 11 19 12 6 2

7.

A n o t a m o s l o s e n c ab e za d o s d e c a d a un a d e l a s d o s c o l um n a s y e l p i e d e l a t a b l a . E l r e s u l t a d o e s l a t a b l a d e D i s t r i bu c i n d e f r e c u e n c i a s. E d a d d e p r of e s or e s del ITC, Xi 26 - 35 36 45 46 55 56 65 66 - 75 T ot a l N m e r o de p r of e s or e s , f i 11 19 12 6 2 50

T a b l a 1. 2 D i s t r i b u c i n d e f r e c u e nc i a s de l a s e d a d e s d e 5 0 pr of e s o r e s d e l I T C .

Una vez agrupados los datos, se pierde la identidad de cada una de las observaciones del conjunto original. Para ofrecer medidas descriptivas de los datos se salva este inconveniente determinando un representante por clase, que no es ms que el punto medio, , el cual aparece con una frecuencia de fi veces. 1 . 2 .1 . 2 . DISTRIBUCIN DE FRECUENCIAS RELATIVAS La anterior Distribucin de frecuencias tiene una variante importante que es la distribucin de frecuencias relativas. En esta la frecuencia de cada clase se sustituye por la frecuencia relativa, fri, de cada clase, obtenida al dividir la frecuencia fi entre el total de datos, n, es decir: ec. 1.29 La distribucin de frecuencias relativas tambin est formada por solo 2 columnas, en la cual la segunda columna es de las de frecuencias relativas Estas frecuencias relativas, fri, se pueden expresar como cociente, como nmero decimal o como porcentaje, y la suma de ellas es 1 o 100%-.Enseguida aparece la distribucin de frecuencias relativas del ejemplo de las edades de 50 profesores, en sus 3 versiones:
24

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Edad de p rof e so re s d e l IT C, Xi 2 6 - 35 36 45 46 55 56 65 6 6 - 75 T ot a l

Fre cu e n cia re la t iva d e p rof e so re s, fi 1 1 / 50 1 9 / 50 1 2 / 50 6/50 2/50 5 0 / 50

Edad de p rof e so re s d e l IT C, Xi 2 6 - 35 36 45 46 55 56 65 6 6 - 75 T ot a l

Fre cu e n cia re la t iva d e p rof e so re s, fi 0.22 0.38 0.24 0.12 0.04 1.00

T a b l a 1. 3 a . - D i s t r i bu c i n d e f r e c u e n c i a s r e l a t i va s , c om o numero racional.

T a b l a 1. 3 b . - D i s t r i bu c i n d e f r e c u e n c i a s r e l a t i va s , c o m o n m er o d e c im a l

E d a d d e l p rof e so r d e l IT C, (a o s) Xi 2 6 - 35 36 45 46 55 56 65 6 6 - 75 T ot a l

P o rce n ta je de p rof e so re s pi 22% 38% 24% 12% 4% 100%

T a b l a 1. 3 c . - D i st r i bu c i n d e f r e c u e n c i as r e l a t i v a s , c om o p or ce n t a j e , d e l a s e d a d e s d e 5 0 p r of es o r e s d e l I T C . .

1 . 2 .1 . 3 . O J I V A O DISTRIBUCIN DE FRECUENCIAS ACUMULADAS DEL TIPO MENOR QUE.

Es otra variante de la Distribucin de Frecuencias. En sta la frecuencia acumulada de una clase i, Fi, es la suma de las frecuencias previas ms la de la clase i. ec. 1.30 Y en la primera columna desaparecen los lmites superiores, siendo sustituidos por la expresin menor que o por el smbolo <, como se ve enseguida, donde la tabla 1.2 sirve de base para elaborar la tabla 1.4:

Jaime Hernndez Mata

Pgina 25

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Edad de p rof e so re s d e l IT C, X i 2 6 - 35 36 45 46 55 56 65 6 6 - 75 T ot a l

N m e ro d e p rof e so re s, fi 11 19 12 6 2 50

Edad de p rof e so re s d e l IT C, X i < 26 < 36 < 46 < 56 < 66 < 76

N m e ro d e p rof e so re s, 0 11 30 42 48 50

Tabla 1.2 (repetida) D i s t r i b u c i n d e f r e cu e n c i a s de las edades de 50 p r of e s or e s d e l I T C

T a b l a 1 . 4. D i s t r i b u ci n d e frecuencias a c um u l a d a s de las edades de 50 p r of e s or e s d e l I T C .

1 . 2 .1 . 4 . DISTRIBUCIN DE FRECUENCIAS RELATIVAS ACUMULADAS DEL TIPO MENOR QUE.

Es semejante a la distribucin de frecuencias acumuladas expresada ahora la segunda columna como frecuencia relativa acumulada ( ). Esta es relativa al total de datos de la muestra. Convirtiendo la tabla 1.4 de frecuencias absolutas acumuladas a frecuencias relativas acumuladas, expresadas como cociente, queda la siguiente tabla 1.5, o expresada en decimales queda la tabla 1.6:

Edad del p r of e s or d e l ITC, Xi

Frecuencia r e l a t i va acumulada de p r of e s or e s ,

Edad del p r of e s or d e l ITC, Xi

Frecuencia r e l a t i va acumulada de p r of e s or e s ,

< 26 0/50 < 36 11/50 < 46 30/50 < 56 42/50 < 66 48/50 < 76 50/50 T a b l a 1. 5 D i s t r i b u c i n d e f r e c u e n c i a s r e l a t i va s a c um u l a d a s d e l a s e d a d e s d e 5 0 p r of e s o r e s de ITC

< 26 0.00 < 36 0.22 < 46 0.60 < 56 0.84 < 66 0.96 < 76 1.00 T a b l a 1. 6 D i s t r i b u c i n d e f r e c u e n c i a s r e l a t i va s acumuladas de las edades de 5 0 p r of e s o r e s d e I T C

1.2.2. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIN


INSTITUTO TECNOLGICO DE COLIMA

26

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Cuando no contamos con los datos originales debido a que aparecen agrupados (o en una grfica, tal como un histograma), es posible obtener los valores estadsticos aproximados que nos permitirn tener una mejor idea de las medidas estadsticas de esa muestra. A continuacin se presentan frmulas para calcular aproximadamente estos estadsticos para las medidas de tendencia central y de posicin. 1.2.2.1 MEDIDAS DE TENDENCIA CENTRAL. 1.2.2.1.1 LA MEDIA, : Para encontrar la media aritmtica de una distribucin de frecuencias o de un histograma utilizaremos la siguiente frmula: EC. 1.31
Donde: es la frecuencia de la clase i es la marca de clase de la clase i. n= es el numero de datos de la muestra.

1.2.2.1.2 LA MEDIANA,

Para encontrar la mediana aplicamos un procedimiento de 2 pasos: 1er paso.- De las k clases, identificamos la clase mediana (que es la que contiene a la mediana), que es aquel valor que est en la posicin pos = . 2 paso. Aplicar la siguiente frmula a la clase mediana EC. 1.32 Donde:.n es la frontera inferior de la clase mediana es el nmero total de datos en la muestra es la suma de todas las frecuencias anteriores a la clase mediana es la frecuencia de la clase mediana, y es el tamao de la clase mediana.

1.2.2.1.3 LA MODA,

Para encontrar la moda de una distribucin de frecuencias o de un histograma aplicaremos la siguiente frmula a la clase con mayor frecuencia, que identificaremos como la clase modal.:
Jaime Hernndez Mata Pgina 27

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

EC. 1.33

Donde:.c

es la frontera inferior de la clase modal = = es el tamao de la clase modal.

1.2.2.2 MEDIDAS DE POSICIN (o CUANTILES). Las distintas medidas de posicin pueden ser encontradas todas a partir de los percentiles, recordando tambin que la mediana es el percentil 50 y que, por lo tanto, la formula de la mediana puede ser usada para determinar cualquier percentil, del 1 al 99. As, adaptamos la frmula 1.32 al percentil j-simo. 1.2.2.2.1 PERCENTIL, Para encontrar el percentil j-simo usaremos un procedimiento de 2 pasos: 1er paso.- De las k clases, identificamos la clase que contiene al percentil j, que es aquel valor que est en la posicin dada por: . 2 paso. Aplicar la siguiente frmula a la clase del percentil j: EC. 1.35 Donde:.n es la frontera inferior de la clase del percentil j es el nmero total de datos en la muestra es la suma de todas las frecuencias anteriores a la clase del percentil j es la frecuencia de la clase del percentil j. es el tamao de la clase del percentil j

EC. 1.34

la expresin 1.35 puede modificarse para el proceso inverso de obtener el porcentaje de datos, j, que tiene un determinado valor . o menor que ( recuerde que el percentil .= .= x).
28

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

EC. 1.36

1.2.2.2.2 DECILES, D, Y CUARTILES, Q. Los deciles y los cuartiles pueden obtenerse todos por la formula 1.35 de los percentiles, considerando que: Los 9 deciles son: D1 =P10, D2 = P20, , y D9=P90. Y, los 3 cuartiles son: Q1 =P25, Q2 = P50, y Q3=P25.

1.2.3. MEDIDAS DE DISPERSIN


A continuacin se dan las formulas para determinar las medidas de dispersin para el caso de datos agrupados en una distribucin de frecuencias o en un histograma. 1.2.3.1. LA DESVIACIN ESTNDAR, S. En el caso de datos agrupados la desviacin estndar se define por:

EC. 1.37 Donde:


n es la frecuencia de la clase j es el nmero total de datos en la muestra es la marca de clase de la clase j es la media general de los datos. es el nmero de clases.

Cuando el nmero de datos es grande (n 30) puede usarse la ec 1.38:

EC. 1.38 Pero cuando el nmero de datos n tiende a ser grande (n ), el valor S dado por ambas formulas es prcticamente el mismo Para efectos de clculos ms fciles se tiene la siguiente frmula:

Jaime Hernndez Mata

Pgina 29

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

EC. 1.39

1.2.4 MEDIDAS DE ASIMETRA Y CURTOSIS.


Se remite al lector a la seccin 1.1.5, donde se presentaron los conceptos y las ecuaciones generales 1.22 para sesgo (asimetra) y 1.23 para curtosis. Sin embargo, en el ejemplo 1.18 a continuacin, se muestra en los dos ltimos incisos el clculo de los coeficientes de asimetra y curtosis para el caso de datos agrupados.. EJEMPLO 1.18.- Calculo de estadsticos para datos agrupados.
Para los datos de los ingresos de trabajadores, dados en la tabla 1.1, y repetida a continuacin, determine:
(1) (Clase) (2) (Frecuencia)

Ingreso mensual por trabajador, en pesos. Xi $ 1800-1999 $ 2000-2199 $ 2200-2399 $ 2400-2599 $ 2600-2799 $ 2800-2999 $ 3000-3199 Total

Nmero de trabajadores fi 12 24 36 50 34 28 16 200

Tabla 1.1 (repetida): Distribucin de frecuencias de los salarios de 200 trabajadores en las microempresas de la ciudad.

a) b) c) d) e) f) g) h) i)

El salario promedio La desviacin estndar de los salarios El salario moda La mediana El salario que gana el 65% de los trabajadores que ganan menos. El salario que gana el 20% de los que ganan ms El porcentaje de los trabajadores que gana cuando mucho $2,300. El tipo de asimetra El tipo de apuntalamiento o concentracin de los datos.

SOLUCIN

30

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Para calcular los estadsticos pedidos es conveniente utilizar una tabla para mostrar los clculos:
(1) (2) (Clase) (Frecuencia ) Ingreso mensual por trabajador, Nmero de en pesos. trabajadores Xi fi $ 1800-1999 $ 2000-2199 $ 2200-2399 $ 2400-2599 $ 2600-2799 $ 2800-2999 $ 3000-3199 total 12 24 36 50 34 28 16 200 (3) Marca de clase (4) Producto columnas (2)*(3)= (5) Producto columnas 2 (2)*(3) (6) Frecuencia acumulada

F
1899.5 2099.5 2299.5 2499.5 2699.5 2899.5 3099.5

22794 50388 82782 124975 91783 81186 49592 503500

43,297,203.0 105,789,606.0 190,357,209.0 312,375,012.5 247,768,208.5 235,398,807.0 153,710,404.0 1,288,696,450.0

12 36 72 122 156 184 200

a) Para el salario promedio usaremos la frmula 1.31, donde el numerador es el total de la columna (4) y el denominador, n, es el total de la columna (2): $ 2,517.50 b) Para calcular la desviacin estndar de los salarios de la muestra usaremos la expresin 1.39, donde del numerador el primer trmino es el total de la columna (5) y el segundo termino es el total de la columna (4), y n es el total de los datos:

= $ 325.89
c) Para determinar el salario ms frecuente aplicaremos la formula 1.33 a la clase con mayor frecuencia, que es la cuarta clase, donde la frontera inferior, F1 es igual a 2,399.5, = = 50-36 =14 = = 50 34 = 16, c = 200, es el tamao de la clase modal.

= 2399.5

= $ 2, 492.83

d) Para encontrar la mediana, es decir, el valor que divide a los salarios en dos partes
iguales (cuando estn ordenados por magnitud), usaremos la frmula 1.32, pero primero (paso 1) identificamos la clase mediana, que es la que contiene a dato en la posicin pos = .= = 100.5. En la columna (6) de la tabla vemos que el dato en la posicin 100.5 pertenece a la cuarta clase, ya que esta contiene desde el dato 73 avo al 122 avo. Enseguida (2 paso) aplicamos la frmula 1.32 a esta clase mediana, donde = 72 es la Jaime Hernndez Mata Pgina 31

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

suma de las frecuencias anteriores a la clase mediana, como puede verse tambin en la misma columna 6.

= $ 2,513.50

e) El salario que gana el 65% de los trabajadores que ganan menos, es el percentil 65, y su clculo, al igual que la mediana, es en dos pasos: 1) por la formula 1.34 calculamos la posicin donde se encuentra el valor P65: pos =

= 130.65

En la columna (6) de la tabla vemos que el dato que ocupa la posicin 130.65 (el P65) est en la 5 clase, ya que sta contiene los datos desde el 123 avo al 156 avo, por ello, ahora (2 paso) aplicamos la formula 1.35 a la 5 clase:

=
f)

= $ 2,650.38

El salario que gana el 20% de los que ganan ms es el complemento del 80 % de los que menos ganan, es decir, el complemento del P 80. Paso 1) identificamos la clase del P80 con pos = =201 = 160.8, que puede verse en la columna (6) de la tabla que es la 6 categora la del P80, ya que esta contiene desde el 157
avo al 184 avo datos paso 2) aplicamos la formula 1.35 a la 6 clase

=
Ahora, el 20% de los que ganan mas es P80 = $ 2,833.79.

= $ 2,833.79

g) El porcentaje de los trabajadores que gana cuando mucho $2,300 se calcula por la frmula 1.36 usando un proceso inverso Paso 1 ) Identificar la clase: El valor 2300 se encuentra en la 3 clase. Paso 2) se aplica la frmula 1.36: a la 3 clase

=
El 26.91% de los trabajadores gana $2,300 o menos.

= 26.91 %

h) El tipo de asimetra se determina con el coeficiente de asimetra de Fisher, ecuacin 1.22, cuyos clculos previos aparecen en la siguiente tabla:

(1)

(2)

(3)

(4)

(5)

(6)

(7)

32

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Ingreso Nmero de mensual por trabajadores trabajador, en fi pesos. Xi (Frecuencia) (Clase) $ 1800-1999 12 $ 2000-2199 24 $ 2200-2399 36 $ 2400-2599 50 $ 2600-2799 34 $ 2800-2999 28 $ 3000-3199 16 total 200

Marca de clase

Diferencia columna (3)2517.50

Producto columnas 2 (4) * (2)

Producto columnas 3 (4) * (2)

Producto columnas 4 (4) * (2)

1899.5 2099.5 2299.5 2499.5 2699.5 2899.5 3099.5

-618 -418 -218 -18 182 382 582

4,583,088 -2,832,348,384 4,193,376 -1,752,831,168 1,710,864 -372,968,352 16,200 -291,600 1,126,216 204,971,312 4,085,872 1,560,803,104 5,419,584 3,154,197,888 21,135,200 -38,467,200

1.75039E+12 7.32683E+11 81307100736 5248800 37304778784 5.96227E+11 1.83574E+12 5.03366E+12

En la siguiente formula la sumatoria la columna (6), y la sumatoria el total de la columna (5):

del numerador es el total de que aparece en el denominador es

= - 0.0056

Como = 0.0056 est en (-0.50 . 0.50) la distribucin de los salarios de los trabajadores es simtrica y no tiene sesgo.

i)

El tipo de apuntalamiento o concentracin de los datos, se determina calculando el coeficiente de curtosis, ,por la ecuacin 1.23: En la tabla anterior se calcul la sumatoria en la columna (7) y la sumatoria es el total de la columna (5):

-3 =

-3 = 2.25 3 = -0.75

Como g2 = -0.75 se cumple que ( < - 0.5) por lo que la distribucin de los salarios es Platicrtica, es decir que los datos estn muy dispersos.

1.3

REPRESENTACIONES GRFICAS.
Pgina 33

Jaime Hernndez Mata

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Gran parte de la utilidad que tiene la Estadstica Descriptiva es la de proporcionar un medio para informar con base en los datos recolectados. La eficacia con que se pueda realizar tal proceso de informacin depender de la presentacin de los datos, siendo la forma grfica uno de los ms rpidos y eficientes. Existen tambin varios tipos de representaciones grficas, utilizndose cada uno de ellos de acuerdo al tipo de informacin que se est usando y los objetivos que se persiguen al presentar la informacin. Estas pueden realizarse fcil y rpidamente con el uso de distintos softwares estadsticos. A continuacin se presentan algunas de las representaciones grficas ms usuales.

1.3.1 DIAGRAMA DE DISPERSIN.


Un diagrama de dispersin es una representacin grfica de la relacin entre dos variables, X e Y, muy utilizada en la identificacin de un modelo matemtico Y = f(X). Siempre es ms fcil ver la relacin entre X e Y en un diagrama de dispersin que en una simple tabla de nmeros. El anlisis de un diagrama de dispersin consta de un proceso de cuatro pasos: 1) se elabora una teora razonable acerca de cmo Y es afectado por X, 2) se obtienen los pares de valores y se dibuja el diagrama, 3) se identifica la pauta de correlacin, y 4) se estudian las posibles explicaciones Para elaborar un Diagrama de Dispersin: 1. Obtener tabla de pares de valores X, Y, 2. Dibujar los ejes coordenados X,Y, 3. Situar la causa sospechada, X, en el eje horizontal, 4. Situar el efecto posible, Y, en el eje vertical, 5. Graficar los puntos (x,y) 6. Rotular los ejes horizontales y verticales. 7. Poner ttulo al diagrama. Las pautas de correlacin ms comunes son: correlacin fuerte positiva (Y aumenta claramente cuando X aumenta), correlacin fuerte negativa (Y disminuye claramente cuando X aumenta), correlacin dbil positiva (Y aumenta algo cuando X aumenta),), correlacin dbil negativa (Y disminuye algo cuando X aumenta), correlacin compleja (Y parece relacionarse con X pero no de un modo lineal), y correlacin nula (no hay relacin entre X e Y).

34

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Figura 1.5: Diagrama de Dispersin para tres tipos de correlacin.

EJEMPLO 1.19.- Grafica de dispersin.


El gerente de una fbrica de cerveza quiere verificar si hay una relacin directa entre el dinero que invierte en publicidad en televisin y sus ventas totales, por lo que dispone de tales datos de enero a julio de este ao. Mes Enero Febrero Marzo Abril Mayo Junio Julio Inversin (en pesos) 12,000 21,600 8,400 16,800 27,600 18,000 19,200 Ventas (en pesos) 1,200,000 2,040,000 660,000 2,160,000 2,220,000 2,280,000 2,280,000

Solucin: Para ver si hay una posible relacin entre las ventas (Y) y la inversin en publicidad (X), hacemos el siguiente diagrama de dispersin:

Grfico de Ventas por inversion en publicidad

Ventas en pesos

(X 100000) 24 21 18 15 12 9 6 8 12 16 20 24 28 (X 1000)

Inversin en pesos

Figura 1.6: Diagrama de dispersin para las ventas de cerveza en relacin a la inversin en publicidad.

Jaime Hernndez Mata

Pgina 35

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Respuesta: De acuerdo al diagrama de dispersin de la figura 1.6, se aprecia que s existe una correlacin positiva y podemos pensar que las ventas mensuales de cerveza, Y, s estn relacionadas por la inversin en publicidad en televisin, X.

1.3.2 DIAGRAMA DE TALLO Y HOJAS.


El diagrama de tronco y hojas es una representacin grfica de una sola variable, X, para iniciar el anlisis exploratorio de los datos, que nos proporciona informacin visual rpida. Este diagrama se basa en la ordenacin de los datos a manera de grfico, pero sin llegar a serlo, utilizando las decenas y las unidades. La tcnica para elaborar el diagrama de tallo y hojas se muestra a travs del siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de probabilidad:
66 76 83 100 71 76 100 81 86 83 83 84 88 91 74 70 97 77 92 86 68 65

Ahora, en cada uno de los datos separamos las decenas de las unidades, es decir, el nmero 66 se ver como 6 | 6. De esta manera las decenas se pondrn en una primera columna, en forma vertical, con sus unidades a su derecha, quedando as el diagrama de tallo y hojas:
6 7 8 9 10 6 1 3 7 0 8 4 6 2 0 5 6 6 0 7 3 8 1 3 4 6 1

Para entenderle un poco ms, hemos de decir que el primer rengln que dice 6 | 6 8 5 quiere decir que entre la lista de datos se encuentran los valores 66, 68 y 65. Adems, si se desean tener los datos ordenados, y hay gente que lo prefiere as, se pueden ordenar las hojas en cada rengln para que la representacin quede como sigue:
6 7 8 9 10 5 0 1 1 0 6 1 3 2 0 8 4 6 6 7 3 3 4 6 6 8 7

El diagrama de tronco y hojas presenta la misma informacin que la lista original de datos, pero de una manera mucho ms compacta y manejable.
36

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Sin embargo, informacin ms compleja resulta un poco ms difcil de manejar, por lo que en ocasiones conviene redondear los datos, ignorar sus partes decimales o utilizar las centenas u otras posiciones de los nmeros para las troncos. En cada uno de esos casos conviene hacer alguna anotacin, o poner una nota, a fin que los lectores puedan identificar las adecuaciones realizadas y as poder interpretar lo que se quiere transmitir. Para mostrar la informacin de manera ms clara, es posible modificar el nmero de posiciones del tronco, aumentndola o disminuyndola de acuerdo a las necesidades particulares de cada problema. Por ejemplo, con los datos de las calificaciones anteriores, se pueden dividir en dos cada posicin del tronco, utilizando la primera posicin para disponer las hojas 0, 1, 2, 3 y 4, y la segunda posicin para las hojas restantes. De esta manera, se obtiene la representacin grfica de doble tronco:
6 7 7 8 8 9 9 10 5 0 6 6 1 1 7 0 6 1 6 6 3 2 0 8 4 7 8 3 3 4

Con esto se han duplicado el nmero de posiciones del tronco, con la intencin de buscar una mayor claridad en la presentacin.

1.3.3 HISTOGRAMAS.
El histograma es una representacin grfica para la tabla de Distribucin de Frecuencias. El histograma es un diagrama de rectngulos contiguos, verticales generalmente, que en el eje horizontal (el de las abscisas) lleva la variable de inters, X, representada por las marcas de clase (o por los lmites reales) y en el eje Y lleva la frecuencia de cada clase. Obvio es decir que se rotulan los ejes X e Y, el ttulo y el pie de dicho histograma, a fin de ayudar a una mejor comprensin del caso. Como ejemplo, se presenta a continuacin el histograma de frecuencias para los datos de las edades de los profesores del ITC de la tabla 1.2:

Jaime Hernndez Mata

Pgina 37

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Figura 1.7: Histograma del nmero de profesores del ITC, por edad..

Para una mejor lectura de la grfica se puede decir, por ejemplo, que 11 profesores del ITC tienen una edad promedio de 29 aos, (o de 26 a 35 aos) que19 profesores tienen un promedio de 39 aos (o de 36 a 45 aos) y as sucesivamente hasta la ltima clase en que 2 profesores tienen un promedio de 69 aos (o de 66 a 75 aos). El histograma tambien puede presentarse en porcentajes, que es llamado histograma porcentual o histoframa de frecuencias relativas, el cual tiene un ligero cambio en el eje Y, sustituyendo la frecuencia absoluta por la frecuencia relativa al numero total de datos, (o por el porcentaje). Este histograma es la representacin de la Distribucion de frecuencias relativas . A continuacin se presenta el histograma porcentual para los datos de la tabla 1.3, que muestra las frecuencias relativas por categora de edad de los profesores del ITC.

Figura 1.8: Porcentaje de profesores del ITC, por grupo de edad.

38

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Para una mejor lectura del histograma porcentual se puede decir, por ejemplo, que el 22% de los profesores del ITC tienen una edad promedio de 29 aos (o de 26 a 35 aos), que el 38% de los profesores tienen un promedio de 39 aos (o de 36 a 45 aos) y as sucesivamente.

1.3.4 POLGONO DE FRECUENCIAS.


El polgono de frecuencias es una grfica de lneas rectas que unen los puntos (x,y), donde los X son las marcas de clase y los Y son las frecuencias (en el polgono de frecuencias) o las frecuencias relativas (en el polgono porcentual). Enseguida se muestra el polgono de frecuencias para los datos de la tabla 1.2, donde se han agregado supuestas marcas de clase (19 y 79) para supuestas clases anterior y posterior a las clases de la tabla, con la finalidad de cerrar la grfica de lneas y hacerla polgono::

Figura 1.9: Nmero de profesores del ITC, por grupo de edad.

Para una mejor lectura de la grfica se puede decir, por ejemplo, que 11 profesores del ITC tienen una edad promedio de 29 aos, que19 profesores tienen un promedio de 39 aos y as sucesivamente hasta la ltima clase en que 2 profesores tienen un promedio de 69 aos. Anlogamente, para los datos de la distribucin de frecuencias relativas de la tabla 1.3, el polgono de frecuencias relativas queda como sigue:

Jaime Hernndez Mata

Pgina 39

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Figura 1.10: Porcentaje de profesores del ITC, por grupo de edad.

Cuya interpretacin es similar a la anterior, y puede decirse que el 22% de los trabajadores del ITC tiene una edad promedio de 29 aos, que un 38% tiene una edad media de 39 aos, y as sucesivamente.

1.3.5 OJIVAS.
Las ojivas son grficas de lneas rectas que unen los puntos (X,Y), donde las X son las fronteras de clase Fi y las Y son las frecuencias acumuladas . Dicho de otra forma, la ojiva es la grafica de los puntos (Fi, FI ) de la Distribucin de frecuencias acumuladas y la ojiva porcentual es la grfica de los puntos (Fi, FrI ) de la Distribucin de frecuencias relativas acumuladas. Existen dos tipos de ojivas: las ojivas mayor que y las ojivas menor que, que se presentan en la siguiente figura:

a)

Ojiva tipo mayor que

b)

Ojiva tipo menor que

Figura 1.11: Tipos de Ojiva.

Siendo ms usual la ojiva de tipo menor que, en lo sucesivo slo se tratar sta. A continuacin se presenta la ojiva tipo menor que para la D i s t r i b u c i n d e f r e c u e n c i a s a c um u la d a s d e l a s e d a d e s d e 5 0 p r of e s o r es d e l I T C , dada en la tabla 1.5:
40

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Grfica de frecuencia acumulada


Nmero de profesoes
50 40 30 20 10 0 26 36 46 56 66 76

Edad
Figura 1.12: Ojiva de la edad de 50 profesores del ITC.

Donde, para aclarar la grfica, puede decirse que profesores menores de 26 aos son cero, que menores de 36 aos son 10, y as sucesivamente, hasta decir que menores de 76 aos son los 50 profesores. Esta grfica es importante debido a que puede interpolarse para cualquier valor X y entonces determinar el correspondiente valor de frecuencia acumulada, y viceversa. Ahora, la ojiva porcentual de tipo menor que, para la D i s t r i b u c i n d e f r e c u e n c i as r e l a t i v a s a c u m u l a d as d e l a s e d a d e s d e 5 0 p r of e s o r e s d e l I T C , dada en la
t a b l a 1 . 6, es :

Figura 1.13: Ojiva porcentual de la edad de 50 profesores del ITC.

Para aclarar la grfica, puede decirse que el porcentaje de profesores menores de 26 aos es cero, el de menores de 36 aos es 20%, y as sucesivamente, hasta decir que el porcentaje de profesores menores de 76 aos es el 100%. En esta grfica tambin puede interpolarse para cualquier valor X a fin de determinar el correspondiente porcentaje acumulado de profesores que tienen x edad, y
Jaime Hernndez Mata Pgina 41

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

viceversa; siendo esto una correspondencia grfica con las ecuaciones analticas para los percentiles, 1.35 (directa) y 1.36 (inversa).

1.3.6 DIAGRAMA DE CAJAS Y EJES.


El diagrama de caja y bigotes proporciona un adecuado resumen grfico de los datos, ya que los presenta en cuatro partes con 25% de frecuencia cada uno. La caja central abarca el 50% de los datos centrales. La lnea transversal que cruza la caja es la mediana (Q2), y las orillas de la caja indican los cuartiles inferior y superior (Q1 y Q3). La media suele mostrarse con solo un punto en la caja. El Rango se extiende desde el bigote inferior (dato menor) hasta el superior (dato mayor). Con esta grfica puede presentarse de forma vertical u horizontal. sta ayuda a visualizar la forma para detectar la asimetra y la dispersin de los datos.

Figura 1.14: Grfica de caja y bigotes para las edades de 50 profesores. (Forma vertical).

Figura 1.15: Grfica de caja y bigotes para las edades de 50 profesores. (Forma horizontal.)

42

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

1.3.7 DIAGRAMA DE SECTORES.


Un di a gra ma de s e c tore s , ta mb i n lla m ad o gr fic a de pa s te l , e s u n d ia gra m a circu la r qu e se p u ed e ut iliza r p a ra t od o t ip o de va ria b le s , p e ro se u sa f re cue n t em en t e p a ra las va ria b le s cu a lit a t iva s . L o s d at o s se re pre se n t an e n u n crcu lo , d e m o do qu e e l n gu lo de cad a se ct o r e s p ro po rcion a l a la f re cue n cia a b so lu ta co rre sp o nd ie n te :

ec. 1.4 0

E l d ia gra m a circula r se co n st ru ye m a nu a lm e nt e u san d o un t ra n sp o rta d o r d e n gu lo s. E je m pl o 1 . 20 : G rf ica d e se cto re s. E n un gru p o d e 4 0 a lu mn o s, 1 0 ju e ga n b a squ et b o l, 4 p ra ct ica n la n a ta ci n , 18 ju e ga n f tb o l y 8 n o p ra ct ica n n in g n d e po rt e .

Alumnos B a s q u et b o l Natacin Ftbol Sin deporte T ot a l 10 4 18 8 40

ngulo 90 36 162 72 360

T a b l a 1. 7 D i s t r i b u c i n d e f r e c u e nc i a s p a r a l a va r i a b l e c u al i t a t i va d e p o r t e p r a c t i c a d o

Figura 1.16: Deportes practicados por el grupo X.

Jaime Hernndez Mata

Pgina 43

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

A co n t in ua ci n se p re se n ta e l d ia gra m a d e se ct o re s para e l ca so d e la va ria b le cu a n t ita t iva e d a d d e 5 0 p rof e so re s d e l ITC. E st e e s o t ra gr f ica m s d e la ta b la 1 . 2 , qu e se rep ro d u ce nu e va m ent e a qu .
Edad de p r of e s or e s d e l ITC, Xi 26 - 35 36 45 46 55 56 65 66 - 75 T ot a l N m e r o de p r of e s or e s , fi 11 19 12 6 2 50 Figura 1.17 D i ag r am a d e s e ct o r es p a r a e l p or c e n t aj e de p r of e s o r e s d e l I T C , p o r g r u p o de e d a d .

T a b l a 1. 2 ( r e p e t i d a ) D i s t r i b u c i n de frecuencias de las edades d e 5 0 pr of e s or e s d el I T C .

Fin a lme n te se mue st ra n o t ro s d ia gra m a s d e se cto re s, lo s cu a le s so n im ge n e s lib re s t om a da s de In t e rne t , qu e ilu st ra n o t ra s a p lica cio ne s d e la e st ad st ica .

Figura 1.18: Otros diagramas de sectores.

44

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

PRACTICAS PARA DATOS AGRUPADOS


1.8 En la redaccin de un diario, el tiempo requerido para formar la primera pgina completa fue registrado durante 50 das. Los datos, redondeados a minuto entero, se han agrupado como se presenta a continuacin: Tiempo
19 20 21 22 23 24 25 Total

frecuencia
1 7 10 6 7 15 4 50

Obtenga: a) b) c) d) e) f) g) h) i) Los lmites reales (fronteras) de las 6 clases. La media, la mediana, y la moda, El rango, la varianza y desviacin estndar, El histograma El diagrama de sectores El polgono de frecuencias relativas La ojiva porcentual del tipo "menor que", Basado en la ojiva del inciso anterior, estime el porcentaje de primeras pginas que puede hacerse en menos de 24 minutos. Los coeficientes de asimetra y curtosis.

1.9 Considere los datos de la tabla de abajo, los cuales representan la resistencia a la compresin, en lb/pul2 (psi), de 80 tabicones, de una mezcla que est siendo evaluada como posible material para la construccin de casas. Los datos han sido agrupados en las ocho clases que se muestran. Resistencia (en psi)
76 - 97 98 - 119 120 - 141 142 - 163 164 - 185 186 207 208 229 230 251 Total

Nmero de tabicones
3 5 10 24 21 10 5 2 80

Jaime Hernndez Mata

Pgina 45

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Obtenga: a) b) c) d) e) f) g) h) i) Una tabla con los lmites reales (fronteras). El histograma El diagrama de sectores, La media, mediana, moda, y contextualice el significado de las tres. La varianza y la desviacin estndar El percentil 3, el decil 3 y el cuartil 3, y anote su interpretacin, El polgono porcentual. La ojiva porcentual del tipo menor que. Usando la grafica del inciso anterior y la frmula 1.36. Qu porcentaje de las muestras fallaron debajo de los 150 psi?

1.10.- En un taller, fue registrado durante 50 veces el tiempo requerido para hacer un trabajo. Los datos, redondeados a la dcima de minuto ms cercana, se dan a continuacin: 19.8 25.3 23.7 21.3 19.7 a) 22.8 20.7 20.3 21.5 24.2 21.9 22.5 23.6 23.1 23.8 22.0 21.2 19.0 19.9 20.7 20.7 23.8 25.1 24.2 23.8 20.9 23.3 25.0 24.1 24.3 25.0 20.9 19.5 20.8 21.1 22.2 22.8 22.9 23.5 24.1 24.2 23.9 22.8 20.9 21.6 20.1 19.5 21.8 23.9 22.7

Construya una distribucin de frecuencias absolutas de 6 clases.

Para los datos agrupados obtenidos en (a), obtenga: b) c) d) e) f) g) h) i) La media, la mediana, y la moda, El rango, la varianza y desviacin estndar, El histograma El diagrama de sectores El polgono de frecuencias relativas La ojiva porcentual del tipo "menor que", Basado en la ojiva del inciso anterior, estime el porcentaje de trabajos que puede hacerse en menos de 24 minutos. Los coeficientes de asimetra y curtosis.

1.11. Eduardo Lpez, superintendente minero de PC, tiene registro del tiempo muerto, en minutos, por turno, en su Seccin de Trabajo, al hacer trabajos in situ de ajustes y reparaciones a su maquinaria. A continuacin se presentan los datos correspondientes a los ltimos 40 turnos de trabajo: 72 66 121 116 99 a) 126 101 93 114 139 110 75 87 107 108 91 93 119 113 128 115 129 111 119 84 60 80 113 102 110 36 112 120 105 80 97 96 100 50 99

Construya la distribucin de frecuencias de 5 categoras iguales,

46

INSTITUTO TECNOLGICO DE COLIMA

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

Para los datos agrupados obtenidos en (a), obtenga: b) c) d) e) f) g) h) i) La media, mediana, y moda, La varianza y desviacin estndar. El percentil 35, el decil 6 y el cuartil 3. El histograma, El diagrama de sectores. El polgono porcentual, La grfica de frecuencia acumulada del tipo menor que. Si Lpez tiene la creencia de que un lapso "normal" de tiempo muerto es de 108 minutos, y usando la frmula 1.36 correspondiente Cuntos de los ltimos 40 turnos de su Seccin de Trabajo se encuentran debajo de 108? cuntos exceden este lmite?

1.12. Considere los datos de la tabla de abajo, los cuales representan la resistencia a la tensin, en lb/pul2 (psi), de 80 muestras de una nueva aleacin de aluminio y litio, que est siendo evaluada como posible material para la fabricacin de elementos estructurales de aeronaves. Los datos fueron registrados conforme se realizaba la prueba. Resistencia a la tensin de 80 muestras de aleacin de aluminio-litio 105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141 245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133 207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146 218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158 160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149 a) Construya una tabla de frecuencias de 8 categoras iguales.

Para los datos agrupados obtenidos en (a), obtenga: b) c) d) e) f) g) h) i) El histograma El diagrama de sectores, La media, mediana, moda, y contextualice el significado de las tres. La varianza y la desviacin estndar El percentil 5, el decil 6 y el cuartil 3, y anote su interpretacin, El polgono porcentual. La ojiva porcentual del tipo menor que. Usando la grafica del inciso anterior y la frmula 1.36. Qu porcentaje de las muestras fallaron debajo de los 120 psi?

Jaime Hernndez Mata

Pgina 47

PROBABILIDAD Y ESTADSTICA

UNIDAD I: ESTADSTICA DESCRIPTIVA

48

INSTITUTO TECNOLGICO DE COLIMA

You might also like