Professional Documents
Culture Documents
1. INTRODUCCIN
Un esquema de los principales estadgrafos que resumen las distribuciones de frecuencias se muestra en la figura
5.1.1.
Media aritmtica
Mediana
Posicin Moda
Estadgrafos
Media geomrica
Media armnica
Rango
Tipo I Desviacin estndar
Dispersin
Variables Tipo II Amplitud cuartlica
Tipo III Amplitud centlica
Coeficiente de variacin
Comparacin
Variable tipificada
Coeficiente de asimetra
Forma
Coeficiente de curtosis
2. ESTADGRAFOS DE POSICIN
62
2.1. Introduccin
La informacin que contiene cualquiera de las distintas formas de distribucin de frecuencias o probabilidades sobre
los valores de una variable, es posible reducirla o condensarla utilizando estadgrafos o indicadores de posicin
central.
Ejemplo 1: Para describir la edad indicadora, en forma resumida, de los alumnos que hacen el pre-universitario, se
dice que tienen en promedio 18 aos.
Ejemplo 2: Para describir la temperatura en Cochabamba se dice que el promedio es de 24 oC, es decir un clima
templado.
x i
x1 x 2 x n
x , M[ x ], i 1
n n
2.2.2. Determinacin de la media aritmtica en distribuciones de frecuencia
a) Tipo I: La media en distribuciones tipo I se determina aplicando la definicin general. Es llamada tambin: media
aritmtica de distribucin no ordenada o no ponderada.
b) Tipo II: En el clculo de la media aritmtica en distribuciones tipo II, se aplica la expresin anterior aadiendo
pesos o ponderaciones:
n
x i ni
x i 1
n
donde ni son las ponderaciones (ni = frecuencia absoluta).
Una manera fcil de determinarla es efectuando operaciones en la tabla de distribucin de
frecuencias de la siguiente manera:
Se multiplica la primera columna (x i) por la segunda columna (ni). Este producto se anota en la tercera columna.
63
La suma de dicho producto se divide entre el tamao de poblacin o universo (ver tabla 5.1.1).
Tabla 5.1.1
Clculo de la media aritmtica en distribuciones tipo II
xi ni xi * ni
x1 n1 x1 * n1
x2 n2 x2 * n2
: : :
xn nn xn * nn
n xi * ni
x
x i ni
tal que: n
c) Tipo III: La expresin de clculo de la media aritmtica en una distribucin de frecuencias tipo II se aplica tambin
al caso de hallar dicho estadgrafo en una distribucin tipo III, si acaso esta distribucin se la convierte a tipo II.
Tabla 5.1.2
Transformacin de la tabla Tipo III a tipo II
Li-1 - Li ni
Lo - L1 n1
L1 - L2 n2
: : xi = (Li + Li-1)/2 ni
Ln-1 - Ln nn x1 n1
x2 n2
ni = n
: :
xn nn
ni = n Fuente: Elaboracin propia
Dicha transformacin se produce reemplazando los intervalos de clase por sus valores medios
o marcas de clase (semisuma de los lmites de cada intervalo).
2.2.3 Esperanza matemtica
2.3. Moda
2.3.1. Definicin
64
La moda es el valor de la variable que responde a la frecuencia ms alta. Se dice tambin que
es el valor de la variable ms frecuente. Este estadgrafo de tendencia central se usa para
resumir la informacin en el caso de distribuciones de atributo nominal, ordinal y en el caso de
las variables discretas o continuas.
2.3.2. Determinacin de la moda en distribuciones de frecuencia
a) Tipo I: En las distribuciones tipo I, no existe posibilidad de hallar la moda, por que dicha
distribucin se dice que es de tipo unitaria.
b) Tipo II: En las distribuciones tipo II, la moda se determina aplicando la definicin.
c) Tipo III: La moda en distribuciones tipo III se halla de dos maneras:
1) Se transforma la distribucin tipo III en tipo II, cambiando la columna de intervalos con una de marcas de clase y
se aplica la definicin de la moda.
2) Se aplica una frmula emprica (Mo):
Si la distribucin tipo III es de intervalo no constante:
n i 1
a i 1
Mo Li 1 (a )
n i 1 n i 1 i
a i 1 a i 1
Si la distribucin tipo III es de intervalo constante, la moda se determina aplicando la siguiente frmula emprica:
n i 1
Mo Li 1 (a i )
n i 1 n i 1
2.3.3. Moda esperada
La moda en una distribucin de probabilidad, corresponde a aplicar las condiciones de un
mximo.
a) Funcin de cuanta: Si f(x) es una distribucin de cuanta, la moda se determina aplicando
la definicin.
b) Funcin de densidad: Si f(x) es una distribucin de densidad, se puede determinar la moda
mediante tres procedimientos:
1) Aplicando el mtodo para hallar un mximo absoluto en un intervalo. Consiste de los
siguientes pasos:
a) Halle las coordenadas de x de todos los puntos crticos de primer orden de la funcin en el intervalo
a x b (Un punto crtico es aquel que se obtiene igualando a cero o a no existe la primera derivada de una
funcin:
f ' (x) 0
65
b) Calcule f(x) en estos valores crticos y en los puntos extremos x = a y x = b.
c) Seleccione el valor mayor de f(x) obtenido en el paso 2. Este es el mximo absoluto, que puede ser
P i+1
Mo = L i 1 + a i+1 * ai
P i+1 + P i 1 P i+1
Mo = * a i + Li 1
a i+1 a i 1 P i+1 + P i 1
3) Transformando la distribucin tipo III en una tipo II mediante las marcas de clase y aplicando la definicin de la
moda.
Nota: En una distribucin de frecuencias o probabilidades, cuando existen dos o ms valores
que corresponden a la frecuencia ms alta, se dice que la distribucin es bimodal o multimodal.
El valor de una distribucin de frecuencias que corresponde a la frecuencia ms baja, se
denomina antimoda.
2.4. Mediana
2.4.1. Definicin
Es un valor de la variable que permite distribuir en dos partes igualmente proporcionales a la
distribucin de frecuencias. De otra manera se dice que la mediana es un valor que supera a
no ms de 50% de los valores observados. La mediana es un estadgrafo de ubicacin y
permite determinar si un valor cualquiera de la variable forma parte del primer o del segundo
grupo.
2.4.2. Clculo de la mediana en distribuciones de frecuencia
El procedimiento para su clculo es diferente segn el tipo de distribucin para el que se desea
hallar.
a) Tipo I: Se distinguen 2 casos:
1) Si el nmero de trminos de la distribucin es impar
Se ordenan los datos de la distribucin en forma ascendente o descendente.
El valor de la mediana corresponde al trmino central, es decir:
Me x n 1
2
2
66
b) Tipo II: El valor de la mediana en una distribucin tipo II, se determina tomando en cuenta el siguiente
procedimiento:
n
N i 1
Me Li 1 2 (a i )
ni
La mediana esperada es el valor de la variable aleatoria que divide a una distribucin de probabilidades en dos
partes igualmente proporcionales.
a) Funcin de cuanta: El procedimiento para hallar la mediana esperada en una funcin de cuanta es el siguiente:
Pac (x i ) 0.5 entonces Me x i
x i x i 1
Pac (x i ) 0.5 entonces Me
2
b) Funcin de densidad: La mediana esperada de una funcin de densidad puede ser calculada por tres mtodos:
Me
1
f (x) dx f (x) dx 2
Me
x
0.5 Pac (x i1 )
Me Li 1 (a i )
P(x i )
3) Mediante la transformacin de la distribucin tipo III en tipo II, seguido del procedimiento para el clculo de
la mediana para esa distribucin.
67
2.5. Media armnica
2.5.1. Definicin
Es un valor de la variable que se determina como el valor recproco medio de los valores recprocos de la variable.
Se la usa generalmente cuando se quiere determinar la tasa media de uso de un producto.
n
H= n
1
x
i=1 i
b) Tipo II y III: En una distribucin de frecuencia tipo II o III, la media armnica se calcula de la siguiente manera:
n
H= n
1
x
i=1
* (n i )
i
2.6. Media geomtrica
2.6.1. Definicin
La media geomtrica es la raz ensima del producto de los valores considerados de una variable representada por:
n
G = n x1 * x 2 * . . . * x n = n x i
i 1
Generalmente es una mejor medida que la media aritmtica cuando los datos estn en porcentajes o unidades
relativas.
a) Tipo I: La definicin anterior se utiliza en caso de obtener la media geomtrica en la distribucin tipo I.
b) Tipo II o III: En distribuciones tipo II y III, la media geomtrica se obtiene aplicando la siguiente definicin:
n
G = n x1n1 * x n2 2 * . . . * x nk k = n x in i
i 1
Para elegir el estadgrafo de posicin que mejor se adecue a cada distribucin, se deben tomar en cuenta las
siguientes consideraciones:
armnica (H) geomtrica (G ) aritmtica ( x )
La media aritmtica da mucho relieve a los elementos grandes de una serie estadstica, por el
contrario, las medias geomtrica y armnica destacan la influencia de los valores pequeos y
reducen la influencia de los valores grandes.
Un rbol de decisin para seleccionar el estadgrafo de posicin adecuado es el mostrado en la
figura 5.2.1.
3. ESTADGRAFOS DE DISPERSIN
3.1. Introduccin
Los estadgrafos de tendencia central permiten resumir la informacin definiendo la posicin de
la distribucin de frecuencias, tanto para variables como para atributos. Sin embargo esta es
una caracterizacin parcial de dichas distribuciones. La caracterizacin se completa, cuando
adems de conocer la posicin tambin se conoce su dispersin.
Los estadgrafos que permiten conocer en forma resumida la dispersin de una distribucin se
denominan indicadores de dispersin. Adems de ello permiten evaluar la confiabilidad de un
estadgrafo de posicin.
An siendo la media aritmtica el promedio ms utilizado en la prctica, muchas veces puede
dar lugar a falsas interpretaciones. Esto ocurrir cuando no tenga suficiente grado de
representatividad, es decir, cuando los valores de la variable estn poco concentrados, o lo que
es lo mismo, muy dispersos a su alrededor. Entonces, poco podr decir la media sobre la
poblacin en estudio. Es necesario acompaar la media aritmtica con una medida del grado
de dispersin de los valores de la variable a su alrededor, de forma que, cuanto mayor sea esta
medida, menor ser el grado de representatividad de la media y viceversa.
69
FIGURA 5.2.1. RBOL DE DECISIN PARA LA SELECCIN DEL ESTADGRAFO DE POSICIN ADECUADO
si
Moda
Nominal
No hay estadgrafo
Atributo no
si
Moda
Ordinal
Mediana
Clasificacin del atributo? no
Slo hay una moda?
Media geomtrica
si
Caracterstica de la poblacin?
Variable Media armnica
si
no
si Mediana
Datos son ndices?
no
Media aritmtica
Datos son tasas de uso? no
La varianza es grande?
Fuente: Elaboracin Propia
Los principales son:
El recorrido.
La varianza y la desviacin estndar.
La amplitud y desviacin cuartlica.
La amplitud centlica.
Por ejemplo una caracterizacin completa de la temperatura de Cochabamba es: La temperatura media es de 22 C,
con una dispersin dada por la desviacin estndar de 12 C. Si la dispersin es muy grande, entonces la
temperatura media no ser un valor representativo.
1. Cunto ms dispersos estn los datos, ms aumentar el rango, la desviacin estndar o la amplitud cuartlica, y
viceversa.
2. Si las observaciones son todas iguales (de manera que no hay variacin en los datos) todos los estadgrafos de
dispersin sern igual a cero.
3. Las medidas de dispersin nunca son negativas.
3.2.1. Definicin
Se determina por la diferencia entre el valor mximo y el valor mnimo observados de la variable.
R xi VM xi Vm xi
Esta medida de dispersin simple es de clculo fcil, de uso comn y significacin concreta, para expresar la
variabilidad observada en la distribucin. Su uso es limitado cuando deben efectuarse comparaciones debido a las
unidades diferentes en que se expresan las variables. Su desventaja es que solo toma en cuenta los valores
extremos de la variable y no as todos ellos.
Es eficaz y brinda un ayuda rpida para calcular la concentracin en distribuciones uniformes. Por ejemplo, si una
variable se distribuye uniformemente entre los lmites 5 y 12, presentar mayor concentracin que otra que se
distribuya tambin uniformemente entre los lmites 1 a 20.
3.3. Varianza
3.3.1. Definicin
La varianza de una distribucin de frecuencia se determina por el promedio del cuadrado de las desviaciones de la
variable.
n
(x
2
i x)
S = = V [x ] = M [z i ] =
2 2 2 i=1
n
3.3.2. Determinacin en distribuciones de frecuencia
a) Tipo I: La anterior frmula se aplica para el clculo de la varianza en las distribuciones tipo I. El clculo de la
72
varianza se facilita si se desarrolla convenientemente la expresin anterior:
x x
2
2
S 2
i
i
n n
b) Tipo II y III: Si las distribuciones son de tipo II y III, la varianza se define de la siguiente manera:
(x
2
x) * n i
x x n
2
i 2
ni
2 2 2
S = = V [x ] = M [ z i ] = i=1
2
S i
i i
n n n
3.4.1. Definicin
En toda distribucin de probabilidad, a fin de caracterizarla, adems de hallar la esperanza matemtica, es necesario
determinar o analizar la varianza esperada.
a) Funcin de cuanta: Si se tiene una funcin de cuanta, la varianza esperada se define de la siguiente manera:
2
n n
n
V[x] (x i x) P(x i ) x P(x i ) x i P(x i )
2 2
i
i 1 i 1 i 1 siendo: x = 0, 1, 2, 3, ... n.
b) Funcin de densidad: Si se tiene una funcin de densidad, la varianza esperada se define de la siguiente
manera:
2
V [x ] = (x x ) f(x) dx = x f(x) dx x f(x) dx
2 2
3.5.1. Definicin
Los cuartiles son los valores de la variable que dividen a la distribucin en 4 partes proporcionalmente iguales, como
lo muestra la figura 5.3.1.
A.C.
25% 25% 25% 25%
Q1 Q2 = Me Q3
AQ Q3 Q1
rn
N i 1
Q r Li 1 4 (a i )
ni
Esta ecuacin es una general de la que se ha deducido la ecuacin para el clculo de la mediana.
A.Q.
D.Q.
2
3.6.1. Definicin
Los centiles son los valores de la variable que dividen a la distribucin en 100 partes iguales, como se muestra en la
figura 5.3.2.
Figura 5.3.2
Disposicin de los centiles en una distribucin
A.C.
10% 40% 40% 10%
Nota: El cuartil 2 es igual al centil 50 y a la mediana. El cuartil 3 es igual al centil 75 y el cuartil 1 al centil 25. A.Cn. es
la amplitud centlica.
Nota: Por medio de los centiles, el investigador puede no slo calcular los lmites del 80% central de la distribucin,
sino de cualquier porcentaje que sea adecuado para sus conclusiones.
a) Tipo I y II: En la prctica, debido a que para calcular centiles se deben dividir los datos en 100 partes, no se
realiza el clculo para distribuciones tipo I y II, que contienen pocos valores diferentes de la variable.
74
donde el r - simo centil se calcula mediante:
rn
Ni 1
C r Li 1 100 (a i )
ni
3.7. Diagrama de caja y bigotes
En su forma ms simple, un diagrama de caja y bigotes proporciona una representacin grfica
de los datos, mediante el resumen de cinco valores: valor mnimo, cuartil 1, mediana, cuartil 3 y
valor mximo de la variable.
A continuacin en la figura 5.3.3 se muestra un diagrama de caja y bigotes
Se puede observar que la caja contiene el 50% central de los datos de la distribucin, con los
lmites expresados por el cuartil 1 y el cuartil 3. La mediana divide a la distribucin en dos
partes proporcionalmente iguales. Por otro lado, las lneas que van desde la caja hasta el valor
mayor y menor de la variable, son los bigotes.
Figura 5.3.3. Diagrama de caja y bigotes
Valor menor Q1 Me Q3 Valor mayor
Fuente: Elaboracin propia
El grfico indica que la distribucin est levemente sesgada a la izquierda, ya que el bigote
izquierdo es de mayor magnitud al derecho. Por otro lado la mediana est levemente cerca del
lado derecho de la caja, lo que confirma el sesgo.
4. ESTADGRAFOS DE COMPARACIN
4.1. Introduccin
En muchos casos de distribuciones de frecuencias de una variable, stas no son comparables
utilizando la medias y la varianzas respectivas, por las distintas unidades en que estn
expresadas las variables. Entonces es necesario construir indicadores que no estn influidos
por dichas unidades. En este caso se construyen razones tales como el coeficiente de
variacin y la variable tipificada o estandarizada como instrumentos que permiten comparar
entre distribuciones de frecuencias de una variable.
4.2. Coeficiente de variacin
El coeficiente de variacin permite expresar la dispersin de la distribucin de frecuencias por
unidad de media aritmtica. Este coeficiente se obtiene dividiendo la desviacin estndar entre
la media aritmtica. Se simboliza por el coeficiente CV y su expresin es:
s
CV
x
En general este coeficiente se usa cuando los valores de las medias aritmticas y las varianzas
75
entre dos distribuciones no son iguales. Permite determinar la dispersin relativa porcentual o
el grado de homogeneidad de una distribucin. El mayor valor del coeficiente de variacin
expresa una mayor dispersin en la distribucin. Si se expresa en porcentaje sus valores van
desde 0 al 100.
4.3. Variable tipificada o estandarizada
Es el resultado de transformar una variable en otra utilizando un cambio de variable de manera
que su media aritmtica sea igual a cero y su varianza igual a uno. La variable tipificada (z)
resulta de dividir la desviacin de un valor de la variable respecto de su media aritmtica entre
la desviacin estndar.
xi x
zi
s
La variable tipificada se usa para determinar la posicin relativa entre los valores
correspondientes a distribuciones de frecuencias diferentes.
La variable tipificada o estandarizada es un cambio de variable fundamental en la inferencia
estadstica, porque constituye la base del muestreo a travs del teorema central del lmite.
5. ESTADGRAFOS DE FORMA O CONCENTRACIN
5.1. Introduccin
Las medidas de forma o concentracin permiten conocer qu forma tiene la curva que
representa la serie de datos de una distribucin de frecuencias. En concreto, podemos estudiar
las siguientes caractersticas de la curva:
a) Asimetra: mide si la curva tiene una forma simtrica, es decir, si respecto al centro de la misma (centro de
simetra) los segmentos de curva que quedan a derecha e izquierda son similares.
b) Curtosis: mide si los valores de la distribucin estn ms o menos concentrados alrededor de los valores
medios de la muestra.
5.2. Asimetra
5.2.1. Definicin
La asimetra de una distribucin puede ser determinada mediante las siguientes reglas:
Si una distribucin de frecuencias es simtrica, se dice que no tiene sesgo o su sesgo es nulo.
Se dice que una distribucin presenta sesgo positivo cuando la media es mayor que la mediana o moda, debido
a observaciones grandes.
Se dice que una distribucin presenta sesgo negativo cuando la media es la menor de los tres promedios, por
observaciones pequeas.
Un diagrama que muestra los diferentes grados de simetra es el representado en la figura
5.5.1.
Eje de simetra Figura 5.5.1. Tipos de asimetra de una distribucin
x
Eje de simetra Eje de simetra
76
Asimtrica Negativa
x x
Asimtrica Positiva Curva simtrica
Fuente: Elaboracin propia
5.2.2. Determinacin
La medicin de la asimetra se realiza mediante el coeficiente de Pearson:
3(x Me)
C.A. 3 C.A. 3
s
donde: un valor positivo indicar que la distribucin tiene sesgo positivo.
un valor negativo indicar que la distribucin tiene sesgo negativo.
un valor de cero, indicar que la distribucin es simtrica.
Cuanto ms alejado est el valor del cero, ms asimetra tendr la distribucin.
5.3. Curtosis
5.3.1. Definicin
La curtosis mide el grado de agudeza de una distribucin. Analiza el grado de concentracin
que presentan los valores alrededor de la zona central de la distribucin.
Se definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores centrales de la
variable (el mismo que presenta una distribucin normal).
Distribucin leptocrtica: presenta un elevado grado de concentracin alrededor de los valores centrales de la
variable.
Distribucin platicrtica: presenta un reducido grado de concentracin alrededor de los valores centrales de la
variable.
Un diagrama muestra de manera objetiva los distintos grados de curtosis (ver la figura 5.5.2)
Figura 5.5.2. Grados de curtosis de una distribucin
Eje de simetra Eje de simetra Eje de simetra
x x x
Leptocrtica Mesocrtica Platicrtica
(Delgado) (Intermedio) (Aplanado)
77
Fuente: Elaboracin propia
5.3.2. Determinacin
1 n
(x i x)4 n i
n i 1
g2 2
3
1 n 2
n (x i x) n i
i 1
g2 = 0 (distribucin mesocrtica).
g2 > 0 (distribucin leptocrtica).
g2 < 0 (distribucin platicrtica).
A continuacin se presenta un rbol que resume toda la informacin vertida en el captulo, que
ayudar al investigador a decidir los estadgrafos adecuados para el resumen de las
distribuciones en las que est trabajando (ver figura 5.6.1 de elaboracin propia).
78
para estadgrafos
Figura 5.6.1. rbol
Posicin Dispersin Comparacin Asimetra Curtosis
Nominal
No
Atributo Moda
Existe jerarqua?
Moda Mediana AQ Q3 Q1
Si
Ordinal n
x i
S=
x i2 x i
2
x= i 1
n n n
xn xn
1
Tipo I Me x n 1 Me 2 2
3(x Me)
2 AQ Q3 Q1 s C.A.
2 CV s
n n
x
H= n
1 G = n xi
x
i=1
i 1
i
Pocos-Pocos
Cualitativa n
x n
2
x i 2 n i x i n i
i i
Moda S=
x= i 1 n n
n 1 n
Determinstico Muchos-Pocos Tipo II + (xi x)4 n i
Me x i Me = x i x i+1 AQ Q3 Q1 s 3(x Me) g 2 n i 1
3
2 CV C.A. 2
s 1 n
2
n (x i x) n i
n
H= n x
ni n i 1
Valores? - variables? i=1 x i
G = n x in i
Caracterstica de la poblacin i 1
Mo = Li 1 n i+1 ( )
Muchos-Muchos ai
n i+1 + n i1 1 n
(xi x)4 n i
Constantes n i 1
n s 3(x Me) g 3
N i 1 CV C.A. 2 2
s 1 n
Me Li 1 2 AQ Q3 Q1 n (x i x) n i
2
(a i ) x
ni i 1
Cuantitativa
Intervalos?
n i+1 1 n
Tipo III (xi x)4 n i
n i 1
a i+1 s 3(x Me) g 2 3
Mo = L i 1 + (a i ) CV C.A. 2
n i+1 + n i 1 s 1 n
n (x i x) n i
Tipo de experimento? 2
Variables
x
a i+1 a i 1 i 1
n
Moda
E [x ] = x i P ( x i )
n
Variable Enteros Discreta V[x] x i2 P(x i ) x
2
s 3(x Me)
i=1
+
Me = x i x i+1
i 1
CV C.A.
Me x i AQ Q3 Q1 s
Tipo de valores? 2 x
Aleatorio V [x ] = x 2 f(x) dx x
2
Decimales
E[x ] = x i f(x i) dx 1 s 3(x Me)
CV C.A.
f (x) dx Moda AQ Q3 Q1 s
Continua
Me
2 x
7. EJEMPLOS DE CLCULO DE ESTADGRAFOS
7.1. Atributo nominal
Se aplic una encuesta para analizar la satisfaccin de los pacientes a una muestra de 210
personas que se dieron de alta en un hospital urbano, durante el mes de junio, la cual gener
la siguiente lista de 384 quejas mostrada en la tabla 5.7.1.
Tabla 5.7.1
Razn de queja de pacientes de un hospital
Razn de queja
Conflictos con otros pacientes/visitantes
Ruido
Otras
Total
Fuente: Levin y Rubin. Estadstica para Administradores, 1996
Para atributo nominal el nico estadgrafo que se puede determinar es la moda.
Mo=Mal servicio alimenticio
Interpretacin: Lo ms frecuente es que los pacientes se quejen del mal servicio alimenticio del
hospital.
7.2. Atributo ordinal
La calificacin que dieron los empleados de una empresa sobre el servicio de internet que han
contratado recientemente se resume en la tabla 5.7.2.
Tabla 5.7.2
Calificacin de un servicio de internet
Calificacin ni Ni
Psimo 1 1
Malo 4 5
Regular 30 35
Bueno 50 85
Muy bueno 60 14
5
Excelente 5 15
0
Total 15
0
Mo=Muy bueno
n
Para la mediana se ubica =75 entre dos valores de frecuencia acumulada. Est entre
2
35 y 85. Luego:
Me=Bueno
El 50% de los trabajadores calificaron el servicio de internet como psimo a bueno, y el otro
50% como bueno a excelente.
7.3. Tipo I
Tabla 5.7.3
Productos defectuosos de una fbrica
xi
x 2
(x i x) (x i x)4
10 49 2401
1
12 25 625
1
15 4 16
2
16 1 1
2
20 9 81
4
21 16 256
4
25 64 4096
6
2
Total = 119 168 7476
119
x= =17
7
s=
2191 119 2
7
4.90
7 ( )
=4.90
CV = ( 100 )=28.82
17
Q1=x 7+1 =x 2=12 Q 3=x 3 (7+1 ) =x 6=21
4 4
AQ =9 DQ=4.5
7476
CA=
3(1716)
=0.61 g=
( 7 )
3=1.15
2 2
4.9 168
(7)
7.4. Tipo II
Ver ejemplo para tipo III, ya que esta distribucin debe primero transformarse a una tipo II.
Se muestra la tabla 5.7.5 con todos los clculos pertinentes para hallar los estadgrafos:
Tabla 5.7.5
Clculo de estadgrafos de la distribucin de inversin en un plan de participacin de utilidades
3 1
2 1
7 8
5 3
3 3
3 8
1 1
2 1
1 6
24
Mo=50+ ( 5 )=52.61
24+22
Interpretacin: Lo ms frecuente es que un trabajador haya invertido 52.61 $.
6185
x= =51.54
120
s=
325500 6185 2
120
120 (
=7.48 )
7.48
CV = ( 100 ) =14.51
51.54
Interpretacin: Los trabajadores invirtieron en promedio 51.54 $ con una dispersin de 7.48 $. La dispersin relativa
porcentual es del 14.51%.
6043 3021
Me=50+ ( 5 ) =52.13 Q1=45+ ( 5 ) =47.05
40 22
9083
Q3=55+ ( 5 ) =56.46
24
AC =9.41 DC=4.71
1210 108107
C10=40+ ( 5 )=40.91 C 90=60+ (5 )=60.56
11 9
ACn=19.65 DCn=9.82
Interpretacin:
Cuartil 1: El 25% de los empleados invierten menos de 47.05 dlares en el plan, mientras que el 75% restante
aportan ms de ese valor.
Mediana: El 50% de los empleados invierten menos de 52.13 dlares en el plan, mientras que el 50% restante
aportan ms de ese valor.
Cuartil 3: El 75% de los empleados invierten menos de 56.46 dlares en el plan, mientras que el 25% restante
aportan ms de ese valor.
Amplitud cuartlica: El 50% central de los trabajadores aportan al plan entre 47.04 y 56.46 dlares.
Centil 10: El 10% de los empleados invierten menos de 40.91 dlares en el plan, mientras que el 90% restante
aportan ms de ese valor.
Centil 90: El 90% de los empleados invierten menos de 60.56 dlares en el plan, mientras que el 10% restante
aportan ms de ese valor.
Amplitud centlica: El 80% central de los trabajadores aportan al plan entre 40.91 y 60.56 dlares.
El aporte mediano de los trabajadores es de 52.13 $ con una dispersin de 4.71 $ (si se usa la
desviacin cuartlica) o 9.82 $ (si se usa la desviacin centlica).
51.5452.13
3
CA=
Interpretacin: La distribucin de inversiones es asimtrica con sesgo negativo
1165409.113
120
g2= 3=0.10
6714.79167 2
( 120 )
Interpretacin: La distribucin de inversiones es leptocrtica.
1
f (x) (2 x 1) x 0, 1, 2, 3
Sea la siguiente funcin de cuanta: 16 . Halle los estadgrafos.
La tabla 5.7.6 resume los clculos para determinar los estadgrafos.
Tabla 5.7.6
1
f (x ) (2 x 1) x 0, 1, 2, 3
Clculo de los estadgrafos de la funcin 16
xi
P( P( xi2 Pac
xi) xi) P(xi) (xi)
0, 0,0
06 62
25 0 0 5
0, 0,
18 18 0,18 0,2
75 75 75 5
0, 0, 0,5
31 62 62
25 5 1,25 5
0, 1,
43 31 3,93
75 25 75 1
2,
12 5,37 1,8
1 5 5 75
E [ x ]=2.125
S [ x ] = 5.3752.1252=0.93
CV =43.62
Me=2 Mo=3
7.7. Funcin de densidad
1
f (x ) = (2x + 1 ) para 0 < x < 3
Sea la siguiente funcin de densidad: 12 . Halle los estadgrafos..
2
1
3
3
1
V [x ] = x (2x + 1 ) dx
2
0 12
x (2x + 1 ) dx
0 12
2
1 4 3
3
1 2 x 3 x 2
3
= x + x +
12 2 3 0 12
3 2
0
2
1 81 1 9 1 99 2025 2376 2025 351
= + 9 18 + = *( ) = = = 0.609
12 2 12 2 12 2 576 576 576
E [x] = 1.875 (media)
V [x] = 0.609 (varianza)
S [x] = 0.78 (desviacin estndar)
CV [x] = 41.6% (coeficiente de variacin)
Se observa que la esperanza matemtica no es una medida confiable para resumir la informacin de la distribucin,
ya que su dispersin es grande.
Me Me
1 1 2 1 1
0 12 (2x 1) dx 12 (x x) 0 12 (Me Me) 2
2
Me 2 Me 6 0
Se deriva e iguala acero para determinar los puntos crticos de primer orden:
2
f ' ( x )= =0
12
No existe ningn punto crtico. Entonces se evalan las ordenadas de los lmites, y la moda ser el valor de la
variable que tiene mayor ordenada:
1 7
x=0 f ( x )= x=3 f ( x )=
12 12
La moda es de 3.
2da Propiedad. La media aritmtica de la variable ms una constante es igual a media aritmtica de la variable ms
la constante:
M[x k] x k
3ra Propiedad. La media aritmtica de la variable multiplicada por una constante es igual a la media aritmtica de la
4ta Propiedad. La desviacin de los valores de la variable respecto de la media aritmtica en promedio es igual a
cero. Desde el punto de vista geomtrico, esta propiedad indica que la media aritmtica es el centro de gravedad de
la distribucin.
Si
z xi x entonces:
M [z] M [ x i x ] 0
5ta Propiedad. Si en una distribucin de frecuencias de una variable, se considera importante distinguir dos o ms
grupos de tamaos n1 , n2 ,..., nk tal que n = n1 + n2 +...+ nk , con medias aritmticas x 1 , x 2 ,..., x k la media general
de la distribucin se obtiene de la siguiente manera:
k
x n x2 n2 xk nk x i ni
x 1 1 i 1
n1 n 2 n k n
cuadrado:
V [k x ] k 2 V [ x ]
4ta Propiedad. Cuando una distribucin de frecuencias requiere ser connotada por la importancia de sus grupos, se
dice que la varianza total debe ser explicada por la variacin entre grupos (intervarianza) y la variacin dentro los
grupos (intravarianza), tal que:
S2 S2b Sc2
(Intervarianza + Intravarianza)
k
(x hi x)2 n h i
S2b i 1
S 2
hi nhi
S
2
c
i 1
La utilidad que tiene la cuarta propiedad es muy grande. En general, se puede decir que si:
S2b Sc2
, hay mayor variabilidad entre grupos que dentro de cada grupo. Por lo tanto los grupos son distintos
entre s, y constituyen estratos diferenciados de la poblacin.
Sc2 S2b
, hay mayor variacin dentro de cada grupo que entre grupos. Por lo tanto los grupos son similares y
pueden ser unidos en un solo grupo, que constituye la poblacin.
Esta propiedad constituye el fundamento del Anlisis de Varianza (ANOVA), que es muy utilizada en el anlisis
estadstico de experimentos.
8.3. Ejemplos de propiedades de la media y la varianza
Ejemplo 1: Sea la distribucin del dinero que gastan diariamente los estudiantes de la carrera de ingeniera
industrial (ver tabla 5.8.1). Halle la media y la varianza.
Tabla 5.8.1
Clculo de la desviacin estndar de la distribucin de gastos diarios
xi ni xi*ni xi2*ni
3 11 33 99
9 9 81 729
17 12 204 3468
26 8 208 5408
40 526 9704
526
x 13.15 Bs.
40
Se obtienen los valores xi2*ni (columna 4) para determinar la varianza.
9704
S2 (13.15) 2 69.6775 Bs.2
40
S 69.6775 Bs 2 8.35 Bs.
Conclusin: Los estudiantes gastan diariamente en promedio 13.15 Bs. con una dispersin de 8.35 Bs.
Cul de las dos polticas econmicas recomienda a sus compaeros y por qu?
Para comparar los resultados de las dos distribuciones es conveniente usar una medida de
comparacin, es decir el coeficiente de variacin, que mide la dispersin relativa porcentual
con respecto a la media.
Respuesta: Examinado el valor de las medias conviene el aumento del 20% aunque sea pequea la diferencia.
Observando el valor de la varianza se determina que conviene aumentar a todos 2.5 por la gran diferencia que
existe entre dichos valores. La varianza en la primera medida, indica que el aumento beneficia a todos sin variar la
diferencia de ingresos. En la segunda medida para un aumento mas o menos semejante, la varianza indica que las
diferencias se hacen ms profundas (pobres se hacen ms pobres y los ricos se hacen ms ricos). En consecuencia
por un sentido de solidaridad y evitar mayores desigualdades, conviene que el Centro de Estudiantes aplique la
primera medida.
Otra forma de determinar la mejor poltica es observar los coeficientes de variacin. El menor coeficiente de
variacin es el que siempre conviene.
Ejemplo 2: Si la distribucin anterior del ingreso diario de los estudiantes de Ingeniera Industrial est formada por
dos grupos igualmente importantes por su composicin y de un tamao igual a 20, se desea averiguar si estos dos
grupos son diferentes o no en cuanto a su ingreso.
Primero, se debern caracterizar cada uno de dichos grupos.
1er Grupo:
2do Grupo:
2
8876 412 2
S2 =
2
= 443.8 (20.6) = 443.8 424.36 = 19.44 Bs 2
20 20
Tabla 5.8.2
Clculo de la intervarianza
2
9137 526
2
Sb = = 55.5025 Bs 2
40 40
b) Intravarianza (ver tabla 5.8.3):
Tabla 5.8.3
Clculo de la intravarianza
2 567
Sc = = 14.175 Bs 2
40
Por lo tanto: S2 = Sb2 + Sc2 = 69.6775 Bs2.
El bajo valor de la intravarianza Sc2 = 14.175 Bs2., indica que la variacin distribuible de dinero dentro de cada grupo
es homognea. El alto valor de la intervarianza Sb2 = 55.5025 Bs2., expresa que la variabilidad de dinero en efectivo
entre los grupos es fuerte. En consecuencia la alta variabilidad total del dinero en efectivo en la distribucin depende
de la variabilidad entre los grupos.
En consecuencia los dos grupos tienen caractersticas diferentes en cuanto a su disponibilidad diaria de dinero. En
consecuencia la media de los dos grupos diferenciados es ms representativa que la media del grupo total.
EJERCICIOS DE CLASE
Distribuciones de frecuencia
1. En una empresa constructora, el departamento de obras est constituido por 40 trabajadores, que cumplen
las siguientes funciones: (I = Ingeniero, J =Jefe de obras, C = Capataz, O = Obrero, A = Ayudante). La
informacin elaborada permitir conocer la estructura de ocupacin de dicha empresa.
a) Organice y presente los datos en una distribucin de frecuencias. Describa la distribucin por sus elementos
esenciales.
b) Determine la moda y la mediana.
2. Se midi la resistencia a la compresin de 58 muestras de una aleacin de aluminio en desarrollo como
material para aeronaves.
a) Organice y presente los datos en un tipo de distribucin de frecuencias adecuada.
b) Halle la media, mediana, moda y ubquelos en un grfico, con sus respectivos
estadgrafos de dispersin.
3. En una fbrica de tornillos se ha tomado una muestra de su produccin considerando el largo de ellos.
Existen cajas de 50 tornillos de distinta longitud (medidos en cm). Los resultados de una de ellas es el siguiente:
a) Organice y presente los datos en un tipo de distribucin.
b) Represente el grfico de frecuencias.
c) Halle los estadgrafos de posicin: media, mediana y moda y ubquelos en el grfico. Determine
sus estadgrafos de dispersin. Tambin determine la asimetra y la curtosis.
4. Las lecturas de temperatura que dio una termocupla de un horno industrial en C, son:
16 25 34 43 52 61
Calcule la mediana y la media aritmtica; la desviacin estndar, el coeficiente de variacin, la asimetra y la
curtosis.
5. Las tasas de crecimiento de la empresa Taquia durante los ltimos 5 aos son: 5.2%, 8.7%, 3.9%, 6.8% y
19.5% respectivamente.
a) Cul es la media aritmtica de la tasa anual de crecimiento?
b) Cul es la media geomtrica de la tasa anual de crecimiento?
c) Cul de las dos medias debera utilizarse para determinar la tasa anual de crecimiento?
6. Se recopil informacin acerca de las ventas anuales de 50 pequeas tiendas de tornillos:
Ve
(m
11
13
14
15
16
To
a) Encuentre la mediana, la media y la moda de las ventas y explique su significado.
b) Se pretende crear un nuevo impuesto y existen dos alternativas 1ra: 5 % de las ventas,
2da: 9 (miles de $ al ao). Encuentre el nuevo valor de la media con estas disminuciones y
recomiende la mejor alternativa para los propietarios.
7. Dos empresas presentaron muestras de alambre de cobre para su prueba. Las piezas de muestra de cada
empresa se probaron en cuanto a la resistencia a la tensin y los resultados se organizaron en una distribucin
de frecuencias. Despus se evaluaron la media de cada distribucin.
Estadsti C C
co o o
m m
p p
a a
a
D a
o B
m e
a t
z
Media 5 6
aritmtic 0 0
a 0 0
Tamao 1 8
de la 0 0
muestra 0
Cul es la media aritmtica si se considera a las dos compaas juntas?
8. La media aritmtica de los salarios pagados a los empleados de una empresa ascendi a 700 $. La media
aritmtica de los hombres y mujeres fue respectivamente de 800 $ y 630 $. Determine la cantidad de hombres y
mujeres empleados en dicha empresa si en total existen 130 empleados.
Distribuciones de probabilidad
Funcin de Cuanta
1 4
8
4
14
7 9
5
1
2
1
42
a) Halle la mediana.
b) Encuentre la amplitud y desviacin intercuartlica e interprtelas.
c) Determine la amplitud centlica.
d) Entre qu valores se encuentra el 80% central de la distribucin?.
e) Realice un diagrama de caja y bigotes e interprete su significado.
12. En muchos procesos de manufactura hay un trmino llamadotrabajo en proceso (abreviado WIP,
por sus siglas en ingls de work-in-process) En una planta manufacturera de libros esto representa el tiempo
que se necesita para doblar, unir, coser, proteger con guardas, y encuadernar las hojas que salen de la prensa.
Los siguientes datos representan muestras de 20 libros en dos plantas de produccin y el tiempo de
procesamiento (definido como el tiempo en das contado desde que el libro llega a las prensas hasta que se
empaca en cajas) para estas actividades.
Planta A
Planta B
Para cada una de las plantas, calcule:
a) La media aritmtica.
b) La mediana.
c) Primer y tercer cuartil.
d) El rango intercuartlico.
e) La desviacin estndar.
f) El coeficiente de variacin.
g) El coeficiente de asimetra.
h) El coeficiente de curtosis.
i) Existen diferencias entre las dos plantas?
Propiedades de la media y la varianza
2. El gerente de una empresa que fabrica papel desea analizar los sueldos que paga a sus
trabajadores. Para ello, los dividi en tres grupos. Los datos en $ para cada grupo se muestran
a continuacin:
a) Halle la media aritmtica y la varianza de todos los trabajadores de la empresa.
Si se considera al grupo total de trabajadores:
b) Suponga que la media de los sueldos de los trabajadores hombres fue de 300 $ y la de
las mujeres de 254 $. Determine los porcentajes de hombres y mujeres empleados en la
empresa.
c) El gerente quiere analizar cul de las dos polticas siguientes implementar para todos sus
trabajadores de modo de elevar el sueldo promedio. Aydelo en su decisin!.
11 - 13; 18%
5 - 11; 28%
a) Halle la media y la varianza de la distribucin. Cul es el sueldo mximo del 75% de los
trabajadores?.
b) Considere dos grupos de trabajadores (el primer grupo formado por 30 trabajadores y el
segundo por 20) y determine si es la intra o la intervarianza la que influye ms en la
variabilidad total de la distribucin.
8. En una fundicin se muestre un gran nmero de hornos con los siguientes resultados de
temperaturas:
Esta
dsti
co
[C]
Med
ia
arit
mti
ca
Med
iana
Mod
a
Des
viaci
n
est
ndar
Des
viaci
n
cuar
tlic
a
Des
viaci
n
med
ia
Nm
ero
de
horn
os
a) Midiendo las dispersiones relativas, cul de las lneas tiene temperatura ms
homognea? Qu puede decir de la simetra de las tres lneas?
b) Encontrar la media de las temperaturas de toda la fundicin. Para mejorar la eficiencia se
propone aumentar las temperaturas en 50C o aumentar el 20% de su temperatura a cada
horno. Cul recomendara usted, si se desea mantener la variabilidad constante?
c) Hoy se registr en la lnea 1 una temperatura constante de 239 C, en la lnea 2 una de
242 C, y en la lnea 3 una de 243 C. Qu horno tuvo una temperatura relativa ms alta?
9. Un estudiante de Diseo Grfico defendi su tesis y obtuvo una calificacin de 84.2. La calificacin media
de una tesis en esta carrera es de 90.2 con una desviacin estndar de 10 puntos. Su hermano, que estudi
Administracin de Empresas defender su tesis prximamente. La calificacin media de las tesis de la carrera es
de 95.5 con una desviacin estndar de 23. Sus padres decidieron que al mejor de ellos le compraran un auto
ltimo modelo. Cul es la nota mnima que deber sacarse el hermano para recibir el premio? (Trabajar con un
decimal).
10.Un conjunto de 20 valores tiene una media igual a 50; otro conjunto de 20 valores tiene una
media igual a 30; la desviacin estndar de los 40 valores considerados conjuntamente es igual a
10. Calcule el coeficiente de variacin del conjunto de los 40 nmeros.
11.Multiplicando por 2 cada uno de los valores de la variable x: 3, 2, 0, 5, se obtiene la serie y: 6, 4,
0, 10. Compruebe que ambas series tienen el mismo coeficiente de variacin.