Professional Documents
Culture Documents
c
u
l
a
(
e
n
m
i
l
e
s
)
Varones
Mujeres
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
19
Poblacin total de la ciudad de Crdoba. Censo 2001.
0
50.000
100.000
150.000
200.000
250.000
300.000
0
-
4
5
-
9
1
0
-
1
4
1
5
-
1
9
2
0
-
2
4
2
5
-
2
9
3
0
-
3
4
3
5
-
3
9
4
0
-
4
4
4
5
-
4
9
5
0
-
5
4
5
5
-
5
9
6
0
-
6
4
6
5
-
6
9
7
0
-
7
4
7
5
-
7
9
8
0
-
8
4
8
5
y
m
s
Grupos deedad
P
o
b
l
a
c
i
n
Mujeres
Varones
Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001..
Grfico de reas 100% apiladas:
Presenta la tendencia del porcentaje que aporta cada valor o categora a travs del tiempo
(en este caso a diferentes edades).
Poblacin total de la ciudad de Crdoba. Censo 2001.
0%
20%
40%
60%
80%
100%
0
-
4
5
-
9
1
0
-
1
4
1
5
-
1
9
2
0
-
2
4
2
5
-
2
9
3
0
-
3
4
3
5
-
3
9
4
0
-
4
4
4
5
-
4
9
5
0
-
5
4
5
5
-
5
9
6
0
-
6
4
6
5
-
6
9
7
0
-
7
4
7
5
-
7
9
8
0
-
8
4
8
5
y
m
s
Grupos deedad
P
o
b
l
a
c
i
n
Mujeres
Varones
Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001..
Grfico de Barras agrupadas
Compara valores o categoras de una variable para cada uno de los valores o categoras de
otra variable. Cada variable debe tener pocas categoras, de lo contrario es muy confuso.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
20
Cobertura de salud de la poblacin de la ciudad y provincia de
Crdoba, por grandes grupos de edad. 2001
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
0-14 15-64 65 y ms 0-14 15-64 65 y ms
Capital Provincia
Tiene
No tiene
Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001.
Grfico de Barras apiladas
Compara entre categoras de una variable, el aporte de cada valor al total de una categora
de la otra variable.
Poblacin por grupos de edad y sexo, en la ciudad y provincia
de Crdoba. 2001.
0
200.000
400.000
600.000
800.000
1.000.000
1.200.000
1.400.000
1.600.000
1.800.000
Varones Mujeres Varones Mujeres
Capital Provincia
65 y ms
15-64
0-14
Fuente: INDEC, Censo de Poblacin , Hogares y Vivienda, 2001.
Grfico de Barras 100% apiladas:
Compara entre categoras de una variable, el porcentaje que cada valor, de la otra variable,
aporta al total.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
21
Importancia relativa de cada grupo de edad, en la ciudad y
provincia de Crdoba, por sexo. 2001.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
Varones Mujeres Varones Mujeres
Capital Provincia
65 y ms
15-64
0-14
Diagrama de dispersin:
Compara pares de valores de dos variables cuantitativas (una puede ser aos).
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
22
PARMETROS DE POSICIN Y DISPERSIN
Medidas descriptivas
Hay tres tipos de medidas que describen la distribucin de frecuencias de un conjunto de
datos. Las medidas descriptivas que se calculan con base en los datos de una poblacin se
denominan parmetros. Si las medidas se calculan con base en los datos de una muestra,
se conviene en llamarlos estadsticos.
1) Las MEDIDAS DE POSICIN O DE TENDENCIA CENTRAL, es un nmero que
representa el valor central de un conjunto de datos. La mayora de las distribuciones
muestran una tendencia definida a agruparse en torno a un cierto punto, este punto es
una medida de posicin o promedio.
Las medidas de posicin ms comunes son: media aritmtica, mediana, modo, cuartiles,
deciles y percentiles.
Media Aritmtica
Datos sin agrupar (serie simple): Si los datos no estn agrupados la media se calcula
sumando todos los valores y dividindolos por el nmero de observaciones.
Si tenemos 6 observaciones: x
1
, x
2
, x
3
, x
4
, x
5
, x
6
Se calcula haciendo: M(x) = X =
6
x x x x x x 6 5 4 3 2 1 + + + + +
En general para n observaciones, se expresa: M(x) = x =
n
x
n
i
1
Datos agrupados: Se utiliza la marca de clase para representar el intervalo y realizar el
clculo. La media se calcula sumando los productos de la marca de clase por la frecuencia
del mismo intervalo, y dividiendo la sumatoria por el nmero de observaciones.
En smbolos:
M(y) = y =
n
n y i
k
i
1
.
=
k
i ih y
1
siendo k el nmero de intervalos.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
23
Propiedades de la media aritmtica:
1. La suma de los desvos con respecto a la media aritmtica es siempre igual a cero.
Se entiende por desvos (z
i
) a la diferencia entre los valores de la variable y un valor
constante, en este caso ese valor es la media.
z
i
= y
i
y = y
i
M(y)
La propiedad se simboliza:
0
1
=
k
i in z
Se distribuye el sumatorio:
Se reemplaza el sumatorio de n
i
por n y luego se indica la frmula de la media, al final se
cancela n y se obtienen dos expresiones iguales:
= n y n y
k
i i .
1
k k
i i
i i n
n
n y
n y
1 1
=
=
k k
i i i i n y n y
1 1
0
2. La suma de los cuadrados de los desvos con respecto a la media, debidamente
ponderados, da un mnimo. Significa que la suma de los cuadrados de los desvos con
respecto a la media, es siempre menor que el valor que se obtiene cuando los desvos
son respecto a cualquier otra constante.
En smbolos:
mnimo
1
2
=
i
k
n z
i
[y
i
M(y)]
2
. n
i
= mnimo
3. La media de una constante es igual a dicha constante.
En smbolos: M(y) = a siendo y
i
= a
Aplicando la definicin de media: M(y) = a
n
an
n
n a
n
n a i i
= = =
.
=
k
i
k
i i
k
i i n y n y n z
1 1 1
=
k
i in z
1
=
k k
i i )ni y
i
(y n z
1 1
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
24
4. La media de una constante por una variable es igual a la constante por la media de la
variable.
En smbolos: M(a.y) = a .M(y)
M(a.y) = ) (
.
y aM
n
n y
a
n
n ay i i i i
= =
5. La media de una variable ms una constante, es igual a la media de la variable ms la
constante.
En smbolos: M(y + a) = M(y) + a
Aplicando la definicin de media aritmtica, distribuyendo el sumatorio y reemplazando
por expresiones idnticas, se obtiene:
M(y + a)=
= a y M
n
n
a y M
n
n a
n
n y
n
n a n y
n
n a y i i i i i i i i i
+ = + = + =
+
=
+
) ( ) (
. . . . ). (
6. La media de una muestra es igual a la media de las submuestras calculada con
ponderaciones iguales a los tamaos de las submuestras.
M(y) =
n
n M n y M n y M n y M k k. ... ). ( ). ( ). ( 3 3 2 2 1 1 + + + +
siendo n= n
1
+ n
2
+...+ n
7. La media aritmtica de una suma de variables, expresadas en la misma unidad de
medida, es igual a la suma de las medias aritmticas de cada una de las variables.
M(x + y +w) = M(x) + M(y) + M(w)
Mediana (Me)
La mediana es el elemento central, en un conjunto de observaciones dispuestas en orden de
magnitud.
Datos no agrupados: La mediana es el valor correspondiente a un punto de una escala con
respecto al cual la mitad superior agrupa igual cantidad de valores que la mitad inferior,
ordenados de menor a mayor.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
25
El orden de elemento de la mediana =
2
1 + n
Si el nmero de observaciones es impar, la mediana es el valor central. Si el nmero de
observaciones es par, la mediana ser el valor promedio de las dos observaciones centrales.
Ejemplo: Si tenemos cinco observaciones de edades: 22 25 20 26 21
Se ordenan: 20 21 22 25 26 y resulta que 22 es la mediana, ya que separa la serie en dos
partes iguales. Me= 22 aos
Si se agrega una observacin de 27 aos, n=6.
20 21 22 25 26 27 en este caso se promedian los dos valores centrales: (22 + 25)/2 = 23.5
Me = 23.5 aos
Datos agrupados: Se utiliza una frmula de interpolacin:
Me= y
j-1
+ c.
j
j
n
N
n
1
2
Siendo: y
j-1
es el extremo inferior del intervalo j
c es la amplitud del intervalo
N
j-1
es la frecuencia absoluta acumulada del intervalo anterior a j
n
j
es la frecuencia absoluta del intervalo j
Para ubicar el intervalo j, o clase mediana, se divide por dos el nmero total de
observaciones y se busca ese resultado en la columna de las frecuencias absolutas
acumuladas. La primera frecuencia acumulada que supere el resultado de n/2, es N
j
y el
intervalo al cual ella pertenece es el j.
Propiedad de la mediana:
La suma de los valores absolutos de los desvos de la variable respecto de la mediana,
debidamente ponderados, da como resultado un mnimo.
[ y
i
Me(y)] . n
i
= mnimo
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
26
Moda, modo o valor modal
El modo se define como el valor o categora de la variable que se presenta con la mayor
frecuencia. Cuando existe slo un modo, la distribucin se llama unimodal, si se presentan
dos valores de mayor frecuencia, la distribucin es bimodal.
Caractersticas de las medidas de tendencia central.
La media es el promedio de uso ms frecuente, para calcularla se necesitan todos los
valores observados. Si todos ellos se hallan agrupados cerca de la media, y si la
distribucin es algo simtrica, es vlido considerar a la media como un promedio
representativo. Los valores extremadamente atpicos (outliers) la afectan indebidamente y
debido a ello el resultado es escasamente representativo; se dice que la media es una
medida no resistente.
Por el contrario, la mediana no se encuentra afectada por los valores extremos y representa
mejor a una distribucin cuando ella es asimtrica. Adems es posible calcular la mediana
aunque la distribucin sea de extremos abiertos. La mediana es una medida de posicin
resistente.
El modo es de empleo apropiado si un valor prximo al centro de la distribucin se repite
con mayor frecuencia. Adems, tambin puede obtenerse si los extremos son abiertos.
Relacin entre la media, la mediana y el modo.
Si se representan los datos de una distribucin en un histograma o un polgono de
frecuencias con muchas clases, la curva se suaviza y se aproxima a una campana. Si una
distribucin es simtrica se representa por una curva que puede dividirse con una lnea
vertical en dos partes iguales, que son como imgenes en un espejo.
Si una distribucin es simtrica (Figura B), la media, la mediana y el modo coinciden (G).
En cambio, si la distribucin es asimtrica hacia la derecha (Figura A), es comn que se
ubique primero el modo (D), luego la mediana (E)y por ltimo la media (F). Si fuera
asimtrica hacia la izquierda (Figura C), se ubicara primero la media (H) y por ltimo el
modo (J).
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
27
Si la distribucin es moderadamente asimtrica, es posible hallar un valor aproximado de
uno de los promedios conociendo los otros dos.
Modo = media 3 (media mediana)
Mediana =
3
modo media 2 +
Media =
2
modo mediana 3
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
28
Cuartiles:
Los cuartiles dividen la serie en cuatro partes que contienen igual nmero de
observaciones.
El primer cuartil es la mediana de las observaciones que son menores a la mediana o
segundo cuartil. El tercer cuartil es la mediana de las observaciones mayores a la mediana.
Datos no agrupados: Si la serie es no agrupada se divide el nmero de observaciones por
cuatro y esto nos da un nmero de orden de los datos ordenados, se toma el
inmediatamente superior si el resultado es un decimal o el promedio de los datos
correspondientes al orden dado y el inmediato superior, si el resultado es entero.
Datos agrupados: Se utiliza frmula de interpolacin similar a la empleada para calcular la
mediana.
Primer cuartil = Q
1
= y
j-1
+ c.
j
j
n
N
n
1
4
Tercer cuartil = Q
3
= y
j-1
+ c.
j
j
n
N
n
1
4
3
Diagrama de caja o boxplot
Es un diagrama que permite ubicar en uno de los ejes los siguientes valores:
Mnimo, primer cuartil, mediana, tercer cuartil y mximo. El otro eje no es una escala sirve
de apoyo nicamente.
Ejemplo: suponemos que los siguientes datos se refieren a las ventas diarias de un
comercio (en miles de $) durante 50 das.
2 6 6 8 9 10 11 11 12 12
13 14 14 14 15 15 16 17 18 18
18 19 19 20 20 20 20 22 23 26
27 28 29 30 31 32 33 33 34 36
37 39 40 43 45 52 61 63 64 69
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
29
Mediana Mnimo Mximo Cuartil 1 Cuartil 3
20 2 69 14 33
Las medidas de tendencia central y las escalas de medicin:
El clculo de la media requiere una escala de intervalo o proporcional.
La mediana, en cambio, puede emplearse tambin en las escalas ordinales.
El modo, puede utilizarse en cualquier tipo de escala, ya que designa al valor de mayor
frecuencia y no requiere de un clculo sofisticado.
2) Las MEDIDAS DE DISPERSIN O VARIABILIDAD, nos permiten conocer la
homogeneidad o concentracin de los datos acerca de una medida de tendencia central.
Se conocen varias medidas de dispersin, algunas de clculo muy sencillo como el
recorrido y el rango intercuartlico; otras de clculo bastante complicado como la varianza
y la desviacin estndar.
Recorrido
Es la diferencia entre el valor mximo y mnimo. Como es una medida basada en dos
datos solamente no es muy til para medir la variabilidad, ya que la inclusin de los casos
extremos en una muestra es cuestin del azar.
Max = 69.00000
Min = 2.000000
75% = 33.00000
25% = 14.00000
Median value:
Med = 20.00000
Ventas diarias de la empresa XX, agosto-setiembre 1999.
Miles de $
0
10
20
30
40
50
60
70
80
VENTAS
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
30
Rango intercuartlico
El rango intercuartlico es la distancia entre el tercer y el primer cuartil:
RI = Q
3
Q
1
Nos da idea de la homogeneidad del 50% central de los datos. Los cuartiles y el rango
intercuartlico son medidas resistentes, ya que no se encuentran afectados por valores
atpicos de la variable.
El RI suele ser til para determinar la existencia de valores outliers. Se construye un
intervalo cuyos extremos se obtienen multiplicando el RI por 1.5 y ese resultado se resta de
Q
1
y se suma de Q
3
.
Q
1
1.5 RI = y
RI-1
Q
3
+ 1.5 RI = y
RI
Aquellos valores de la variable que no estn incluidas en el intervalo se pueden considerar
outliers.
y
RI-1
> outliers > y
RI
Esta regla de deteccin no debe reemplazar el sentido comn en la determinacin de
valores atpicos.
La desviacin cuartlica es la mitad del RI, sera de utilidad para evaluar la simetra de la
distribucin. Una distribucin puede considerarse simtrica si la desviacin cuartlica
coincide con la diferencia entre la mediana y el primer cuartil o entre el tercer cuartil y la
mediana.
Simtrica RI/ 2 = Me Q
1
= Q
3
Me
Varianza
La varianza es la media aritmtica de los cuadrados de las desviaciones respecto a la media
aritmtica.
Datos no agrupados: La varianza de n observaciones es la suma de los desvos con
respecto a la media aritmtica, elevados al cuadrado, dividida por el total de observaciones.
V(x) =
n
x M x
n
i
2
1
)] ( [
=
n
x
i
2
- [M(x)]
2
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
31
Datos agrupados: Se debe tener en cuenta que la media es ponderada por la frecuencia de
cada clase.
V(y) =
n
n y M y i i
. )] ( [
2
=
n
n y i
i
.
2
- [M(y)]
2
Los desvos se elevan al cuadrado, ya que por propiedad de la media la suma de los desvos
respecto a ella es igual a cero. La varianza as calculada est en una unidad de medida
diferente a la que tienen los datos originales. Se resuelve tomando la raz cuadrada y de esa
manera se obtiene la desviacin estndar.
Desviacin estndar
Datos no agrupados: DS(x) = ) (x V
Datos agrupados: DS(y) = ) ( y V
La desviacin estndar mide la dispersin de los datos alrededor de la media aritmtica, y
slo es til si se utiliza la media como medida de tendencia central. Si la varianza o la
desviacin estndar es igual a cero indica que no existe dispersin y que todos los datos
tienen el mismo valor. De otra forma siempre es positiva.
La desviacin estndar tiene utilidad de tipo comparativo, ya que el nmero en s mismo
no expresa grado de variabilidad, ya que depende de la unidad de medida y de la media.
Las DS de dos distribuciones pueden emplearse para comparar la variabilidad de ambas si
las medias son similares y de esa manera se evala la representatividad de esas medidas de
posicin. A mayor dispersin, menor representatividad de la media.
Otra aplicacin de la DS como instrumento de anlisis se da en su relacin con la media de
una distribucin normal (simtrica). En una distribucin normal, el 68,3% de los datos
quedan entre la media menos una DS y la media ms una DS. Por otra parte, la media
2DS incluye aproximadamente el 95% de las observaciones. La media 3DS incluye
alrededor de 99,7% de los datos.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
32
Coeficiente de variacin
El coeficiente de variacin es una medida de dispersin relativa, que permite comparar
dos distribuciones expresadas en cualquier unidad de medida, fue ideado por Karl Pearson
(1857-1936).
CV =
) ( y M
DS
. 100
Ser ms dispersa la distribucin que posea el CV mayor, y menos dispersa la que presente
un CV menor. Se debe recordar que la dispersin est en relacin inversa con la
representatividad de la media. Quiere decir que la distribucin que posea el mayor CV,
tendr a su vez la media menos representativa y viceversa.
3) Medidas de Asimetra
En una distribucin simtrica, la media, la mediana y el modo son iguales. Esto significa
que el valor de la variable o clase central es el de mayor frecuencia, y que las frecuencias
que poseen los valores mayores a ella son similares a las frecuencias de los valores
menores.
Karl Pearson ide tambin un coeficiente de Asimetra para medir la magnitud y la
direccin de la asimetra:
As
P
=
DS
Me y M ] ) ( [ 3
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
33
Hay otro ndice de asimetra que est referido a la relacin entre los cuartiles y la mediana,
es el ndice de Yule:
As
y
=
Me
Me Q Q
2
2 3 1 +
Ambos ndices se interpretan de la misma manera:
Si el coeficiente es cero la distribucin es simtrica. As=0 simetra
Si el coeficiente es negativo, la asimetra es hacia la izquierda. As<0 asimetra
negativa
Si el coeficiente es positivo, la asimetra es hacia la derecha. As>0 asimetra
positiva
4) Medidas de curtosis o puntiagudez
Estas medidas miden la deformacin vertical de la curva.
No especificaremos su clculo, ya que no desarrollamos contenidos necesarios en ello.
Slo mencionaremos que una curtosis sin deformacin es la de la curva normal.
Si la puntiagudez es mayor que la que presenta la distribucin normal, la distribucin es
leptocrtica. Si es menor es platicrtica.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
34
GUA DE EJERCICIOS UNIDAD I
1- En cada una de las siguientes situaciones, indicar: a) Poblacin que es objeto de
estudio, b) Muestra, c) unidad estadstica y d) Tipo de variable que se analiza.
Se desea investigar la proporcin de desempleados que hay en la provincia de Crdoba
en un momento determinado; para ello se realiza la EPH del primer semestre del ao y
se seleccionan aleatoriamente 1.000 personas en las edades correspondientes a la PEA.
Se desea investigar el coeficiente intelectual de los alumnos que ingresan a una
institucin universitaria, para ello se realiza un test apropiado a todos los ingresantes a
la carrera en un momento determinado.
En la produccin de cubiertas de una determinada fbrica, se realiza un estudio para
determinar el tiempo promedio de duracin de las mismas, para ello se someten a
prueba todas las cubiertas producidas el primer da del mes.
Un tcnico de control de calidad de una lnea de armado de automviles, selecciona
determinadas piezas y anota para cada una de ellas la siguiente informacin: si est o no
defectuosa, el nmero de identificacin de la persona que coloc la pieza y el peso de la
pieza.
Los directivos de una institucin educativa privada de nuestra ciudad desean conocer la
opinin de los padres de sus alumnos acerca de los servicios que les brinda la
institucin. Para ello seleccionan una muestra de 300 alumnos, elegidos aleatoriamente
de los registros de las distintas secciones.
El Ministerio de Educacin de la provincia desea conocer la evolucin de la matrcula
escolar de nivel medio en la Provincia. Para ello se seleccionaron 400 escuelas de los
distintos departamentos de Crdoba.
2- La siguiente tabla presenta los montos de 40 prstamos personales de una entidad
financiera de consumidores, ordenados por su magnitud (en $):
300 550 850 1100 1500
300 560 850 1200 1600
350 600 900 1200 1650
350 600 900 1250 1800
450 685 950 1250 1900
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
35
450 700 1000 1300 2000
500 750 1000 1400 2500
500 750 1000 1500 3000
a) Clasificar los datos en una tabla de frecuencias con 7 intervalos.
b) Representar grficamente las frecuencias absolutas y relativas, simples y
acumuladas.
c) Calcular la media, el modo, la mediana y los cuartiles.
d) Calcular recorrido intercuartlico, varianza y desviacin estandar.
e) Graficar en Boxplot.
f) Determinar si existen valores outliers, utilizando como extremos Q
1
- 1.5RI y Q
3
+
1.5RI
3- Una muestra de 20 obreros de una pequea compaa obtuvo los siguientes salarios en
una semana determinada, dispuestos en orden ascendente: 440, 440, 440, 440, 440,
440, 440, 440, 555, 555, 660, 660, 680, 680, 680, 700, 730, 730, 730, 730. Presentar la
informacin a travs de una distribucin de frecuencias.
4- Los salarios semanales de un grupo de profesionales son los siguientes:
153 123 129 132 147 138 137 134 131 147
134 148 125 139 146 145 148 135 152 128
138 138 122 146 137 151 145 124 132 138
137 146 138 146 140 137 129 126 117 136
128 127 146 144 137 128 142 141 136 138
Construir una distribucin de frecuencias con ms de 5 intervalos.
5- Los datos correspondientes a gastos por consumo semanal de alimentos per cpita
familias seleccionada en la provincia de Crdoba, son los siguientes:
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
36
Consumo per cpita en $ N de
familias
80-100 4
100-120 10
120-140 16
140-160 18
160-180 28
180-200 22
200-220 2
a) Calcular medidas de posicin y dispersin solicitadas en el ejercicio anterior.
b) Indicar qu porcentaje de familias consume menos de $140.
c) Indicar qu porcentaje consume ms de $100.
6- Una empresa de gas y electricidad utiliza varias fuentes para generar energa. En el
cuadro siguiente se presentan las fuentes y los porcentajes de energa obtenidos de cada
una, el ao pasado y hace 10 aos.
Fuente de energa Hace 10 aos
%
Ao pasado
%
Carbn 16.8 62.6
Nuclear 26.9 34.1
Gas 55.9 2.9
Otros 0.4 0.4
Total 100.0 100.0
a) Representar grficamente de modo que pueda observarse la importancia de cada fuente
de energa para los dos momentos analizados.
b) Representar en forma grfica, reflejando la importancia de cada fuente en el ltimo
periodo.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
37
7- La siguiente tabla nos proporciona informacin referente a la demanda laboral en dos
sectores, en la ciudad de Crdoba expresada en funcin del nmero de avisos
clasificados publicados en un diario local, en un periodo determinado:
Demanda laboral
Mes Servicio
domstico
Oficina y
comercio
Junio 30 70
Julio 45 87
Agosto 46 92
Setiembre 87 160
Octubre 47 180
Noviembre 60 205
Diciembre 40 150
Enero 46 130
Febrero 47 180
Marzo 56 210
Abril 68 265
Mayo 57 236
Junio 56 255
Julio 65 220
Agosto 60 276
Setiembre 55 295
a) Representar en forma grfica la informacin suministrada de modo tal que se observe la
evolucin de las variables analizadas.
b) Construir un grfico de zonas.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
38
8- Se hace un registro del tiempo que tardan en frenar sobre superficie hmeda 25
automviles conducidos a 80 km/h . Los datos en segundos se muestran en una
representacin de tallo y hojas:
6 3 7 6 3 9
7 4 2 0 1 1 2 0 5
8 5 4 5 5 6
9 4 1 0 0 5
10 5 4
a) Determinar la media y la desviacin estndar de estos tiempos de frenado.
b) Determinar qu porcentaje de observaciones se halla a una y dos desviaciones estndar
respecto de la media, (regla emprica).
9- Una empresa especializada en la fabricacin de ejes para mquina est planeando la
compra de una mquina de corte controlada por computadora. El ingeniero de la
empresa prueba dos mquinas de diferentes fabricantes. Los dimetros en centmetros
de las barras cortadas por la mquina fueron los siguientes :
Mquina 1 : 2.001 2.000 2.004 1.998 1.997
Mquina 2 : 2.002 2.008 1.995 1.990 2.005
a) Calcular la media y la desviacin estndar para cada caso y comentar acerca de los
resultados obtenidos de las dos mquinas.
b) Indicar qu promedios es ms representativo.
10- Suponga que los precios al menudeo de determinados artculos han sufrido los cambios
que se muestran en la tabla siguiente:
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
39
Artculo Aumento % Gasto
mensual
promedio
Leche 10 2000
Carne molida -6 3000
Ropa -8 3000
Combustible 20 5000
a) Determinar el cambio porcentual promedio de los precios al menudeo sin referencia al
promedio de gastos que se incluye en la tabla.
b) Determinar el cambio porcentual promedio de los precios al menudeo ponderado por el
promedio de gastos.
c) Cul de los dos promedios calculados sera ms apropiado como medida del impacto
de los cambios de los precios sobre este consumidor especfico ?
11- Tres profesores de Estadstica registran una calificacin media en sus estudiantes de
75, 69, 89 puntos respectivamente; siendo el nmero de alumnos para cada clase de 35,
18 y 27 respectivamente.
Determinar la calificacin media para todos los estudiantes.
12- La empresa A tiene 100 empleados con sueldo promedio mensual de $1700, la empresa
B tiene 200 empleados con sueldo promedio mensual de $1500.
a) Cul es el promedio mensual de las dos empresas en conjunto ?
b) Si a las dos empresas se le agrega una tercera con 50 empleados que registran un sueldo
promedio $2000, Cul es el sueldo promedio de las tres ?
13- Determinar los nuevos promedios, si en las empresas del punto anterior se producen los
siguientes cambios:
a) Aumentan todos los salarios $100.
b) Aumentan todos los salarios un 25%.
c) Aumentan todos los salarios un 15% ms $50.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
40
14- La siguiente informacin corresponde a los saldos en cuenta corriente de un grupo de
clientes de un banco :
Saldos n
i
200-270 1
270-340 7
340-410 6
410-480 4
480-550 2
a) Calcular el saldo promedio y la mediana.
b) Calcular la desviacin estndar.
c) Aplicar la regla emprica restando y sumando 1 y 2 desviacin estndar a la media.
d) Calcular la nueva media y varianza si se establece un impuesto del 7% sobre los saldos.
15- Disponemos de la siguiente informacin :
Medidas de dispersin
y posicin.
Distribucin
A
Distribucin
B
Media 110 100
Mediana 100 90
Desviacin estndar 20 20
a) Cul es la distribucin ms dispersa ?
b) Cul es la media ms representativa ?
c) Cmo es la asimetra de cada una de ellas ?
16- La informacin obtenida de 30 establecimientos textiles, referida a personal ocupado y
a sus ingresos por ventas en millones de $, es la siguiente :
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
41
Ventas \ personal
ocupado
10-30 30-50 50-70 70-90 Frecuencias
marginales
0-100 4 2
100-200 4 5
200-300 6 3 1
300-400 2 3
a) Calcular la media aritmtica de las ventas.
b) Calcular la media del personal ocupado.
c) Cul de las dos medias es ms representativa de los datos?
17- La siguiente informacin correspondiente a empleados administrativos de una empresa
que cuenta con 60 empleados, en ese sector, discriminados por sexo, se refiere al
nmero de errores de facturacin cometidos por 24 empleados de la misma:
0V 1V 1M 0M 2V 3M 3V 6V 6M 5M 4M 4V
5M 5V 3V 3V 1M 2V 2M 4V 3V 3M 4M 2V
a) Presentar los datos en tablas y grficos, con los respectivos encabezados y ttulos.
b) Analizar la informacin con medidas descriptivas que considere convenientes.
20. Responder las siguientes preguntas para reforzar los aspectos tericos:
a. Qu medida de tendencia central es la ms sensible a los valores extremos?
b. Cuando un conjunto de datos tiene valores extremos, qu medida de tendencia central
conviene usar?
c. Si uno de los valores mayores a la media de los datos se sustituye por un valor muy
grande, qu le pasa a la media: aumenta, disminuye o se mantiene igual?, de qu manera
afecta a la moda?.
d. Cul es la diferencia entre un parmetro y un estadstico?.
e. Cul es la diferencia entre una distribucin simtrica y una sesgada?.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
42
f. Indique donde se localizan la media, la mediana y la moda en cada una de las
siguientes distribuciones:
i. Sesgada a la derecha.
ii. Simtrica.
iii. Sesgada a la izquierda.
iv. Valores concentrados en el extremo superior de la escala.
v. Valores atpicos en el extremo superior.
g. Qu forma tiene una distribucin descrita por las siguientes medidas: media = 46,
mediana = 42 y moda = 39?
h. Qu forma tiene una distribucin descrita por las siguientes medidas: media = 105,
mediana = 110 y moda = 115 ?
21. Calcular las medidas de posicin y dispersin estudiadas en los ejercicios que no se
hayan solicitado.
22. Representar en forma grfica la informacin del ejercicio 18.
LISTADO DE PREGUNTAS O TEMAS, PARA ORIENTAR EL ESTUDIO DE LOS
ALUMNOS DE ESTADSTICA (NO ES EXHAUSTIVA).
1. Concepto de Estadstica Inferencial.
2. Clasificacin de variables.
3. Tipos de escala de medicin.
4. Caractersticas de un cuestionario bien formulado.
5. Qu tipo de grfico es ms adecuado para cada tipo de variable, en las uni y
bidimensionales?
6. Clasificacin de las medidas descriptivas.
7. Cul es la utilidad de cada medida?
8. Propiedades de la media y la mediana. Aplicacin.
9. Qu medidas de tendencia central pueden calcularse con las diferentes variables y/o
escalas?
10. Para qu sirve el coeficiente de variacin?
11. Para qu sirve la Regresin por mnimos cuadrados y la correlacin entre variables?
12. Interpretacin del coeficiente de correlacin y de determinacin.
PDF created with pdfFactory trial version www.pdffactory.com
ESTADSTICA
Prof. Mara Franci lvarez - Notas de Ctedra
43
PRCTICO:
1. De una base de datos creada a partir de una encuesta realizada en un grupo de
estudiantes, se tomaron algunas variables y se calcularon las siguientes medidas:
Variables Media Mediana Q
1
Q
3
Varianza DS
Edad 22 19 18 24 25
Estado civil 3.5 3 1 5 16
Altura 1.69 1.68 1.65 1.73 0.10
Nmero de
integrantes
3 3 2 4 1.5
Sexo 1.5 1.6 1.3 1.7 0.2
Instruccin 2.5 2 1.5 3 9
Nmero de horas
de trabajo
6 8 4 9 3
Se pide:
a- Determinar el tipo de variable o escala y las categoras o valores que puede asumir cada una
de ellas.
b- En qu variables las medidas calculadas no tienen sentido?.
c- Dentro de las variables cuantitativas, cual es la que muestra una mayor dispersin y cual
posee la media ms representativa. Por qu?
d- Analizar la asimetra de ALTURA.
e- Averiguar si existen valores atpicos (outliers) en EDAD, si el valor mnimo que se present
es 18 y el mximo 37. Si existen, en qu extremo de la distribucin estn ubicados ( inferior
o superior)?
f- Qu tipo/s de grfico es apropiado para representar las frecuencias relativas de SEXO,
ALTURA Y NMERO DE INTEGRANTES.
PDF created with pdfFactory trial version www.pdffactory.com