You are on page 1of 8

2.1.

Los siguientes datos se obtuvieron contando el número de vehículos que cruzan por un punto fijo de una avenida
durante intervalos de un minuto. Los 54 conteos se hicieron a lo largo del mismo día. Construya una tabla de dos
encabezados mostrando la frecuencia de cada medición obtenida.

Número de vehículos frecuencia Número de vehículos frecuencia


20 3 30 2
Número de vehículos por minuto 21 1 31 3
28 30 25 36 24 27 33 26 29 22 3 32 3
32 25 20 28 20 27 31 23 27 23 3 33 2
24 34 25 24 22 26 28 38 32 24 4 34 2
26 30 37 21 28 31 38 28 27 25 4 35 0
23 32 39 26 29 33 28 20 22 26 5 36 1
23 25 34 24 26 31 27 22 27 27 6 37 1
28 6 38 2
29 2 39 1

a) Porcentaje de minutos con 30 o mas vehículos.


a = 17 x 100 / 54 = 31.5%

b) Porcentaje de minutos con menos de 25 vehículos.


b = 14 x 100 / 54 = 25.9%

c) Porcentaje de minutos con mas de 28 y 32 o menos vehículos.


c = 10 x 100 / 54 = 18.5%

2.2. A continuación se presentan 103 determinaciones del contenido de ácido ascórbico en el jugo de toronja.

0,49 0,56 0,53 0,58 0,53 0,48 0,46 0,41 0,43 0,50
0,49 0,47 0,46 0,43 0,38 0,39 0,51 0,51 0,50 0,45
0,42 0,43 0,42 0,40 0,49 0,47 0,48 0,41 0,44 0,39
0,35 0,33 0,35 0,40 0,43 0,47 0,47 0,46 0,48 0,50
0,45 0,50 0,42 0,38 0,41 0,35 0,32 0,33 0,33 0,38
0,40 0,45 0,50 0,41 0,45 0,48 0,43 0,48 0,47 0,37
0,42 0,36 0,34 0,34 0,36 0,42 0,40 0,44 0,47 0,46
0,50 0,44 0,43 0,41 0,40 0,38 0,41 0,36 0,36 0,34
0,36 0,40 0,43 0,47 0,48 0,46 0,34 0,37 0,34 0,35
0,37 0,39 0,38 0,41 0,46 0,43 0,42 0,44 0,38 0,36
0,36 0,33 0,33

a) ¿Que inconveniente tendría en este caso una tabla como la del problema 2.1?
R = La naturaleza de los datos ya no es discreta y hace difícil la clasificación de los datos.

b) Elija límites de clases adecuados para los datos y construya una tabla de frecuencias con límites y valor medio de
clase, frecuencias abs. y frecuencias rel., frecuencias abs. acumuladas y frecuencias rel. acumuladas.

limite de clase valor medio de clase Frecuencia abs. Frecuencia rel. Frecuencia abs. acum.. Frecuencia rel. acum..
(0,31 - 0,33] 0,32 6 0,058 6 0,058
(0,33 - 0,35] 0,34 9 0,087 15 0,146
(0,35 - 0,37] 0,36 10 0,097 25 0,243
(0,37 - 0,39] 0,38 9 0,087 34 0,33
(0,39 - 0,41] 0,40 13 0,126 47 0,456
(0,41 - 0,43] 0,42 14 0,136 61 0,592
(0,43 - 0,45] 0,44 8 0,078 69 0,67
(0,45 - 0,47] 0,46 13 0,126 82 0,796
(0,47 - 0,49] 0,48 9 0,087 91 0,883
(0,49 - 0,51] 0,50 8 0,078 99 0,961
(0,51 - 0,53] 0,52 0 0 99 0,961
(0,53 - 0,55] 0,54 2 0,019 101 0,981
(0,55 - 0,57] 0,56 1 0,01 102 0,99
(0,57 - 0,59] 0,58 1 0,01 103 1

-1-
2.3. Los siguientes son conteos del número de cromosomas en una herbácea.

24 28 28 28 27 28 29 29 29 30
29 30 30 29 31 29 31 24 28 29
28 24 28 29 31 31 24 28 29 30
29 28 30 33 28 34 38 28 32 33
28 31 32 34 39 40 31 35 27 28
31 35 30 29 24 28 31 32 28 32
28 29 30 33 41 30 29 42 28 29
32 33 30 28 28 31 32 28 29 30
28 28 31 34 34 28 36 31 36 35

a) Construya una tabla de dos encabezados mostrando la frecuencia de cada conteo.

número de cromosomas frecuencia número de cromosomas frecuencia


24 5 34 4
25 0 35 3
26 0 36 2
27 2 37 0
28 23 38 1
29 15 39 1
30 10 40 1
31 11 41 1
32 6 42 1
33 4

b) Construya una tabla de frecuencias que le permita contestar las siguientes preguntas:

valor de la clase Frecuencia abs. Frecuencia rel. Frecuencia abs. acum. Frecuencia rel. acum.
24 5 0,06 5 0,06
25 0 0 5 0,06
26 0 0 5 0,06
27 2 0,02 7 0,08
28 23 0,26 30 0,33
29 15 0,17 45 0,5
30 10 0,11 55 0,61
31 11 0,12 66 0,73
32 6 0,07 72 0,8
33 4 0,04 76 0,84
34 4 0,04 80 0,89
35 3 0,03 83 0,92
36 2 0,02 85 0,94
37 0 0 85 0,94
38 1 0,01 86 0,96
39 1 0,01 87 0,97
40 1 0,01 88 0,98
41 1 0,01 89 0,99
42 1 0,01 90 1

1. ¿Qué porcentaje de células tienen 32 cromosomas o menos?


De acuerdo con la frecuencia acumulada se obtiene que el 80% de las células tienen 32 cromosomas o menos

2. ¿Qué porcentaje de células tienen más de 28 cromosomas?


De acuerdo con la frecuencia acumulada se obtiene que el 33.3% de las células tienen 28 cromosomas o
menos, por lo tanto las células que tienen mas de 28 cromosomas es: 100 – 33.3 = 66.6%

-2-
3.1. En seguida se presenta el número de terremotos ocurridos en cada una de las horas lunares durante cierto tiempo.

hora lunar número de terremotos hora lunar número de terremotos hora lunar número de terremotos
(y) (x) (y) (x) (y) (x)
0 7 9 2 18 5
1 2 10 0 19 9
2 3 11 5 20 2
3 5 12 3 21 2
4 8 13 4 22 5
5 5 14 5 23 2
6 8 15 9 24 7
7 6 16 9
8 1 17 6

Con estos datos evalúe:

25 8
a) x i = 120 g) y i − 5 = 28 – 5 = 23
i =1 i =1
25 25
b) y i = 300 h) 2.8y i = 2.8(25) (300) = 21000
i =1 i =1
5 5
c) y i = 10 i) x i2 = 151
i =1 i =1
25 5 2
d) y i = 147 j) xi = 252 = 625
i =19 i =1
17
8
e) y i = 81 k) x i y i = 162
i =12
i =4
8
8 8
f) (y i − 5) = 28-40 = -12 l) xi y i = 27x22=594
i =1
i =4 i =4

3.2. Use la notación de sumatoria para abreviar las siguientes expresiones:


11
a) X8 + X9 + X10 + X11 = xi
i =8
5
b) X2 + X4 + X6 + X8 + X10 = x (2 i )
i =1
6
c) X1 + X22 + X33 + X44 + X55 + X66 = x ii
i =1
4
d) X1 + 2X2 + 3X3 + 4X4 = i ⋅ xi
i =1
10
e) 8X1 + 7X2 + 6X3 + 5X4 + 4X5 + 3X6 + 2X7 + 1X8 - X10 = (9 − i )x i
i =1
5
x 2 x3 x 4 x5 xi
f) x1 + + + + =
2 3 4 5 i =1 i

-3-
3.3. Demuestre las siguientes propiedades:
n n n
a) (x i + yi ) = xi + yi
i =1 i =1 i =1
n
(x i + y i ) = x1 + y 1 + x 2 + y 2 + x 3 + y 3 + + xn + y n
i =1
Se puede ordenar de la forma :
n n
(x1 + x 2 + x 3 + + x n ) + (y 1 + y 2 + y 3 + + yn ) = xi + yi
i =1 i =1
n n
b) (d + gx i ) = nd + g xi
i =1 i =1
n
(d + gx i ) = (d + gx 1 ) + (d + gx 2 ) + + (d + gx n ) = (d + d + d ) + (gx 1 + gx 2 + + gx n )
i =1 n veces
n
= nd + g (x1 + x 2 + + x n ) = nd + g xi
i =1

3.4. el gerente de una tienda de auto servicio que permanecerá abierta de las 6 de la mañana a las 12 de la noche,
cuenta un día el número de cliente que pasan por las cajas registradoras durante cada una de las 18 horas. Los
resultados obtenidos son: 21, 45, 30, 48, 56, 77, 60, 59, 23, 42, 36, 49, 73, 96, 90, 71, 42, 23. Calcule media y mediana
del número de clientes por hora.

Mediana: (48+49) / 2 =48.5

Media: 52.27

3.5. Calcule media, moda y mediana del número de vehículos por minuto en el ejercicio 2.1. Localice estas medidas en
el diagrama de puntos obtenidos en el ejercicio 2.6 y comente sobre su posición relativa.

Número de vehículos frecuencia Número de vehículos frecuencia


20 3 30 2
21 1 31 3
22 3 32 3
23 3 33 2
24 4 34 2
25 4 35 0
26 5 36 1
27 6 37 1
28 6 38 2
29 2 39 1

20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39
Mediana: 27
Media > moda > mediana
Moda: 27.5
Media: 27.8

-4-
3.12. Con los conteos de cromosomas del ejercicio 2.3 elaboramos la siguiente tabla e frecuencias:

Número de cromosomas por planta Frecuencia


(23,26] 5
(26,29] 40
(29,32] 27
(32,35] 11
(35,38] 3
(38,41] 3
(41,44] 1

a) Calcule media, mediana, varianza, desviación estándar y coeficiente de variación del número de cromosomas por
planta usando la tabla.
2
( xi - x )
2
(xi - x ) ni
2
Intervalo Valor medio, Xi Frecuencia, ni xi ni xi ni
(23-26] 24.5 5 122.5 3001.25 28.44 142.22
(26-29] 27.5 40 1100 30250 5.44 217.78
(29-32] 30.5 27 823.5 25116.75 0.44 12
(32-35] 33.5 11 368.50 12344.75 13.44 147.89
(35-38] 36.5 3 109.50 3996.75 44.44 133.33
(38-41] 39.5 3 118.50 4680.75 93.44 280.33
(41-44] 42.5 1 42.50 1806.25 160.44 160.44
= 90 2685 81196.5 1094
N
x i ni
• Media: x = i =1 2685
= = 29.8 cromosomas
N 90

• Mediana: se encuentra entre el dato 45 y 46, por lo tanto: (27.5 + 30.5) / 2 = 29 cromosomas
7 7
(x i − x )2 n i x i 2 n i − N (x )2
• Varianza: S 2
= i =1
= i =1
= 12.29 cromosomas 2
N −1 N −1
2
• Desviación estándar: S = S =

• Coeficiente de variación: C.V . = S = 3.48 = 0.117


x 29.8

b) Calcule estas medidas en los datos individuales y compárelas.


2
Número de cromosomas frecuencia abs xi ni xi ni (xi - x )2 (xi - x )2ni
24 5 120 2880 40.25 201.26
25 0 0 0 28.56 0
26 0 0 0 18.87 0
27 2 54 1458 11.19 22.37
28 23 644 18032 5.5 126.42
29 15 435 12615 1.81 27.11
30 10 300 9000 0.12 1.19
31 11 341 10571 0.43 4.73
32 6 192 6144 2.74 16.45
33 4 132 4356 7.05 28.21
34 4 136 4624 13.36 53.45
35 3 105 3675 21.67 65.02
36 2 72 2592 31.99 63.97
37 0 0 0 44.3 0
38 1 38 1444 58.61 58.61
39 1 39 1521 74.92 74.92
40 1 40 1600 93.23 93.23
41 1 41 1681 113.54 113.54
42 1 42 1764 135.85 135.85
= 90 2731 83957 1086.32

-5-
N
x i ni
• Media: x = i =1 2731
= = 30.3 cromosomas
N 90
• Mediana: se encuentra entre el dato 45 y 46, por lo tanto: (29 + 30) / 2 = 29.5 cromosomas
7 7
(x i − x )2 n i x i 2 n i − N (x )2
• Varianza: S 2
= i =1
= i =1
= 12.2 cromosomas 2
N −1 N −1
2
• Desviación estándar: S = S =
• Coeficiente de variación: C.V . = S = 3.47 = 0.115
x 30.3

Las diferencias observadas se deben al ancho elegido de los intervalos de clases. Se conoce cuantos datos existen en
el intervalo pero no su distribución dentro de él, lo que lleva a errores en el cálculo de las medidas descriptivas.

3.14. En seguida se presentan los porcentajes de población y de inversión del gasto público del gobierno federal en
cada una de las entidades federativas de la Republica Mexicana:

Entidad (X) (Y) Entidad (X) (Y) Entidad (X) (Y) Entidad (X) (Y)
Aguascalientes 0,7 0,5 Distrito Federal 14,2 29,8 Morelos 1,3 0,5 Sinaloa 2,6 8,2
B. California Norte 1,8 1,9 Durango 1,9 1,8 Nayarit 1,1 0,6 Sonora 2,3 2,5
B. California Sur 0,3 1 Guanajuato 4,7 2,1 Nuevo León 3,4 1,5 Tabasco 1,6 2,1
Campeche 0,5 1,2 Guerrero 3,3 2,9 Oaxaca 4,5 4,1 Tamaulipas 3 3,2
Chiapas 3,2 5,4 Hidalgo 2,5 1,2 Puebla 5,2 1,1 Tlaxcala 0,9 0,4
Chihuahua 3,3 4,8 Jalisco 6,8 3,1 Querétaro 1 1 Veracruz 7,9 3,6
Coahuila 2,3 2,3 México 7,9 3,3 Quintana Roo 0,2 1 Yucatán 1,6 1,2
Colima 0,5 0,8 Michoacán 4,8 3,6 S. Luis Potosí 2,7 2 Zacatecas 2 1,3

Para resolver se construye la siguiente tabla:


2 2
xi x (xi - x ) yi Y (yi - Y ) (xi - x ) (yi - Y )
Aguascalientes 0,7 3,125 5,88063 0,5 3,125 6,890625 6,365625
B. California Norte 1,8 3,125 1,75563 1,9 3,125 1,500625 1,623125
B. California Sur 0,3 3,125 7,98063 1 3,125 4,515625 6,003125
Campeche 0,5 3,125 6,89063 1,2 3,125 3,705625 5,053125
Chiapas 3,2 3,125 0,00563 5,4 3,125 5,175625 0,170625
Chihuahua 3,3 3,125 0,03063 4,8 3,125 2,805625 0,293125
Coahuila 2,3 3,125 0,68063 2,3 3,125 0,680625 0,680625
Colima 0,5 3,125 6,89063 0,8 3,125 5,405625 6,103125
Distrito Federal 14,2 3,125 122,656 29,8 3,125 711,5556 295,425625
Durango 1,9 3,125 1,50063 1,8 3,125 1,755625 1,623125
Guanajuato 4,7 3,125 2,48063 2,1 3,125 1,050625 -1,614375
Guerrero 3,3 3,125 0,03063 2,9 3,125 0,050625 -0,039375
Hidalgo 2,5 3,125 0,39062 1,2 3,125 3,705625 1,203125
Jalisco 6,8 3,125 13,5056 3,1 3,125 0,000625 -0,091875
México 7,9 3,125 22,8006 3,3 3,125 0,030625 0,835625
Michoacán 4,8 3,125 2,80563 3,6 3,125 0,225625 0,795625
Morelos 1,3 3,125 3,33063 0,5 3,125 6,890625 4,790625
Nayarit 1,1 3,125 4,10063 0,6 3,125 6,375625 5,113125
Nuevo León 3,4 3,125 0,07563 1,5 3,125 2,640625 -0,446875
Oaxaca 4,5 3,125 1,89063 4,1 3,125 0,950625 1,340625
Puebla 5,2 3,125 4,30563 1,1 3,125 4,100625 -4,201875
Querétaro 1 3,125 4,51563 1 3,125 4,515625 4,515625
Quintana Roo 0,2 3,125 8,55563 1 3,125 4,515625 6,215625
S. Luis Potosí 2,7 3,125 0,18062 2 3,125 1,265625 0,478125
Sinaloa 2,6 3,125 0,27562 8,2 3,125 25,75563 -2,664375
Sonora 2,3 3,125 0,68063 2,5 3,125 0,390625 0,515625
Tabasco 1,6 3,125 2,32563 2,1 3,125 1,050625 1,563125
Tamaulipas 3 3,125 0,01562 3,2 3,125 0,005625 -0,009375
Tlaxcala 0,9 3,125 4,95063 0,4 3,125 7,425625 6,063125
Veracruz 7,9 3,125 22,8006 3,6 3,125 0,225625 2,268125
Yucatán 1,6 3,125 2,32563 1,2 3,125 3,705625 2,935625
Zacatecas 2 3,125 1,26563 1,3 3,125 3,330625 2,053125
= 100 257,88 100 822,20 354,96

-6-
a) Calcule x , Sx, y Sy, C.V. (x) y C.V. (y).

Al observar la naturaleza de los datos se decide hacer un análisis estadístico poblacional, debido a que se considera al
100% de la población mexicana y se requieren las medidas descriptivas de la población.

Para X Para Y
N N
xi yi
Promedio µx = i =1
=
100 = 3.125 µy = i =1
=
100 = 3.125
N 32 N 32
N N
2 (x i − µ x )2 2 (y i − µ y )2
Varianza y = i =1 257.88 = 8.058 y = i =1 822.20 = 26.522
= =
N 32 N 32

Desviación estándar X = σ x2 = 2.838 y = σ Y2 = 5.15

σX σY
Coeficiente de variación C.V.(X) = = 0.908 C.V.(Y) = µy = 1.648
µx

b) Dibuje el diagrama de dispersión de datos y calcule SXY y rXY. Interprete el signo y la magnitud de rXY con la ayuda
de su diagrama.

30

25

20
% Inversión

15

10

0
0 2 4 6 8 10 12 14 16 % Población

N N
xi y i (x i (
− µx ) yi − µy )
Covarianza: i =1 i =1 354.96
σ XY = − µxµy = = = 11.093
N N 32

Coeficiente de correlación: σ XY 11.093


r XY = = = 0.758
σ X ⋅σ Y (2.838 )(5.15 )

Se puede observar claramente una tendencia directamente proporcional en el diagrama de dispersión, lo que queda
demostrado con la magnitud y el signo del valor de rXY.

2
El coeficiente de determinación es (rXY) = 0.575; por lo tanto se puede afirmar que el 57.5% de la variación en el
porcentaje de inversión del gasto publico se debe a la variación en el porcentaje de la población nacional; lo que es
bastante aceptable para suponer un comportamiento lineal.

-7-
c) Observe cuidadosamente su diagrama de dispersión. El punto (14.2, 29.8) corresponde al Distrito Federal, se
aparta notablemente de la tendencia del resto de los datos. Elimine ese punto y repita los cálculos de los incisos a y
b. Interprete los cambios en las medidas descriptivas. En particular observe la reducción en SY, C.V.(Y) y rXY.

Al eliminar el valor del D.F. se obtienen los siguientes valores:


2
n = 31 yi = 70.2 (yi - Y ) = 87.69
2
xi =85.8 (xi - x ) = 131.27 (xi - x )(yi - Y ) = 244.3

Para X Para Y
n n
xi yi
Promedio x= i =1 85.8 = 2.767 Y = i =1 70.2 = 2.264
= =
n 31 n 31
n n
2 (x i − x )2 2 (y i − y )2
Varianza Sy = i =1 131.27 = 4.375 Sy = i =1 87.69 = 2.923
= =
n −1 30 n −1 30
Desviación estándar Sy = S x2 = 2.091 Sy = S Y2 = 1.709
SX SY
Coeficiente de variación C.V.(X) = = 0.755 C.V.(Y) = = 0.754
x y

n n
xi y i − n ⋅ x ⋅ y (x i − x )(y i − y )
Covarianza: i =1 i =1 50
S XY = = = = 1.666
n −1 n −1 30

Coeficiente de correlación: S XY 1.666


r XY = = = 0.466
S X ⋅ SY (2.091 )(1.709 )

El coeficiente de determinación es (rXY)2 = 0.217; por lo tanto se puede afirmar que solo el 21.7% de la variación en el
porcentaje de inversión del gasto publico se debe a la variación en el porcentaje de la población nacional.

Con esta información se descarta la posibilidad de que exista una correlación lineal, tal como se observa en la siguiente
tabla de dispersión:

6
% Inversión

0
0 1 2 3 4 5 6 7 8 % Población

Se observa que al eliminar el valor del Distrito Federal: x9, y9 (14.2, 29.8) se disminuye notablemente su contribución en
2
la sumatoria de (yi - Y ) con ello se trae la particular reducción de los valores de SY, C.V.(Y) y rXY.

-8-

You might also like