Professional Documents
Culture Documents
CATEDRA DE ESTADISTICAS
METODOS DESCRIPTIVOS E INFERENCIALES
Ciclo: 01-2018
Rango 3 a 10 minutos
N (tamaño de la muestra) 50
El gerente examina las siguientes gráficas para visualizar los tiempos de espera:
RECOPILACION DE DATOS
Es el momento en el cual el investigador se pone en contacto con los objetos o
elementos sometidos a estudio, con el propósito de obtener datos o respuestas de
las variables consideradas; a partir de estos datos o respuestas se calculan los
Estadígrafos o indicadores estadísticos.
FUENTES DE DATOS
La fuente de datos, es el lugar, la institución, las personas o elementos donde están
o que poseen los datos que se necesitan para cada uno de las variables o aspectos
de la investigación o estudio.
Estadística inferencial
LA VARIABLE:
Es la representación simbólica de los datos.
Ejemplo:
Sea X: altura de 5 alumnos de WIENER Donde: Xi, i= 1 a 5
X1= 1.65 mts., X4 = 1.63 mts.
Ejemplos:
Categorías o Clases.- Son los datos que están agrupados por sus características
comunes.
Medimos la altura de los niños de una clase y obtenemos los siguientes resultados
(cm):
Si los valores que toma la variable son muy diversos y cada uno de ellos se repite
muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra
manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy poco
valor a efectos de síntesis.
Ejemplo: (4.2).
Soltero 25 50%
Casado 10 20%
Viudo 1 2%
Divorciado 6 12%
Conviviente 8 16%
N° DE PERSONAS 30
25
20
15
10
5
0
Soltero
Conviviente
Divorciado
Casado
Viudo
ESTADO CIVIL
PORCENTAJES
Soltero
Conviviente
Divorciado
Viudo Casado
Clase Xi Fi Fi hi Hi
x1 f1 F1 h1 H1
x2 f2 F2 h2 H2
. . . . .
. . . . .
. . . . .
Xm Fm Fm=n hm .Hm=1
Donde:
fi+f2+f3+. ...+ fm =n
fi = n
i=1
F1=f1
F2=f1+f2
.
.
Fm=f1+f2+f3...+fm =
fi
hi
n
Hi=h1
H2=h1+h2
.
.
Hm=h1+h2+....hm=1
También :
Fi
Hi
n
Solución:
3 4 4 26.7 23.7
5 5 9 33.3 60.0
6 3 12 20.0 80.0
10 2 14 13.3 93.3
11 1 15 6.7
100.0
6
N° DE DISKETTES
5
4
3
2
1
0
3´ 5´ 6´ 10´ 11´
DEFECTOS
Intervalos Xi Fi Fi hi Hi
(Li - Ls)
[X’o - X’1> X1 f1 F1 h1 H1
[X’1 - X’2> X2 f2 F2 h2 H2
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
[X’m-1- X’m] Xm Fm Fm hm Hm
Donde:
X i= marca de clase o punto medio de cada intervalo de clase, se obtiene mediante
la semisuma de los limites de cada intervalo.
X i = Ls + Li
2
1er. Paso:
K =1 +3.3 log. n
2do. Paso:
Con este procedimiento calculamos una amplitud que será constante para cada
intervalo, y lo mismo ocurrirá entre cada marca de clase.
Los intervalos serán de la forma: [Li Ls], pudiendo ser considerado cerrado en el
último intervalo.
Ejemplos: (2.3)
Solución:
A =9
3) Tabular en tdf:
LOS GRAFICOS
Los gráficos son representaciones en forma de figuras geométricas, de superficie
o volumen con el objeto de ilustrar los cambios o dimensión de una variable, para
comparar visualmente dos o más variables similares o relacionadas. Para una
rápida comprensión de situaciones o variaciones en cantidades, es muy útil traducir
los números en gráficos o imágenes. Por su naturaleza, un gráfico no toma en
cuenta los detalles y no tiene la misma precisión que una tabla estadística.
Veamos algunos tipos de Gráficos :
15.00
10.00
fi
5.00
0.00
.47.5 .56.5 .65.5 .74.5 .83.5 .92.5
Xi
SESION # 7
X
1. La Media Aritmética
Llamada también promedio, es el estadigrafo de posición más simple y fácil
de calcular, por eso es el más común.
Se calcula teniendo en cuenta los siguientes casos:
X
Xi * fi fi = frec. Absoluta
n
hi = frec. Relativa
O también:
X Xi * hi
hi = frec. Relativa
X X (K ) K
Sea K = cte. y cada Xi = k -----------------
( Xi X ) 0 Datos no agrupados
( Xi X ) * fi 0
3. La Mediana (Me) :
Ejemplo: la Me de 12,21,16,18,20,19,16,15,16,17.
Ordenando: 12,15,16,16,16,17,18,19,20,21,
16 17
Me 16.5
2
Me Li
Ame * n Fme1
2
f me
Donde:
4. LA MODA (Mo)
D1
M o Li Amo *
D1 D 2
Donde:
Ejemplos. (3.1)
Calcular la Media Aritmética, Mediana y Moda de la Tabla de frecuencias del ejemplo (2.3).
35 15
Me 70 9 * 2 72.05 gramos
11
Para calcular la Moda, la clase modal es el 4to. intervalo, por que presenta
la mayor frecuencia absoluta.
D1=11 - 5 = 6
D2=11 – 4 =7
6 Gramos
M o 70 9 * 74.15
67
SESION # 9
Atención: cuando un cuartil recae en un valor que se ha repetido más de una vez
(como ocurre en el ejemplo en los tres cuartiles) la medida de posición no central
sería realmente una de las repeticiones
n
F1i
Q1 Li
4
F2
Para calcular el Segundo Cuartil
n
F1i
Q 2 Li
2
F2
3n
F1i
Q3 Li
4
F2
DONDE:
Q1 = Primer Cuartil
Q2 = Segundo Cuartil
Q3 = Tercer Cuartil
Li = Límite Real inferior de la Clase que contiene el Cuartil
n = Número de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
F2 = Frecuencia absoluta de la Clase del Cuartil
i = Intervalo de Clase
Como cada Cuartil representa el 25%, entonces el Primer Percerntil será el 25%.
Respuesta.- El 25% de los usuarios consume 57 KW Hora.
D = El Decil
Li = Límite Real inferior de la Clase que contiene el Decil
D # = El número de Decil que se quiere hallar
n = Número de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
F2 = Frecuencia absoluta de la Clase del Cuartil
i = Intervalo de Clase
Como cada Decil representa el 10%, entonces el Cuarto Decil será el 40%..
Respuesta.- El 40% de los usuarios consume 69.95 KW Hora.
P = El Percentil
Li = Límite Real inferior de la Clase que contiene el Percentil
P # = El número de Percentil que se quiere hallar
n = Número de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Percentil
F2 = Frecuencia absoluta de la Clase del Percentil
i = Intervalo de Clase
EXAMEN PARCIAL
SESION # 11
1. LA VARIANZA: V (X)
O también:
Desarrollando esta sumatoria, obtenemos:
O también:
Donde:
Xi = marca de clases.
fi = frecuencia absoluta
hi = frecuencia relativa
Propiedades de la Varianza:
5. Siendo a y b constantes, X e
Y variables independientes
Se calcula:
Donde:
S(x) = desviación típica
X = promedio aritmético ó
Ejemplos:
415,500,480,490,476,500,432,479,489,497,496,478,453.
Solución:
Intervalos Xi fi Fi
[ 7 – 8> 7.5 1 1
[ 8 – 9> 8.5 2 3
[ 9 – 10> 9.5 8 11
[10 – 11> 10.5 11 22
[11 – 12> 11.5 6 28
[12 – 13] 12.5 6 34
Gramos
Calculando la mediana:
Gramos
Solución:
Primero hay que tener en cuenta que no se puede comparar las desviaciones
standares de cada nuestra, porque están expresadas en diferente unidades,
pero si podemos compararlas con sus C.V. respectivos:
SESION # 12
X X1 X2 X3 ........ XN
..
Y Y1 Y2 Y3 ........ YN
..
............................. ( I
)
.........................( II)
Para calcular la covarianza S(XY), es preferible utilizar la ec. (II). Los
promedios de X y de Y, así como las desviaciones standares S(X) Y S(Y),
se calculan como en los capítulos 3 y 4.
En forma tabular:
Donde:
Observaciones:
Ejemplos:
b) S2 (Y)
S (Y) = 2.65
lbs
X : altura (pulgadas).
Y : peso (libras).
90-110 2 1 3
100-120 7 8 4 2 21
130-140 5 15 22 7 1 50
50-160 2 12 63 19 5 101
170-180 7 28 32 12 79
190-200 2 10 20 7 39
210-220 1 4 2 7
Total
Fx 16 45 128 84 27 300
Calcular:
Solución:
Calculando:
S (X) = 3.929 pulgadas
Calculando la Covarianza:
Solución
Si la sumatoria de las hi = 1
Sabemos que : M/2 + 0.17 +2M +M +0.13 = 1
7M = 1.4
fi
M = 0.2 sabemos que hi
n
Por lo tanto fi = hi * n
Remplazando valores de hi
hi hi
M/2 0.10
0.17 0.17
2M 0.40
M 0.20
0.13 0.13
Completando el cuadro:
Intervalos Xi fi Fi hi Hi
[10.5 14.5> 12.25 3 3 0.10 0.10
[14.5 19.5> 17 5 5 0.17 0.17
[19.5 24.5> 22 12 12 0.40 0.67
[24.5 29.5> 27 6 6 0.20 0.87
[29.5 35> 32.25 4 4 0.13 1.00
30 1.00
2)Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen
de Estadística I:
33, 35, 35, 39, 41, 41, 42, 45, 47, 48,
50, 52, 53, 54, 55, 55, 57, 59, 60, 60,
61, 64, 65, 65, 65, 66, 66, 66, 67, 68,
69, 71, 73, 73, 74, 74, 76, 77, 77, 78,
80, 81, 84, 85, 85, 88, 89, 91, 94, 97.
Solución
I) Rango = 97-33 = 64
II) K = 1+3.32 * log (10) = 1+ 3.22 (1.699) = 6.47
clases xi fi Fi hI HI
[30, 40> 35 4 4 0.08 0.08
[40, 50> 45 6 10 0.12 0.20
[50, 60> 55 8 18 0.16 0.36
[60, 70 > 65 13 31 0.26 0.62
[70, 80> 75 9 40 0.18 0.80
[80, 90> 85 7 47 0.14 0.94
[90, 100> 95 3 50 0.06 1.00
TOTAL 50 1.00
Nótese que en el ultimo intervalo el límite superior puede ser abierto ya que
sobrepasa al valor más alto de los datos.
GRAFICOS
HISTOGRAMA Y
POLIGONO DE
20
FRECUENCIA
FRECUENCIAS
0
35 45 55 65 75 85 95
MARCAS DE CLASE
LA OJIVA
50
Fi
0
35455565758595
MARCAS DE CLASE…
Regresión lineal
altur 70 63 72 60 66 70 74 65 62 67 65 68
a
pes 15 150 180 135 156 168 178 160 132 145 139 152
o 5
Solución:
X Y X*Y
70 155 4900 10850
63 150 3969 9450
72 180 5184 12960
60 135 3600 8100
66 156 4356 10296
70 168 4900 11760
74 178 5476 13172
65 160 4225 10400
62 132 3844 8184
67 145 4489 9715
65 139 4225 9035
68 152 4624 10336
X = 802 Y=1850 = 53792 X*Y =
124258
Calculando a y b:
a = -60.75
Y = -60.75 + 3.22 X
b = 3.22
a)
Años Producción en
Ton. cortas
1946 66.6
1947 84.9
1948 88.6
1949 78.0
1950 96.8
1951 105.2
1952 93.2
1953 111.6
1954 88.3
1955 117.0
1956 115.2
Solución:
Para poder trabajar con los años se debe colocar una escala paralela que inicie en
cero (pues las fechas no sirven para estos cálculos).
Años X Y X*Y
1946 0 66.6 0 0
1947 1 84.9 1 84.9
1948 2 88.6 4 177.2
1949 3 78.0 9 234.0
1950 4 96.8 16 387.2
1951 5 105.2 25 526.0
1952 6 93.2 36 559.2
1953 7 111.6 49 781.2
1954 8 88.3 64 706.4
1955 9 117.0 81 1053
1956 10 115.2 100 1152
TOTALES 55 1045.4 385 5661.1
a = 75.30
Y = 75.30 + 3.95 X
b = 3.95
b y c) Estimando la producción:
Años X Producción
1944 -2 67.40
1945 -1 71.35
1957 11 118.75
1958 12 122.70