Professional Documents
Culture Documents
Asignatura: Estadística I
Universidad Peruana de
Integración Global
Asignatura: Estadística I
Ciclo: II
Turno: Mañana/Noche
INTRODUCCIÓN
El uso de la Estadística se ha generalizado en los últimos años no sólo como herramienta de
análisis de problemas de economía, sino como auxiliar en el estudio y valoración de cualquier
investigación. El propósito es proporcionar a los estudiantes de Ingeniería de Sistemas, el
material exigido en el curso de Estadística I, incluyendo algunas de sus aplicaciones.
La estadística es en la Ingeniería de Sistemas busca implementar los procesos probabilísticos
y estadísticos de análisis e interpretación e datos o características de un conjunto de
elementos al entorno industrial, a efectos de ayudar en la toma de decisiones y en el control
de los procesos industriales y organizacionales
El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la
estadística, sobre todo en la manipulación de la información, pues en el mercado existen
paquetes estadísticos de excelente calidad, como el SAS, SPSS, SCA, STATGRAPHICS,
otros, que "corren" en un ordenador sin mayores exigencias técnicas, permitiendo el manejo
de grandes volúmenes de información y de variables.
UNIDAD I
CONTENIDO
INTRODUCCIÓN ...................................................................................................................2
UNIDAD I .............................................................................................................................3
ESTADÍSTICA ....................................................................................................................5
DEFINICION .....................................................................................................................5
UTILIDAD E IMPORTANCIA ..........................................................................................5
NOMENCLATURA ESTADÍSTICA ................................................................................5
ELEMENTOS BÁSICOS DE LA ESTADÍSTICA: ..........................................................6
ETAPAS DE LA INVESTIGACION ................................................................................7
La Fuentes De Datos .......................................................................................................8
EJERCICIOS: ...................................................................................................................9
ORGANIZACIÓN DE DATOS....................................................................................... 10
TABLAS ESTADISTICAS ............................................................................................. 10
EXPLICACION DE LA ELABORACIÓN DE LA TABLA ............................................. 11
ELEMENTOS DE LA TABLA DE DISTRIBUCION DE FRECUENCIAS PARA
DATOS AGRUPADOS ..................................................................................................13
EJERCICIOS: ................................................................................................................. 14
LOS GRAFICOS ESTADISTICOS ............................................................................... 15
ESTADIGRAFOS DE TENDENCIA CENTRAL ................................................................ 19
LA MEDIA ARITMETICA ............................................................................................... 19
Ejercicios: ....................................................................................................................... 21
LA MEDIANA O EL VALOR MEDIANO .......................................................................22
LA MODA ........................................................................................................................ 24
OTRAS MEDIDAS DE TENDENCIA CENTRAL ........................................................ 26
MEDIDAS DE POSICIÓN...................................................................................................28
ESTADIGRAFO DE DISPERSION ..................................................................................... 34
Rango o recorrido (r) .....................................................................................................34
Desviación media (D.M.) ............................................................................................... 34
Recorrido Semi Intercuartil (Q) ..................................................................................... 35
Varianza (s2) ................................................................................................................... 36
Desviación Estándar o Típica (S) ................................................................................. 37
Coeficiente de variación (CV) ....................................................................................... 37
FORMA DE UNA DISTRIBUCIÓN .................................................................................... 38
LA ASIMETRÍA Y SU MEDIDA .................................................................................... 38
LA CURTOSIS Y SU MEDIDA ..................................................................................... 39
BIBLIOGRAFIA: ................................................................................................................. 42
SEMANA 01
ESTADÍSTICA
DEFINICION
NOMENCLATURA ESTADÍSTICA
Si el estudio fue realizado conforme a lo que se había planificado y con los resultados a la
vista se concluirá si las hipótesis ha sido verificadas o no, proponiéndose las
recomendaciones pertinentes.
5. Resultados y Conclusiones: Finalmente exponer los principales resultados de acuerdo
a los objetivos. Indicar lo más importante, si se acepta o se rechaza las hipótesis.
EJERCICIOS:
SEMANA 02-03
ORGANIZACIÓN DE DATOS
TABLAS ESTADISTICAS
Las tablas frecuencias, llamadas también distribución de frecuencias, se utilizan para resumir
la información.
Se puede construir tablas de frecuencias para datos cualitativos o cuantitativos. En un
conjunto de datos está agrupado en varias clases.
Las tablas frecuencias deben explicarse por sí misma, es decir, al ser observadas por
cualquier investigador, inmediatamente muestran en forma sencilla y entendible el
comportamiento de los datos de la investigación
Toda tabla presenta las siguientes partes.
1. El título: nos muestra brevemente el contenido de la información y debe ser preciso, claro
y conciso para evitar confusiones.
2. El encabezamiento: se encuentra en la primera fila y nos indica la naturaleza del contenido
de cada columna con las unidades correspondientes.
3. El cuerpo: está formado por un conjunto e filas y columnas y nos presenta la información
de la investigación.
4. La fuente: está ubicado al final de la tabla y nos indica a la entidad responsable de donde
se obtuvieron los datos.
5. Las notas y los comentarios: son colocados al pie del cuadro y sirven para realizar
aclaraciones.
Titulo
Encabezado
Cuerpo
Fuente
Existen dos tipos generales de tablas de frecuencias para representar un archivo de datos:
a) Tablas de frecuencias para datos no agrupados (tablas sin intervalos)
b) Tablas de frecuencias para datos agrupados (tablas con intervalos)
a) ORGANIZACIÓN DE DATOS NO AGRUPADOS (V. Cualitativa)
En este tipo de organización de datos se utilizan las llamadas tablas de frecuencias para
datos no agrupados, donde cada clase tiene la frecuencia correspondiente. Además, en
esta forma de organización no hay presencia no hay intervalos.
Se recomienda seguir la siguiente secuencia:
Se recoge la información.
Se ordena y representa la información de acuerdo a la naturaleza de la variable.
Se elabora la tabla de frecuencias.
Se construye los gráficos.
xi fi Fi hi Hi
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1
31 1
EJERCICIOS:
SEMANA 04
GRAFICOS DE BARRAS
Son aquellos en los cuales se presentan un conjunto de rectángulos, barras o
paralelepípedos, horizontales o verticales. Se utilizan generalmente para representar
variables cualitativas y cuantitativas discretas.
Ejemplos:
40
40
Especialidad Nº de alumno 30 24
Inicial 40 20 16
Primaria 24 10
Secundaria 16
0
GRAFICOS CIRCULARES
Se usan generalmente para datos cualitativos y representan sólo las partes de una total,
siendo muy utilizados para visualizar información presupuestal.
Ejemplos:
Especialidad Nº de alumno
Inicial 40
Primaria 24
Secundaria 16
Secundari
a, 16, 20%
Inicial, 40,
50%
Primaria,
24, 30%
HISTOGRAMAS
Son diagramas de barras o rectángulo unidos que representan la información de una tabla de
frecuencias.
Pueden construirse para distribuciones de frecuencias de datos no agrupados (sin intervalos)
y para datos agrupados (con intervalos).
HISTOGRAMAS DATOS NO AGRUPADOS
Generalmente se considera lo siguiente:
En el eje de las X se representa a la variable en estudio y en el eje Y a las
frecuencias absolutas o relativas.
Cada frecuencia se representa por una barra cuya área es proporcional a ella.
Generalmente el ancho de la barra es 1 y el área de la barra es igual a la frecuencia
de la medida.
Ejemplo:
Año Nº de alumnos
Desaprobados
1º 15 20
2º 10 15
3º 12 10
4º 8
5º 4 5
0
1º 2º 3º 4º 5º
16 15
14
12
10
8 7
6
4 3
2
2 1
0
2 4 6 8 10 12
POLIGONO DE FRECUENCIAS
Se construyen usando una tabla de frecuencias para datos agrupados en intervalos de clase.
Un polígono de frecuencias nos da la impresión de que las frecuencias cambian más
suavemente, mientras que en un histograma se observa que las frecuencias cambian
abruptamente.
Los polígonos de frecuencias absolutas o relativas, se obtienen uniendo los puntos medios de
las bases superiores de los rectángulos en el histograma de frecuencias absolutas o relativas
respectivamente.
Cerramos el polígono al prolongar los segmentos de recta de los extremos de tal manera que
encuentren al eje horizontal en el punto medio de la clase anterior a la primera y posterior a
la última.
30
30
25 22 22
20
15
15
10
10
5 5
5
0
6 7 9 11 13 15 17 19 21
1
OJIVA
Son curvas construidas a partir de tablas de frecuencias acumuladas (absolutas o relativas).
En estas curvas las abscisas son los limites superiores de los intervalos de clases y las
ordenadas son las frecuencias absolutas acumuladas o relativa acumuladas (esta puede
expresar en forma decimal o porcentual). Se agrega una clase con frecuencia cero antes de
la primera clase. A este tupo de ojiva se le conoce como ojiva menor o creciente.
50 46
40 35
30 26
20
12
10
4
0
320 370 420 470 520 570 620
570
320
370
420
470
520
620
670
SEMANA 05
LA MEDIA ARITMETICA
X : M(x);
Para la población
n
x
x1 x 2 x 3 ......x n i 1 i
=
N N
N: Tamaño de la población
: La media de la población (parámetro)
Para la muestra
n
x1 x 2 x 3 ......x n
xi
i 1
X =
n n
n: Tamaño de la población
X : La media de la población (estadígrafo)
Ejemplo: Supongamos que los puntajes obtenidos de 5 exámenes parciales de
estadísticas son: 12; 15; 10; 16; 08
La nota promedio o media aritmética de las notas es:
5
x1 x 2 x 3 x 4 x 5 xi
x 5
i 1
5
12 15 10 16 08
x 5
=12.5
_ x i fi
x i 1
k
f
i 1
i
x1 f1 x 2 f 2 x 3 f 3......x n f n
M (x) x =
f 1 f 2 f 3 .... f n
Entonces
k xifi xifi
1 3 4 12
2 5 2 10
3 4 5 20
4 2 10 20
5 8 1 8
22 70
Calculo de la media:
3 * 4 5 * 2 4 * 5 2 *10 8 *1 70
x 22
22
3.18
_ x´ i fi
x i 1
n
X´: marca de clase
Ejemplo: la siguiente tabla corresponde al ingreso mensual promedio (en soles) de cierto
número de familias. Halle la media.
Li fi X´
[300 – 400> 40 350
[400 – 500> 35 450
[500 – 600> 15 550
[600 – 700> 10 650
100
Calculo de la mediana:
40 * 350 35 * 450 15 * 550 10 * 650
x 100
14000 15750 8250 6500 44500
x 100
100
445
Ejercicios:
1. Sean los siguientes pesos de n=50 personas, de peso alto, expresado en kilogramos.
73 102 90 97 98 106 108 93 87 88 100 87 104
85 90 95 80 98 82 98 104 112 90 98 101 94
105 98 93 82 91 84 93 88 97 103 84 105 92
96 100 104 96 101 75 93 82 100 95 114
Construir una tabla de distribución de frecuencia
Calcular la media aritmética.
2. Durante 30 días se ha observado el número de d pasajeros que viajan de lima a Ica, siendo
los resultados siguientes:
36 30 34 38 39 40 30 35 36 37
30 39 38 31 37 32 39 38 30 38
38 39 40 40 38 33 31 35 35 32
3. Las remuneraciones mensuales, en dólares de 80 trabajadores de una empresa de
transporte, son los siguientes:
260 190 130 135 220 155 225 230 93 180 120 215
230 235 230 265 120 91 115 185 255 233 190 160
170 130 105 217 95 190 175 190 140 220 185 195
125 92 240 140 115 205 125 140 155 170 190 190
233 185 145 185 145 230 170 220 165 288 95 120
135 160 145 222 170 195 210 135 180 173 153 178
164 173 156 170 182 190 177 210
La mediana (Me) es el valor de la variable que divide al total de las “n” observaciones,
debidamente ordenadas o tabuladas en dos partes de igual tamaño. Esto significa que a uno
y otro lado de este valor mediano (Me) Se encuentre no más del 50% del total de las
observaciones. Es decir, que no más de la mitad de las observaciones (n/2) sean menores
que Me, y que no más de la mitad sean mayores que Me.
Se presentan dos casos:
Cuando se tiene un número impar de datos
Entonces la mediana es igual al valor del término central.
Ejemplo: Sean los valores 130,12, 3, 39, 45. Halle la mediana.
1º ordenamos: 3, 12, 29, 45, 130.
n 1
2º Hallamos el lugar L= 3 => Me=29
2
Cuando se tiene un número par de datos
Entonces la mediana es igual al promedio de los 2 términos centrales.
Ejemplo: Sean las edades de 8 docentes de la UPIG son las siguientes: 30, 23, 45, 27, 34,
48, 28, 48. Halle la mediana.
1º ordenamos: 23, 27, 28, 30, 34, 41, 45, 48
n 1 30 34
2º Hallamos el lugar L= 4.5 => Me= 32
2 2
Se observa que hay 4 docentes cuya edad es menor de 32 años.
Nota Nº de Alumnos Fi
09 2 2
10 7 9
11 11 20
12 13 33
13 4 37
14 2 39
15 1 40
n
2 F m 1
Me= ljm+w
fm
Donde:
m = Número de la clase en que se encuentra la mediana.
lj = Límite inferior de la clase considerada.
n = Tamaño de la muestra.
F m1 = Frecuencia acumula absoluta de la clase anterior a m.
W = Tamaño del intervalo de clase.
fm = Frecuencia absoluta de la clase m.
K [LI-LS> fi FI
1 [92.3-94.8> 2 2
2 [94.8-97.3> 6 8
3 [97.3-99.8> 9 17
4 [99.8-102.3> 15 32
5 [102.3-104.8> 10 42
6 [104.8-107.3> 5 47
7 [107.3-109.8> 3 50
n 1
Lugar L= 25.5
2
La mediana se encuentra en la clase 4.
n
2 F m 1
Me= lim+w
fm
50
2 17
Me= 99.8+2.5 =101.13 Kg.
15
LA MODA
La moda (Mo), simplemente es el valor más frecuente que se le da a una variable. La moda
de un conjunto de observaciones es “el valor de la variable que se presenta con más frecuente
en la distribución”. Es el valor de la variable que le corresponde la mayor frecuencia absoluta.
(ni o fi. La moda también se llama modo, valor modal o Promedio Típico, se simboliza con Mo,
otros autores usan Md.
Ejemplo
a) El conjunto: 2, 2, 5,7, 9, 9, 9, 10, 10, 11, 13 tiene la moda como Mo=9
CALCULO DE LA MODA
a) Tablas sin intervalo
Una vez agrupados los datos en una tabla frecuencia, el valor modal será el valor de la
variable que más se repite o que tiene la mayor frecuencia.
La mayor frecuencia de denotará con n j
Ejemplo: Calcular la moda en la distribución de la familias según el número de miembros
indicado en el cuadro.
Número de Número de
personas familia
por familia Xi fi
x1=2 f1=16
x2=3 f2=24
x3=4 f3=52
Mo x4=5 f4=76 fj
x5==6 f5=40
x6=7 y más f6=12
Total N=220
Se observa de la mayor frecuencia es n 4=76 que corresponde al cuarto valor de la variable
(y4=5), luego el valor modal es 5.
Máx fj=76 entonces Mo=x4=5
El resultado significa que es más frecuente hallar familias integradas por 5 miembros o
personas cada una. El tamaño más frecuente es 5 personas por familia.
Dónde:
= Numero de la clase que tiene la mayor frecuencia (f i)
Li = Límite inferior de la clase modal ()
c = Amplitud del intervalo de clase.
K [LI-LS> fi FI
1 [92.3-94.8> 2 2
2 [94.8-97.3> 6 8
3 [97.3-99.8> 9 17
4 [99.8-102.3> 15 32
5 [102.3-104.8> 10 42
6 [104.8-107.3> 5 47
7 [107.3-109.8> 3 50
f4 f3
Mo= Li+W
f f 1 f f 1
15 9
Mo= 99.8+2.5
15 9 15 10
Mo= 101.16 kg.
Ejercicios: Considerar la tabla más frecuente del cuadro y calcular el valor modal
moda o sueldo más frecuente en los 80 trabajadores.
[Li-Ls) fi
90-120 f1=11
120-150 f2=13
150-180 f3=20
180-210 f4=17
210-240 f5=15
240-270 f6=3
270-300 f7=1
n=80
Interpretación de Mo: La moda indica que el sueldo más frecuente en los 80 trabajadores es
de: dólares, o también que la mayoría de trabajadores tienen sueldos aproximadamente de:
dólares.
La media, mediana y moda son las medidas de tendencia central más importantes, de
mayor aplicación y más fáciles de calcular. Sin embargo, en ciertas circunstancias son
útiles otras medidas de tendencia central y aunque su uso no sea frecuente, es
conveniente conocerlas; estas son:
k
Donde f
i 1
i n i´ es marca de clase
f1, f2, f3,…….. fk son las frecuencias absolutas
k es el número de clases
Ejemplos: Halle la MG a partir de la información de la siguiente tabla:
K [li- ls> fi X ´i
1 [10-12 > 2 11
2 [12-14 > 2 13
3 [14-16 > 3 15
4 [16-18 > 2 17
5 [18-20 > 1 19
n
Ejemplo: Halle la MH de 2, 4 y 6
3 3 36
MH= 3.273
1 1 1 6 3 2 11
2 4 6 12
Para Datos Agrupados
La MH de datos agrupados se define como la inversa del promedio aritmético de las inversas
de las marcas de clases ponderadas por las frecuencias absolutas.
Es decir.
1
MH=
1 1 1 1
' f1 ' f 2 ' f3 .......... ' f k
xi xi xi xi
También se puede expresar como:
1 n
MH=
k
1 k
1
' f i
i 1 xi
' f i
i 1 xi
n
Donde X i' : es la marca de clase
K : Es el número de clase
f i : Son las frecuencias absolutas.
Ejemplos: Halle la MH a partir de la información de la siguiente tabla:
K [li- ls> fi X ´i
1 [10-12 > 2 11
2 [12-14 > 2 13
3 [14-16 > 3 15
4 [16-18 > 2 17
5 [18-20 > 1 19
10
MH=
1 1 1 1 1
2 2 3 2 1
11 13 15 17 19
MEDIDAS DE POSICIÓN
Las medidas de posición se utilizan para describir la posición que un dato específico
posee en relación con el resto de los datos cuando están en orden por categorías.
Cuartiles, deciles y percentiles son las medidas de posición más populares.
CUARTILES, DECILES, PERCENTILES
Los cuarteles, deciles y percentiles son estadígrafo de posición que dividen al total de los
datos, previamente ordenados o tabulados, en proporciones.
Se usan frecuentemente pata describir el comportamiento de una población. Los valores se
expresan en forma porcentual.
CUARTILES: (Q1)
Los cuartiles son estadígrafos de posición que dividen al total de las observaciones,
debidamente ordenados o tabulados, en cuatro partes de igual tamaño. Esto significa que
entre dos cuartilas consecutivas se encuentren no más del 25% del total "n" observaciones.
Supongamos que se ubican ordenadamente, en línea recta, los "n" valores de la variable X¡
y termina en el mayor valor de X ¡.
Q1 Q2=Me Q3
0% 25% 50% 75% 100%
n 2n n 3n
4 4 2 4
El problema es dividir los datos ordenados en cuatro subconjunto iguales gráficamente
dividir el segmento ﴾Xmax, Xmin﴿ en cuatro partes iguales. Para lograr este objetivo s e requiere
definir tres puntos, Los valores de estos puntos definen las cuartilas. Entonces existen 3
cuartilas.
a) Primera Cuartila o Cuartila Inferior Q1
Es un valor que supera a no más del 25% de las n observaciones y que es superado por
no más del 75% de las n observaciones. En otras palabras, el 25% de las observaciones
tienen valores inferiores o iguales a Q 1, en tanto que el 75% restante tienen valores
superiores a Q1.
25% de n _____Q1_____75% de n
b) Segunda Cuartila o Cuartila Mediana Q2 =Me
Es un valor que está en el centro, y por lo tanto coincide con la mediana
Q2=Me
c) Tercera Cuartila o Cuartila Superior Q3 =Me
Es un valor que supera a no más del 75% de las n observaciones y que es superado por
no más del 25% de las n observaciones. Es decir, que el 75% de las observaciones
tienen valores inferiores o iguales a Q 3 y el 25% restante tienen valores superiores a
Q3.
75%______ de n ____Q3_____25% d en
CUARTILA INFERIOR Q1
i*n
4 F c 1
Q1= li+W
fc
Dónde:
n = Número total de observaciones o datos
Fc-1 = Frecuencia absoluta acumulada de la clase anterior a la
clase donde se encuentra el cuartel.
fc = Es la frecuencia absoluta que corresponde a la clase
donde se encuentra el cuartel.
Li = Extremo inferior del intervalo cuartil-uno (Q1)
W = Amplitud del intervalo cuartil-uno.
C = Es la clase donde se encuentra el cuartel.
CUARTILA SUPERIOR Q3
3* n
4 F C 1
Q3= li+W
fc
Dónde:
n = Número total de observaciones o datos
3n
FC = Es una Fc inmediata superior a
4
3n
FC-1 = Es una FC inmediata inferior a
4
Li = Extremo inferior del intervalo cuartil-tres (Q3)
W = Amplitud del intervalo cuartil-tres.
Ejemplo:
Seguimos considerando la distribución de los 80 trabajadores según sus sueldos. Ahora
interesa calcular las cuartilas inferiores (Q 1) y la superior (Q3)
Cálculo de Q1:
n
1. Calcular y determinar los valores FC y FC-1
4
n 80
En este caso =20, valor que se compara con las frecuencias absolutas
4 4
acumuladas (FC), se observa que 20 está entre 11 y 24.
11 2024
n
Fc-1 Fc
4
Luego:
Fc-1=11 y FC=24
LAS DECILAS: Dr
Las decilas son estadígrafos de posición que dividen al total de las observaciones, en 10
partes iguales, tal que entre dos decilas consecutivas se encuentre no más del 10% del total
de las observaciones.
D1 D2 D3 D4 D5 D6 D7 D8 D9
0% n 2n 3n 4n 5n 6n 7n 8n 9n 100%
10 10 10 10 10 10 10 10 10
Procedimiento para el cálculo de los deciles (para datos agrupados en tablas con intervalos)
Para calcular los deciles D1, D2, D3, D4, D5, D6, D7, D8, D9 (D5= Mediana) seguiremos el
siguiente procedimiento.
i*n
Se calcula donde i=1,2,3,……,9
10
Cuando i=5 corresponde a la mediana.
Se identifica la clase y el intervalo que contiene a D i. Esto por medio de las
frecuencias absolutas y acumuladas, a través, de la siguiente desigualdad.
i*n
Fd-1≤ Fd
10
Se aplica la siguiente expresión (similar a la que se utiliza para calcular la mediana).
i*n
10 F d 1
D1= li+W
fd
Dónde:
d = Es la clase donde se encuentra el decil.
Li = Extremo inferior del intervalo que contiene el decil i.
n = Numero de datos.
Fd-1 = Frecuencia absoluta acumulada de la clase anterior a la
clase donde se encuentra el decil.
Fd = Es la frecuencia absoluta que corresponde a la clase
donde se encuentra el decil.
W = Tamaño del intervalo de clase.
Ejemplo: Determine los deciles D2 y D7 a partir de la siguiente información que corresponde
a las notas de matemática de 50 alumnos.
K [Li-Ls> fi Fi
1 [0-4> 4 4
2 [4-8> 10 14
3 [8-12> 15 29
4 [12-16> 18 47
5 [16-20> 3 50
n=50
Calculo de D2
i * n 2 * 50
1. Se calcula = 10
10 10
2. Se identifica el intervalo que contiene a D2:
i*n
Fd-1≤ Fd
10
4≤1014 F3=14, d=2 y f2=10
Entonces D2 se encuentra en la segunda clase cuyo intervalo es [4-8> y el W=8-4=4
3. Se calcula D2
10 4
D2=4+4 =6.4
10
Calcular D7
LAS QUINTILAS: k5
Las quintilas son estadígrafos de posición que dividen al total de las observaciones, en 5
partes iguales, es decir que entre dos quintilas consecutivas se encuentre no más del 20%
del total de las observaciones.
Existen 4 quintilas:
K1 K2 K3 K4
n 2n 3n 4n
0% 100%
5 5 5 5
Las fórmulas para calcular las quintilas con datos agrupados, son similares a las decilas,
cuartilas, etc. Por ejemplo para K 3 se tiene:
3* n
5 F j 1
K3= Li+W
fj
i*n
5 F j 1
y para un quintil cualquiera: Kr= Li+C
f j
LOS PERCENTILES: Pi
Los percentiles son estadígrafos de posición que dividen a la totalidad de observaciones,
en 100 partes iguales; es un estadígrafo que da una idea porcentual de la distribución de
datos. Los percentiles se aplican cuando existen numerosos valores de la variable con una
alta frecuencia total.
Existen 99 percentiles, cuyo cálculo se realiza de igual manera que la mediana, cuartilas, etc.
i*n
100 F j 1
Pr= li+W
f j
SEMANA 06
ESTADIGRAFO DE DISPERSION
Son aquellas que miden cuánto se alejan de la media cada uno de los valores de la variable.
Los estadígrafos de dispersión de mayor uso son:
1. Rango o recorrido (R)
2. Desviación media (D.M.)
3. Recorrido Semi Intercuartil (QD )
4. Varianza (s2)
5. Desviación Estándar o Típica (S)
6. Coeficiente de variación (CV)
El rango, amplitud o recorrido es la medida de dispersión más fácil del calcula, ya que depende
única y exclusivamente de los dos valores extremos del conjunto de datos con que estamos
trabajando.
El rango se define como la diferencia entre el valor máximo y el valor mínimo de las
observaciones es decir:
r=Xmáx -Xmin
b. Datos agrupados: Si las x 1' , x '2 , x 3' …, x 'm ocurre con frecuencia f1, f2, f3,…,fm
respectivamente, la desviación media se obtiene.
n
x
i 1
'
i x fi
D.M.=
n
Ejemplo:
Li-Ls x i' fi x i' f¡ xi' x xi' x fi
x
i 1
'
i fi
5
x
i 1
'
i fi
13950
x = 174.4
n 80
n
i 1
xi' x f i
2925.20
D.M.= = = 36.565
n 80
Donde Q1 y Q3 son el primer y tercer cuartil de los datos. A veces se usa el “Recorrido
Intercuartil Q3-Q1”.
El recorrido semi-intercuartil o desviación cuartil, da una idea de la dispersión del 50%
de los datos centrales.
Ejemplo:
Considerando los sueldos de los 80 trabajadores, se tiene:
208.20 140.80
Q1=140.80 Q3=208.20 Q= =33.70
2
Varianza (s2)
n
También se denota por: s2, o2
Calculo de la varianza
a. Método directo, a partir de la definición:
a.1) Para datos no agrupados (datos originales xi), se obtiene como la expresión:
n
( xi x ) 2
V ( x) s 2 i 1
n
Ejemplo:
X1=10, X2=13, X3=10, X4=14, X5=13, las edades de cinco alumnos. Aquí x =12
n
(x i x) 2
2 1 2 2 1
2 2 2 2 2
17
s
2 i 1
= 2.8 años al cuadrado
n 5 5
n
( xi' x) 2 f i
a.2) Para datos agrupados en tabla de frecuencia: s 2 i 1
n
Ejemplo: Calcular la varianza de los sueldos del conjunto de los 80
trabajadores que se viene considerando; donde x =174.40
'
2 2
' '
Li-Ls x i' fi xi xi xi xi x i x i fi
90-120 x 1' =105 f1=11 -69.40 4816.36 52980.0
120-150 x '2 =135 f2=13 -39.40 1552.36 20181.7
150-180 x 3' =165 f3=20 -9.40 88.36 1767.2
180-210 x '4 =195 f4=17 20.60 424.36 7214.1
210-240 x 5' =225 f5=15 50.60 2560.36 38405.4
240-270 x '6 =255 f6=3 80.60 6496.36 19489.1
270-300 x '7 =285 f7=1 110.60 12232.36 12232.4
Nota: En general, los estadígrafos de dispersión se usan para comparar dos o más
distribuciones o poblaciones con variables de la misma naturaleza.
A mayor dispersión o heterogeneidad entre los valores o elementos de una población, le
corresponde un valor mayor para el estadígrafo de dispersión.
El cálculo de la desviación estándar es muy simple, si se conoce la varianza.
La desviación estándar de los sueldos de los 80 trabajadores es:
s 19030.40 =43.60 dólares.
Ejercicio:
Las notas de 80 exámenes se tabularon en una distribución de frecuencias de cuatro
intervalos de amplitud iguales a cuatro, siendo el dato mínimo igual a cuatro y las frecuencias
relativas primera y tercera respectivamente 0.15 y 0.35. Calcule la varianza de las
distribuciones si la media aritmética es 13.3.
K [li-ls>
1 [4-8>
2 [8-12>
3 [12-16>
4 [16-20]
SEMANA 07
LA ASIMETRÍA Y SU MEDIDA
̅>Me> Mo
b. Asimétrica a la derecha. Es el caso en que 𝐱
Donde:
̅= Media aritmética.
𝐗
Md = Mediana.
S = desviación típica o estándar.
Si AP > 0, la distribución es asimétrica positiva o a la derecha.
Si AP = 0, la distribución es simétrica.
Si AP < 0, la distribución es asimétrica negativa o a la izquierda.
Ejemplo:
En la distribución de los sueldos de los 80 trabajadores, se conoce:
x =174.40, Mo=167 s=43.60
174.40 - 167
Ap 0.170 0
43.60
AP es positivo, por tanto tiene Asimetría Positiva, es decir hay un ligero predominio de sueldos
menores.
LA CURTOSIS Y SU MEDIDA
m4
3
s x4
Se define el Coeficiente de Curtosis de Fisher como:
n
i 1
f i ( wi x) 4
n m4
k g2 3 3
S x 4 S x4
Una distribución es Mesocúrtica si la distribución de sus datos es la misma que la de la
variable Normal. En ese caso, su coeficiente de curtosis es cero.
g2 = 0 Distribución Mesocúrtica
Ejemplo:
Donde: M4= Cuarto momento respecto a la media, S=Desviación típica.
3 4
Li- Ls fi Fi Wi W ifi Wi xi wi xi f i wi xi f i
45 - 55 6 6 50 300 -19,4 -43808,304 849881,098
55 - 65 10 16 60 600 -9,4 -8305,84 78074,896
65 - 75 19 35 70 1330 0,6 4,104 2,4624
75 - 85 11 46 80 880 10,6 13101,176 138872,466
85 - 95 4 50 90 360 20,6 34967,264 720325,638
50 3470 -4041,6 1787156,56
3470
69.4
= 50
Mo= 70.24
S= 11.029
n
f (w
i 1
i i x) 4
1787156,56
k1 n 3 50 3
S x 2 (11.029) 4
K= 0.58431795
Ejercicios:
1. Calcular el coeficiente de asimetría a partir de los siguientes datos obtenidos de una
muestra.
5 3 1 3 3 3 3 4 3 2 3 3
1 2 3 2 3 2 2 4 2 2 2 2
1 2 1 4 2 2 3 2 3 1 2 3
1 5 6 3 2 1 1 1 2 3 2 1
BIBLIOGRAFIA:
CORDOVA, Estadística descriptiva e inferencial: aplicaciones. 5º Ed.
Ediciones Moshera. Lima: 2007.
MONTGOMERY. Diseño y análisis de experimentos. 2º Ed. Editorial Limusa.
Madrid: 2008.
DEVORE, Probabilidad y estadística para Ingeniería y ciencias: México, D.F:
Cengage Learning, 2008
SPIEGEL, Estadística. 4º Ed. Editorial McGraw-Hill. México: 2009.
WALPOLE y MYERS. Probabilidad y estadística. 6º Ed. Editorial Pearson.
México: 2006.
MONTERO, Problemas resueltos de estadística descriptiva para
ciencias sociales: Madrid: Thomson, 2008.