You are on page 1of 39

Asignatura: Estadística

Clase del 22 de febrero de 2018


Medidas de forma
Coeficiente de sesgo o de asimetría y curtosis
Coeficiente de sesgo o de asimetría
DEFINICIÓN: Sean 𝟏 𝟐 𝒏 datos con media y
desviación estándar muestral 𝒏 𝟏 , entonces se llama
coeficiente de sesgo o coeficiente de asimetría a la
medida que representa el grado de asimetría de la gráfica
y lo denotaremos por , y se usan dos fórmulas para el
cálculo:
𝒏 𝟑
𝒊
𝟏
𝒏 𝟏
𝒊 𝟏

𝒏 𝟑
𝟑 𝒊
𝟐 𝟑
𝒏 𝟏 𝒏 𝟏
𝒊 𝟏
Coeficiente de
sesgo o de
asimetría
𝟏
Donde, 𝟑 𝒏
𝒊 𝟏 𝒊
𝟑
es el tercer momento respecto al
𝒏
origen, y 𝒏 𝟏 es la desviación estándar correspondiente a la
varianza insesgada o muestral.

El caracteriza el grado de alejamiento de los datos con


respecto a su media y generalmente se encuentra entre -4 y 4.

Asimétrica a la izquierda o sesgo negativo cumple .Y


asimétrica a la derecha o sesgo positivo cumple .
Cuando es insesgado o simétrica .
Coeficiente de sesgo o de asimetría
Coeficiente de sesgo o de asimetría
EJEMPLO: Calcular para los datos referentes a la estatura de 50
estudiantes del IPN. Ver siguiente tabla.

173.50 171.40 178.20 165.70 180.00 174.60 176.00 168.50 180.10 165.90
169.00 175.40 176.50 164.00 167.50 158.40 168.00 172.80 172.50 173.20
170.50 180.50 171.80 184.30 178.50 172.00 174.50 173.00 176.30 186.40
167.50 165.70 165.00 178.00 177.50 181.00 179.50 174.60 173.20 172.90
170.50 181.30 160.60 168.50 170.00 171.00 176.50 178.90 180.00 169.00

Solución: Para calcular 𝟏 se calcula la media y la desviación


estándar, y 𝒏 𝟏 .
𝒏 𝟑 𝟓𝟎 𝟑
𝒊 𝒊
𝟏
𝒏 𝟏
𝒊 𝟏 𝒊 𝟏
Coeficiente de sesgo o de asimetría

Sigue solución:

Para la segunda fórmula,


𝒏 𝟑
𝟑 𝒊
𝟐 𝟑
𝒏 𝟏 𝒏 𝟏
𝒊 𝟏

Los datos tienen sesgo negativo o son asimétricos a la izquierda.


Ejemplo: Estatura de 50 estudiantes
del IPN
 En excel:

=COEFICIENTE.ASIMETRIA()

 En R:
library(e1071)
> skewness(dat,type=1)
[1] -0.1683637
> skewness(dat,type=2)
[1] -0.1736162
> skewness(dat,type=3)
[1] -0.1633381
Coeficiente de asimetría en R
Curtosis
DEFINICIÓN: Sean 𝟏 𝟐 𝒏, datos con media y
desviación estándar muestral 𝒏 𝟏 , entonces llamamos
curtosis a la medida que representa el achatamiento
relativo de la distribución de los datos al compararse con la
distribución normal.

En la literatura se encuentran diferentes fórmulas para su


cálculo,
Curtosis
Las fórmulas son:
𝒏 𝟒 𝟐
𝒊
𝟏
𝒏 𝟏
𝒊 𝟏

𝒏 𝟒
𝒊
𝟐
𝒏 𝟏
𝒊 𝟏

𝒏 𝟒
𝟒 𝒊
𝟑 𝟒
𝒏 𝟏 𝒏 𝟏
𝒊 𝟏

𝒏 𝟒
𝟒 𝒊
𝟒 𝟒
𝒏 𝟏 𝒏 𝟏
𝒊 𝟏
Curtosis
Las fórmulas son:

𝟏 𝟑

𝟐 𝟒
Curtosis
EJEMPLO: Para los datos del ejemplo referente a la estatura de 50
estudiantes del IPN.
𝒏 𝟒 𝟐
𝒊
𝟏
𝒏 𝟏
𝒊 𝟏

𝒏 𝟒 𝟐
𝒊
𝟏
𝒊 𝟏

𝟐
𝟏

La distribución de los datos es poco menos apuntada que la normal,


y representan una muestra con forma platicúrtica.
Curtosis

 En Excel:

=CURTOSIS()

-0.12982

 En R:

> kurtosis(dat,type=1)
[1] -0.2348476
> kurtosis(dat,type=2)
[1] -0.1298246
> kurtosis(dat,type=3)
[1] -0.3443477
Kurtosis en R
Estadística descriptiva para
datos agrupados
Tabla de distribución de frecuencias
Tabla de distribución de frecuencias
Distribución de frecuencias

Intervalos de clase o clases de frecuencia: Se utiliza la


notación del Cálculo para los intervalos abiertos y cerrados,
por ejemplo:

Intervalo de
Clase
clase
1 [1,4]
2 (4,7]
3 (7,10]

No puede existir traslape en ningún


intervalo.
Distribución de frecuencias

Marcas de clase: Es el punto medio de una clase. Se


considera como el valor representativo de un intervalo. Se
obtienen promediando los límites de un intervalo. Se
denota por 𝒊 .

Intervalo de Marca de clase


Clase
clase 𝒊
1 [28.5,36.5]
2 (36.5,44.5]
3 (44.5,52.5]
Distribución de frecuencias

Intervalo de Marca de clase


Clase
clase 𝒊
1 [28.5,36.5] 32.5
2 (36.5,44.5] 40.5
3 (44.5,52.5] 48.5
Distribución de frecuencias
Distribución de frecuencias

Frecuencia: Es el número de elementos en la muestra o en


la población que pertenecen a la clase en cuestión. Se
denota por 𝒊 . Si los datos de una muestra son: 1, 9, 5, 8, 4,
1, 2, 7, 6, 3, 3, 2, 7, 9; entonces al agrupar por intervalos se
obtienen las siguientes frecuencias.

Marca
Clase Intervalo Frecuencia
de clase
de clase 𝒊
𝒊
1 [0,3]
2 (3,6]
3 (6,9]
Distribución de frecuencias

Marca
Clase Intervalo Frecuencia
de clase
de clase 𝒊
𝒊
1 [0,3] 1.5 6
2 (3,6] 4.5 3
3 (6,9] 7.5 5
Distribución de frecuencias

Frecuencia acumulada: Es el número de datos en la


muestra o población, que son menores o iguales que el
límite superior del intervalo en cuestión. Se denota por 𝒊 , y
se obtiene sumando la frecuencia del intervalo actual y de
los intervalos anteriores.

Marca Frecuencia
Clase Intervalo Frecuencia
de clase acumulada
de clase 𝒊
𝒊 𝒊
1 [0,3] 1.5 6
2 (3,6] 4.5 3
3 (6,9] 7.5 5
Distribución de frecuencias

Marca Frecuencia
Clase Intervalo Frecuencia
de clase acumulada
de clase 𝒊
𝒊 𝒊
1 [0,3] 1.5 6 6
2 (3,6] 4.5 3 6+3=9
3 (6,9] 7.5 5 6+3+5=14
Distribución de frecuencias

Frecuencia relativa: Es la proporción de datos que


pertenecen a la clase en cuestión. Se denota por ∗𝒊 . Es el
cociente de la frecuencia entre el número total de datos,
𝒇𝒊
esto es: ∗𝒊 . Para la tabla del ejemplo si ,
𝒏
entonces:
Marca Frecuencia Frecuencia
Clase Intervalo Frecuencia
de clase acumulada relativa
de clase 𝒊 ∗
𝒊 𝒊 𝒊
1 [0,3] 1.5 6 6
2 (3,6] 4.5 3 6+3=9
3 (6,9] 7.5 5 6+3+5=14
Distribución de frecuencias

Marca Frecuencia Frecuencia


Clase Intervalo Frecuencia
de clase acumulada relativa
de clase 𝒊 ∗
𝒊 𝒊 𝒊
1 [0,3] 1.5 6 6 6/14=0.428
2 (3,6] 4.5 3 6+3=9 3/14=0.214
3 (6,9] 7.5 5 6+3+5=14 5/14=0.357
Distribución de frecuencias

Frecuencia acumulada relativa: Es la proporción de los


datos en la muestra o población que son menores o iguales
al límite superior de la clase en cuestión. Se denota por ∗𝒊 .
Es el cociente de la frecuencia acumulada entre el número
𝑭𝒊
de datos: ∗𝒊 . Del ejemplo:
𝒏

Frecuencia Frecuencia
Intervalo Marca de Frecuencia
Clase 𝒊 Frecuencia 𝒇𝒊 relativa acumulada
de clase clase 𝒙𝒊 acumulada 𝑭𝒊
𝒇∗𝒊 relativa 𝑭∗𝒊

1 [0,3] 1.5 6 6 6/14=0.428


2 (3,6] 4.5 3 6+3=9 3/14=0.214
3 (6,9] 7.5 5 6+3+5=14 5/14=0.357
Distribución de frecuencias

Frecuencia Frecuencia
Intervalo Marca de Frecuencia
Clase 𝒊 Frecuencia 𝒇𝒊 relativa acumulada
de clase clase 𝒙𝒊 acumulada 𝑭𝒊
𝒇∗𝒊 relativa 𝑭∗𝒊

1 [0,3] 1.5 6 6 6/14=0.428 0.428


2 (3,6] 4.5 3 6+3=9 3/14=0.214 0.642
3 (6,9] 7.5 5 6+3+5=14 5/14=0.357 1
Distribución de frecuencias

Longitud de clase: Es la diferencia entre el límite superior y el


inferior de una misma clase. Se denota por .

Cualquier tabla que contenga una columna de intervalo y


una columna de frecuencias, es una tabla de distribución
de frecuencias.

A continuación se construirá una tabla de distribución de


frecuencias completa.
Para construir una tabla de
distribución de frecuencias
 El número de clases estará entre 5 y 20. La primera
aproximación del número de clases se obtendrá con .

 Todas las clases serán de la misma longitud .

 La longitud de clase se aproxima mediante:

Donde:
Para construir una tabla de
distribución de frecuencias

Posteriormente se ajusta de manera conveniente, de forma


que el primer límite inferior sea ligeramente menor o igual
que el menor valor, y el último límite superior sea
ligeramente mayor o igual que el mayor dato.

 Tratará de evitarse que haya clases con frecuencia cero.

 La primera y última clase nunca tendrán frecuencia


cero.
Construir una tabla de distribución de
frecuencias
Ejemplo: Los siguientes valores representan el tiempo diario
de transporte de una muestra de 50 alumnos de cierta
universidad al sur de Copilco.
69 56 73 66 64 44 36 69 76 53
79 72 82 77 71 48 49 49 60 67
73 70 64 56 31 62 56 55 51 45
30 40 80 49 59 60 76 67 30 72
45 43 77 49 46 42 63 41 64 79

Construir una tabla de distribución de frecuencias


completa.
Construir una tabla de distribución de
frecuencias
Solución:

La primera aproximación del número de intervalos con


, por lo que se utilizarán 7 intervalos. El
menor de los datos es 30 y el mayor es 82, por lo que el
rango es:

𝟓𝟐
Por lo que la longitud del intervalo aproximado es
𝟕
, por lo que se utilizará una longitud de .

Puesto que el menor valor es 30, se toma la decisión de


iniciar en 28, teniéndose:
Tabla de distribución de frecuencias
Tabla de distribución de frecuencias
Ejemplo en clase.
Ejercicio en clase
Frecuencia
Marcas de Frecuencia Frecuencia
Clase Intervalo Frecuencia acumulada
Conteo clase relativa acumulada xi fi
i i fi relativa
xi fi* Fi
Fi*

1 [30,40] 35 9 0.1125 9 0.1125 315


2 (40,50] 45 6 0.0750 15 0.1875 270
3 (50,60] 55 5 0.0625 20 0.2500 275
4 (60,70] 65 15 0.1875 35 0.4375 975
5 (70,80] 75 12 0.1500 47 0.5875 900
6 (80,90] 85 15 0.1875 62 0.7750 1275
7 (90,100] 95 18 0.2250 80 1.0000 1710

Suma 5720

You might also like