You are on page 1of 15

ESTADSTICA DESCRIPTIVA

FASE 2: CLCULO DE MEDIDAS ESTADSTICAS, INTERPRETACIN DE


RESULTADOS Y CONCLUSIONES.

PRESENTADO A: ANTONIO ALVAREZ TUTOR

PRESENTADO POR:
CARLOS ALBERTO CASTRO GODOY
JOSE IGNACIO SALAMANCA TOVAR
FREDDY WILSON SAENZ ROJAS

GRUPO COLABORATIVO ANTALVAREZ14

t2_ANTALVAREZ14

PRIMER PERIODO
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
BOGOTA 2008

CALCULO DE MEDIDAS ESTADISTICAS


En la realizacin de las medidas estadsticas ,tenemos que tener en cuenta si la
variable que estamos analizando es discreta o continua las variables estadsticas
cuantitativas se dividen o clasifican en discretas o continuas, por lo que necesitaremos
precisar cmo se calculan dichas medidas en cada caso i. Para el caso que se esta
estudiando nmero de reclamos efectuados por facturacin durante una semana en
el call center o acualiniea 116. Es una variable discreta, pero debido a la gran
cantidad de datos fue necesario emplear el concepto de intervalos de clase para la
distribucin de frecuencias. A continuacin se presenta un resumen de la tabla de
distribucin de frecuencias.
RESUMEN PRESENTACION Y ORGANIZACIN DE DATOS
Tamao de muestra
RANGO
NUMERO DE INTERVALOS DE
CLASE
Ancho de intervalo de clase
MINIMO
MAXIMO

90,00
97,00
7,00
13,86
101,00
198,00

Con esta informacin obtenemos le tabla de distribucin de frecuencias de los datos:

Estos fueron los resultados calculados en la primera etapa del trabajo.


Marca de clase
INTERVALOS
Frecuencia
% acumulado
Xi
f*Xi
101-114,86
1,00
1,11%
97,50
97,50
114,85-128,71
5,00
6,67%
112,50
562,50
128,71-142,57
16,00
24,44%
127,50
2040,00
142,57-156,43
21,00
47,78%
142,50
2992,50
156,42-170,29
17,00
66,67%
157,50
2677,50
170,28-184,14
11,00
78,89%
172,50
1897,50
184,14-198,00
9,00
88,89%
187,50
1687,50
198<
10,00
100,00%
202,50
2025,00
y mayor...
0,00
100,00%
TOTAL
90,00
13980,00

1.

Medidas de tendencia central

1.1 Media aritmtica a partir de la distribucin de frecuencias

1.2 Mediana
Clase de la mediana:

INTERVALOS
101-114,86
114,85-128,71
128,71-142,57
142,57-156,43
156,42-170,29
170,28-184,14
184,14-198,00
198<
y mayor...
TOTAL

Frecuencia
% acumulado
1,00
1,11%
5,00
6,67%
16,00
24,44%
21,00
47,78%
17,00
66,67%
11,00
78,89%
9,00
88,89%
10,00
100,00%
0,00
100,00%
90,00

Marca de clase
Xi
97,50
112,50
127,50
142,50
157,50
172,50
187,50
202,50

f*Xi
97,50
562,50
2040,00
2992,50
2677,50
1897,50
1687,50
2025,00

Frecuencia
acum
1,00
6,00
22,00
43,00
60,00
71,00
80,00
90,00

13980,00

La fila resaltada con amarillo nos ubica a la mediana, dado que 45 esta contenido en la
frecuencia acumulada de 60, por lo tanto podemos decir que la mediana es 156,42170,29, hay 43 observaciones por debajo del lmite inferior de la clase de la mediana.
Con estos datos se puede calcular la mediana:
Dando la mediana 145.5 , resultado de interpolar

En el grafico observamos la interseccin de las frecuencias ascendentes y


descendentes que corresponde a la mediana.

1.1 Moda
Dado que los datos fueron agrupados la moda se considera como la marca de
clase del intervalo de clase que contiene la mayor frecuencia
INTERVALOS
101-114,86
114,85-128,71
128,71-142,57
142,57-156,43
156,42-170,29
170,28-184,14
184,14-198,00
198<
y mayor...
TOTAL

Frecuencia
% acumulado
1,00
1,11%
5,00
6,67%
16,00
24,44%
21,00
47,78%
17,00
66,67%
11,00
78,89%
9,00
88,89%
10,00
100,00%
0,00
100,00%
90,00

Marca de clase
Xi
97,50
112,50
127,50
142,50
157,50
172,50
187,50
202,50

f*Xi
97,50
562,50
2040,00
2992,50
2677,50
1897,50
1687,50
2025,00

Frecuencia
acum
1,00
6,00
22,00
43,00
60,00
71,00
80,00
90,00

13980,00

La fila subrayada con amarillo corresponde el intervalo que mayor frecuencia tiene, de
donde la moda es :
Mo1=142.5

De acuerdo a los resultados anteriores podemos decir que tiene:


La variable nmero de reclamos efectuados por facturacin durante una semana
en el call center o acualiniea 116. Presenta una distribucin asimtrica positiva dado
que :
Mo<Me<

Especficamente tiene una distribucin asimtrica positiva , dado que tiene

valores excepcionalmente grandes .

1.1
OTRAS MEDIDAS DE TENDENCIA CENTRAL

1.1.1

MEDIA GEOMETRICA

De acuerdo a la tabla 1 podemos decir que la media geomtrica esta dada por:
INTERVALOS
101-114,86
114,85-128,71
128,71-142,57
142,57-156,43
156,42-170,29
170,28-184,14
184,14-198,00
198<
y mayor...
TOTAL

1.2.1

Frecuencia
% acumulado
1,00
1,11%
5,00
6,67%
16,00
24,44%
21,00
47,78%
17,00
66,67%
11,00
78,89%
9,00
88,89%
10,00
100,00%
0,00
100,00%
90,00

Marca de clase
Xi
97,50
112,50
127,50
142,50
157,50
172,50
187,50
202,50

f*Xi
97,50
562,50
2040,00
2992,50
2677,50
1897,50
1687,50
2025,00

Frecuencia
acum
1,00
6,00
22,00
43,00
60,00
71,00
80,00
90,00

13980,00

CUARTILES

Q1 (25,0%) = 129,0 (EL 25% DE LAS OBSERVACIONES ESTAN POR DEBAJO DE


129.0)
Q2 (50,0%) = 145,5
Q3 (75,0%)= 164,0

1.2.2

PERCENTILES

Percentiles para RECLAMOS


1,0% = 101,0
5,0% = 112,0
10,0% = 117,0
25,0% = 129,0
50,0% = 145,5
75,0% = 164,0
90,0% = 185,0
95,0% = 195,0
99,0% = 198,0
2

Medidas de dispersin

2.1 RANGO O RECORRIDO


RANGO=198-101=97
2.2 RANGO INTERCUARTILICO

2.3 VARIANZA

INTERVALOS
101-114,86
114,85-128,71
128,71-142,57
142,57-156,43
156,42-170,29
170,28-184,14
184,14-198,00
198<
y mayor...
TOTAL

Marca de clase
Frecuencia Xi
F*X^2
1,00
97,50
9506,25
5,00
112,50
63281,25
16,00
127,50 260100,00
21,00
142,50 426431,25
17,00
157,50 421706,25
11,00
172,50 327318,75
9,00
187,50 316406,25
10,00
202,50 410062,50
0,00
90,00
2234812,50

2.4 DESVIACIN TPICA O ESTNDAR

2.5 COEFICIENTE DE VARIACIN

2.6 DESVIACIN MEDIA


INTERVALOS
101-114,86
114,85-128,71
128,71-142,57
142,57-156,43
156,42-170,29
170,28-184,14
184,14-198,00
198<
y mayor...
TOTAL

Marca de clase F*(XFrecuencia Xi


MEDIA)
1,00
97,50
57,83
5,00
112,50
214,17
16,00
127,50
445,33
21,00
142,50
269,50
17,00
157,50
36,83
11,00
172,50
188,83
9,00
187,50
289,50
10,00
202,50
471,67
0,00
90,00
1973,67

2.7 COEFICIENTE DE DESVIACIN MEDIA

2.8 PUNTAJE TPICO O ESTANDARIZADO


Con ayuda del paquete estadstico SPSS graficamos el histograma conjunto con
la campana de GAUSS.

HISTOGRAM A ACUM ULADO PARA LA VARIABLE RECLAM OS


CON CURVA NORMAL

Porcentaje

20%

15%

10%

5%

0%
120,00

140,00

160,00

180,00

RECLAMOS

MARCA DE CLASES ESTANDARIZADAS


Z=(XMarca de clase Xi MEDIA)/S
97,50
-2,33
112,50
-1,73
127,50
-1,12
142,50
-0,52
157,50
0,09
172,50
0,69
187,50
1,30
202,50
1,90
3

ASIMETRIA Y APUNTAMIENTO

3.1 ASIMETRA
De acuerdo a lo mostrado en la figura y los valores de la media mediana y moda
Dado que:
Mo<Me<

Especficamente tiene una distribucin asimtrica positiva , dado que tiene

valores excepcionalmente grandes sesgo alargamiento a la derecha.


3.2 COEFICIENTE DE PEARSON

3.3 MEDIA DE BOWLEY


Con los cuartiles
Q1 (25,0%) = 129,0 (EL 25% DE LAS OBSERVACIONES ESTAN POR DEBAJO DE
129.0)
Q2 (50,0%) = 145,5 (EL 50% DE LAS OBSERVACIONES ESTAN POR DEBAJO DE
145.5)
Q3 (75,0%)= 164,0 (EL 75% DE LAS OBSERVACIONES ESTAN POR DEBAJO DE
164.0)

Dado que

>0 La distribucin es Asimtrica positiva

3.4 CURTOSIS
INTERVALOS
101-114,86
114,85-128,71
128,71-142,57
142,57-156,43
156,42-170,29
170,28-184,14
184,14-198,00
198<
y mayor...
TOTAL

Frecuencia
Z=(X-MEDIA)/S z^4*f
1,00
-2,33
29,67
5,00
-1,73
44,64
16,00
-1,12
25,47
21,00
-0,52
1,51
17,00
0,09
0,00
11,00
0,69
2,53
9,00
1,30
25,55
10,00
1,90
131,26
0,00
90,00
260,63

S=24.78

Dado que Ap.<3 La distribucin es achatada y platicurtica

4. MEDIDIAS ESTADISTICAS BIVARIANTES

LOS RECLAMOS SE PUEDEN REALIZAR VIA INTERNET ESTA TABLA


PRESENTA UNA RELACION ENTRE NUMERO DE USUARIOS EL TIMEPO QUE
TARDA UN SISTEMA INFORMTICO EN RED EN EJECUTAR UNA INSTRUCCIN
DEPENDE DEL NMERO DE USUARIOS CONECTADOS A L. SI NO HAY
USUARIOS EL TIEMPO ES 0. TENEMOS LOS SIGUIENTES DATOS:

N usuarios

Tiempo de ejecucin
10

15

1.2

20

20

2.1

25

2.2

30

30

1.9

SE MODELARA LA DEPENDENCIA DEL TIEMPO EN FUNCION DE NUMERO DE


USUARIOS, MEDIANTE UN MODELO DE REGRESION LINEAL.

La siguiente grafica representa el diagrama de dispersin y el modelo lineal ajustado al


comportamiento de los datos
Anlisis de Regresin - Modelo Lineal Y = a + b*X
----------------------------------------------------------------------------Variable dependiente: Tiempo de ejecucin
Variable independiente: N usuarios
Coeficiente de Correlacin = 0,319908
R-cuadrado = 10,2341 porcentaje
R-cuadrado (ajustado para g.l.) = -7,7191 porcentaje
Error estndar de est. = 9,91367
Error absoluto medio = 7,74468
Estadstico de Durbin-Watson = 2,7721 (P=0,0345)
Autocorrelacin residual en Lag 1 = -0,436209

La salida muestra los resultados del ajuste al modelo lineal para describir la relacin
entre Tiempo de ejecucin y N usuarios. La ecuacin del modelo ajustado es
Tiempo de ejecucin = 2,53191 + 0,408511*N usuarios

Dado que el p-valor en la tabla ANOVA es mayor o igual a 0.01, no existe relacin
estadsticamente significativa entre Tiempo de ejecucin y N usuarios para un nivel
de confianza del 90% o superior.
El estadstico R-cuadrado indica que el modelo explica un 10,2341% de la variabilidad
en Tiempo de ejecucin. El coeficiente de correlacin es igual a 0,319908, indicando
una relacin relativamente dbil entre las variables. El error estndar de la estimacin
muestra la desviacin tpica de los residuos que es 9,91367. Este valor puede usarse
para construir lmites de la prediccin para las nuevas observaciones
El error absoluto medio (MAE) de 7,74468 es el valor medio de los residuos. El
estadstico Durbin-Watson (DW) examina los residuos para determinar si hay alguna
correlacin significativa basada en el orden en el que se han introducido los datos en
el fichero.

COMPARACION ENTRE LAS DOS MUESTRAS O VARIABLES (NUMERO DE


USUARIOS Y TIEMPO DE EJECUCION)
Muestra 1: N usuarios
Muestra 2: Tiempo de ejecucin

Muestra 1: 7 valores 10,0 hasta 30,0


Muestra 2: 7 valores 1,0 hasta 22,0
Este procedimiento est diseado para comparar dos muestras de datos. Calcular
varios estadsticos y grficos para cada muestra, y ejecutar varias pruebas para
determinar si existen diferencias estadsticamente significativas entre las dos
muestras.

N usuarios
3

frecuencia

2
1
0
1
2
3
-1

19

29

Tiempo de ejecucin
Resumen Estadstico
N usuarios
Tiempo de ejecucin
-----------------------------------------------------------Frecuencia
7
7
Media
21,4286
11,2857
Mediana
20,0
12,0
Moda
20,0
2,0
Media geomtrica 20,1527
6,36091
Varianza
55,9524
91,2381
Desviacin tpica
7,48013
9,55186
Error estndar
2,82722
3,61027
Mnimo
10,0
1,0
Mximo
30,0
22,0
Rango
20,0
21,0
Primer cuartil
15,0
2,0
Segundo cuartil
30,0
21,0
Rango intercuar.
15,0
19,0
Asimetra
-0,255997
-0,0223262
Asimetra tipi.
-0,276509
-0,024115
Curtosis
-0,967768
-2,50241
Curtosis tpificada -0,522655
-1,35146

39

Coef. de variacin 34,9073%


84,6368%
Suma
150,0
79,0
------------------------------------------------------------

Esta tabla muestra el resumen estadstico para las dos muestras de datos. Pueden
usarse otras opciones tabulares dentro de este anlisis para probar si las diferencias
entre las estadsticas de las dos muestras son estadsticamente significativas. De
particular inters est la asimetra estandarizada y la curtosis estandarizada que
puede usarse para determinar si las muestras proceden de distribuciones normales.
Los valores de estos estadsticos fuera del rango de -2 a +2 indican salidas
significativas de normalidad que tendera a invalidar las pruebas que comparan las
desviaciones normales. En este caso, ambos valores de asimetra estandarizada
estn dentro del rango esperado. Ambos valores de curtosis estandarizada estn
dentro del rango esperado.

Grfico de Cajas y Bigotes

N usuarios

Tiempo de ejecucin

10

15

20

25

30

CONCLUSIONES
La variable reclamos Especficamente tiene una distribucin asimtrica positiva, dado
que tiene valores excepcionalmente grandes , presentando un sesgo o alargamiento a
la derecha
La homogeneidad de los datos es alta presentando un coeficiente de variacin del
16%
El 90% de las observaciones estn por debajo de 185 reclamos.
Dado que Ap. <3 La distribucin para la variable reclamos es achatada y platicurtica.
El valor del coeficiente de asimetra estandarizado est dentro del rango esperado
para los datos de una distribucin normal. El valor del coeficiente de curtosis
estandarizado est dentro del rango esperado para los datos de una distribucin
normal.
CONCLUSIONES COMPARACION DOS MUESTRAS (NUMERO DE USUARIOS Y
TIEMPO DE EJECUCION)
La variacin y heterogeneidad del tiempo de ejecucin es mayor que en la variable
nmero de usuarios dado que presenta mayor valor en la varianza y en el coeficiente
de asimetra.
De acuerdo al grafico de cajas y bigotes , la variable numero de usuarios presenta un
sesgo con respecto a la media hacia la derecha en comparacin de la variable tiempo
de ejecucin que tiene una distribucin simtrica hacia ambos lados .
Las dos variables (tiempo de ejecucin y numero de usuarios) tienen una curtosis
menor a 3 de donde presentan una distribucin achatada o platicurtica

http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt15.html fecha de consulta : 23-04-08

You might also like