You are on page 1of 20

DIRECCIN DE ESTADSTICAS DE LA PROVINCIA

INTRODUCCIN A LA ESTADSTICA DESCRIPTIVA


Lazarte Vctor Fabio y Naidicz Paula Lorena

MEDIDAS DE POSICIN Y DISPERSIN

MEDIDAS DE POSICIN: Resumen la informacin referida de la posicin de la muestra. Las medidas de posicin ms utilizadas son: Media, Mediana, Moda y Cuartiles, las tres primeras, media, mediana y moda son medidas de tendencia central. Supongamos que los datos observados son: x1, x2, , xn.

Media: es el promedio de los datos

Ejemplo 1: Las notas de un alumno son: 10, 8, 7, 9, 10, 7, 6.

Nota promedio

En este caso la media es un buen representante del rendimiento acadmico del alumno.

La media tiene la propiedad de equilibrar los desvos.

Ejemplo 2: En el ejemplo de la cantidad de miembros de una familia de cierta ciudad. La cantidad promedio de miembros de una familia es
x x x x x x x x x x x x x x x x x x x x x x

x x

x x x x x

x x x x x x x x x

x x x x x x x x x x x x x x x x x x x x

x x x x x x x x x x x

x x x x x x

x x x

x x

10

Existen casos en donde la media no es un buen representante del conjunto de datos. Ejemplo 3: Una empresa tiene 5 empleados, sus sueldos en pesos son: 1000, 1000, 1000, 1000, 10000. Entonces la media es : El dueo de la empresa dira orgulloso El sueldo promedio de los empleados mi empresa es de $ 2800 al mes!!

Pero claramente, la media no es un buen representante de este conjunto de datos, dado que hay 4 empleados que ganan slo 1000 y slo uno que gana 10000.

En general cuando la muestra tenga valores alejados o presente asimetra, la media no ser un buen representante del conjunto de datos.
Una medida de posicin alternativa a la media sera la Mediana.

La Mediana: Es el valor central de la muestra ordenada.

Si la cantidad de datos es impar, la mediana es el valor central de la muestra ordenada. Si la cantidad de datos es par, la mediana es el promedio de los dos datos centrales de la muestra ordenada.

Ejemplos

Para n impar. Notas de un alumno A: 10, 8, 7, 9, 10, Datos ordenados: 6, 7, 7, 8, 7, 6.

9, 10, 10.

La mediana de las notas es 8. Notacin:

Para n par Notas de un alumno B: Datos ordenados: 10, 8, 7, 9, 10, 7, 6, 9.

6, 7, 7, 8, 9, 9, 10, 10.

La mediana de las notas es:


7

En el ejemplo de la empresa con 5 empleados la mediana sera igual a $ 1000, por lo tanto sera un mejor representante del conjunto de datos.

La mediana no es afectada por valores alejados ni es afectada por asimetra.

Cuartiles: En cierta forma, dividen el lote de datos ordenado en cuatro partes iguales. Para calcular los cuartiles, se toma la primera mitad de la muestra ordenada y se calcula la mediana de este conjunto que ser el primer cuartil, para el tercer cuartil se trabaja igual con los datos de la segunda mitad.
8

Ejemplos

Para n impar Datos ordenados: Primer cuartil: Q1 = 7 6, 7, 7, 8, 9, 10, 10.

Tercer cuartil: Q3 = 9,5

Para n par Datos ordenados: Primer cuartil: Q1 = 7 6, 7, 7, 8, 9, 9, 10, 10. Tercer cuartil: Q3 = 9,5

Moda: Es el dato ms frecuente (si es que este existe)

En los ejemplos de las notas del alumno no existe la moda por que hay varios datos que se repiten dos veces.

6,

7, 7, 8,

9, 10, 10

En el ejemplo de la empresa con 5 empleados los datos son: 1000, 1000, 1000, 1000, 10000

As la moda es igual a $ 1000, por lo tanto sera un buen representante del conjunto de datos.

10

En el ejemplo de la cantidad de miembros de una familia Cul sera la moda?


Cantidad de miembros 1 2 3 4 5 6 7 8 10 Total Cantidad de familias 2 5 9 22 20 11 6 3 2 80 Porcentajes 2,5 % 6,3 % 11,3 % 27,5 % 25,0 % 13,8 % 7,5 % 3,8 % 2,5 % 100,0 % % acumulado 2,5 % 8,8 % 20,0 % 47,5 % 72,5 % 86,3 % 93,8 % 97,5 % 100,0 %

Moda Mediana

11

MEDIDAS DE DISPERSIN

Ejemplo :
Notas del alumno Juan: 6, 6, 8, 10, 10. Notas del alumno Pedro: 8, 8, 8, 8, 8. La nota promedio de los dos alumnos es 8, sin embargo claramente su desempeo no es igual. Cmo los comparo? Cul es la diferencia? Una medida de dispersin es una medida de cuan alejados estn los datos del centro de la distribucin, ya sea que se tome como centro a la media o a la mediana de los datos

12

Varianza muestral: La varianza es el promedio de los desvos al cuadrado, es decir, se mide la distancia de cada dato a la media, se la eleva al cuadrado y se las promedia.

Desviacin Estndar: es la raz cuadrada positiva de la varianza.

13

Ejemplo: Notas del alumno Juan: 6, 6, 8, 10, 10. La media es 8 por lo tanto los desvos son: -2, -2, 0, 2, 2, los desvos al cuadrado son: 4, 4, 0, 4, 4.

La varianza ser:
Desviacin Estndar:

Para el alumno Pedro naturalmente la varianza y la desviacin estndar sern iguales a cero.
14

Coeficiente de variacin El coeficiente de variacin es una medida de la magnitud de la dispersin en relacin a la media.

Estas tres medidas toman como centro a la media, por lo tanto estn asociadas a ella. Si el lote de datos es simtrico y no tiene valores alejados, utilizaremos a la media y la desviacin estndar para describir el conjunto de datos.

15

Una medida de dispersin asociada a la mediana es el Rango Intercuartil. El Rango intercuartil es simplemente la diferencia entre el primer y el tercer cuartil: RI = Q3 Q1

Si el conjunto de datos es simtrico y no tiene valores alejados se recomienda utilizar a la media como medida de posicin con la desviacin estndar como medida de dispersin. Si el conjunto de datos es asimtrico o tiene valores alejados se recomienda utilizar a la mediana como medida de posicin con el rango intercuartil como medida de dispersin.

16

Cmo analizo simetra?


Grficamente Coeficiente de asimetra:

Figura 5: Ejemplo de una distribucin asimtrica positiva


80 70 60

Frecuencias

50 40 30 20 10 0

1000

2000

3000

4000

5000

6000

7000

8000

9000

10000

11000

12000

17

Valores alejados: Estos son valores observados que se apartan demasiado del resto de la muestra. Para detectarlos se puede utilizar la siguiente regla:

Si un valor xi de la muestra es menor que Q1 1.5 (Q3 Q1) , entonces xi es alejado por defecto. Si un valor xi de la muestra es mayor que Q3 + 1.5 (Q3 Q1) , entonces xi es alejado por exceso.

No significa que haya que descartar ese dato, significa que hay que estudiar ese caso y usar medidas que no se vean afectadas por valores alejados.
18

Diagrama de tipo caja: Se deben calcular mnimo y mximo, mediana, Q1 , Q3 y Detectar valores alejados
Figura 5: Peso en gramos de los recin nacidos en un cierto periodo de una cierta ciudad.
4500

Peso en gr.

3500

2500

1500

19

Diagrama de tipo caja:

Figura 5: Cantidad de miembros de una familia.


10 Cantidad de miembros 0 2 4 6 8

20

You might also like