Professional Documents
Culture Documents
MEDIDAS DE POSICIN: Resumen la informacin referida de la posicin de la muestra. Las medidas de posicin ms utilizadas son: Media, Mediana, Moda y Cuartiles, las tres primeras, media, mediana y moda son medidas de tendencia central. Supongamos que los datos observados son: x1, x2, , xn.
Nota promedio
En este caso la media es un buen representante del rendimiento acadmico del alumno.
Ejemplo 2: En el ejemplo de la cantidad de miembros de una familia de cierta ciudad. La cantidad promedio de miembros de una familia es
x x x x x x x x x x x x x x x x x x x x x x
x x
x x x x x
x x x x x x x x x
x x x x x x x x x x x x x x x x x x x x
x x x x x x x x x x x
x x x x x x
x x x
x x
10
Existen casos en donde la media no es un buen representante del conjunto de datos. Ejemplo 3: Una empresa tiene 5 empleados, sus sueldos en pesos son: 1000, 1000, 1000, 1000, 10000. Entonces la media es : El dueo de la empresa dira orgulloso El sueldo promedio de los empleados mi empresa es de $ 2800 al mes!!
Pero claramente, la media no es un buen representante de este conjunto de datos, dado que hay 4 empleados que ganan slo 1000 y slo uno que gana 10000.
En general cuando la muestra tenga valores alejados o presente asimetra, la media no ser un buen representante del conjunto de datos.
Una medida de posicin alternativa a la media sera la Mediana.
Si la cantidad de datos es impar, la mediana es el valor central de la muestra ordenada. Si la cantidad de datos es par, la mediana es el promedio de los dos datos centrales de la muestra ordenada.
Ejemplos
9, 10, 10.
6, 7, 7, 8, 9, 9, 10, 10.
En el ejemplo de la empresa con 5 empleados la mediana sera igual a $ 1000, por lo tanto sera un mejor representante del conjunto de datos.
Cuartiles: En cierta forma, dividen el lote de datos ordenado en cuatro partes iguales. Para calcular los cuartiles, se toma la primera mitad de la muestra ordenada y se calcula la mediana de este conjunto que ser el primer cuartil, para el tercer cuartil se trabaja igual con los datos de la segunda mitad.
8
Ejemplos
Para n par Datos ordenados: Primer cuartil: Q1 = 7 6, 7, 7, 8, 9, 9, 10, 10. Tercer cuartil: Q3 = 9,5
En los ejemplos de las notas del alumno no existe la moda por que hay varios datos que se repiten dos veces.
6,
7, 7, 8,
9, 10, 10
En el ejemplo de la empresa con 5 empleados los datos son: 1000, 1000, 1000, 1000, 10000
As la moda es igual a $ 1000, por lo tanto sera un buen representante del conjunto de datos.
10
Moda Mediana
11
MEDIDAS DE DISPERSIN
Ejemplo :
Notas del alumno Juan: 6, 6, 8, 10, 10. Notas del alumno Pedro: 8, 8, 8, 8, 8. La nota promedio de los dos alumnos es 8, sin embargo claramente su desempeo no es igual. Cmo los comparo? Cul es la diferencia? Una medida de dispersin es una medida de cuan alejados estn los datos del centro de la distribucin, ya sea que se tome como centro a la media o a la mediana de los datos
12
Varianza muestral: La varianza es el promedio de los desvos al cuadrado, es decir, se mide la distancia de cada dato a la media, se la eleva al cuadrado y se las promedia.
13
Ejemplo: Notas del alumno Juan: 6, 6, 8, 10, 10. La media es 8 por lo tanto los desvos son: -2, -2, 0, 2, 2, los desvos al cuadrado son: 4, 4, 0, 4, 4.
La varianza ser:
Desviacin Estndar:
Para el alumno Pedro naturalmente la varianza y la desviacin estndar sern iguales a cero.
14
Coeficiente de variacin El coeficiente de variacin es una medida de la magnitud de la dispersin en relacin a la media.
Estas tres medidas toman como centro a la media, por lo tanto estn asociadas a ella. Si el lote de datos es simtrico y no tiene valores alejados, utilizaremos a la media y la desviacin estndar para describir el conjunto de datos.
15
Una medida de dispersin asociada a la mediana es el Rango Intercuartil. El Rango intercuartil es simplemente la diferencia entre el primer y el tercer cuartil: RI = Q3 Q1
Si el conjunto de datos es simtrico y no tiene valores alejados se recomienda utilizar a la media como medida de posicin con la desviacin estndar como medida de dispersin. Si el conjunto de datos es asimtrico o tiene valores alejados se recomienda utilizar a la mediana como medida de posicin con el rango intercuartil como medida de dispersin.
16
Frecuencias
50 40 30 20 10 0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
11000
12000
17
Valores alejados: Estos son valores observados que se apartan demasiado del resto de la muestra. Para detectarlos se puede utilizar la siguiente regla:
Si un valor xi de la muestra es menor que Q1 1.5 (Q3 Q1) , entonces xi es alejado por defecto. Si un valor xi de la muestra es mayor que Q3 + 1.5 (Q3 Q1) , entonces xi es alejado por exceso.
No significa que haya que descartar ese dato, significa que hay que estudiar ese caso y usar medidas que no se vean afectadas por valores alejados.
18
Diagrama de tipo caja: Se deben calcular mnimo y mximo, mediana, Q1 , Q3 y Detectar valores alejados
Figura 5: Peso en gramos de los recin nacidos en un cierto periodo de una cierta ciudad.
4500
Peso en gr.
3500
2500
1500
19
20