Professional Documents
Culture Documents
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio
miden el grado de dispersión de los valores de la variable. Dicho en otros términos
las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre
sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir
un conjunto de datos entregando información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran
ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los
datos no están en una tabla hablaremos de datos “no agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para
datos no agrupados y luego para datos agrupados.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.
Las medidas de tendencia central más comunes son:
La media aritmética: comúnmente conocida como media o promedio. Se
representa por medio de una letra M o por una X con una línea en la parte
superior.
La mediana: la cual es el puntaje que se ubica en el centro de una
distribución. Se representa como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en una
distribución. Se representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la mejor
y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos
puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable
utilizar la mediana o la moda. (Porque dadas las características de la media, esta
es afectada por los valores extremos).
La media es considerada como la mejor medida de tendencia central, por las
siguientes razones:
Los puntajes contribuyen de manera proporcional al hacer el cómputo de la
media.
Es la medida de tendencia central más conocida y utilizada.
Las medias de dos o más distribuciones pueden ser fácilmente promediadas
mientras que las medianas y las modas de las distribuciones no se
promedian.
La media se utiliza en procesos y técnicas estadísticas más complejas
mientras que la mediana y la moda en muy pocos casos.
MEDIDAS DE DISPERSIÓN
El objetivo del estudio de los parámetros estadísticos es obtener información
resumida del conjunto de datos en los que estamos interesados. Ya hemos
resumido nuestros datos en un número, por ejemplo, la media. Pero ¿es
representativo ese valor?
Comencemos con un ejemplo.
"Supongamos que dos alumnos han realizado cinco exámenes cada uno. Para
evaluarlos elegimos hacer la media de las cinco notas que han obtenido.
Las notas han sido:
ALUMNO 1: 4, 5, 5, 5, 6. Media = 5
ALUMNO 2: 1, 2, 5, 8, 9. Media = 5
Si vemos los dos tendrían la misma nota, lo que nos haría pensar que los dos
alumnos son similares, pero si observamos sus notas hay una gran diferencia entre
ambos. El alumno 1 tiene unas notas muy homogéneas, muy próximas a la media
mientras que el segundo tiene unos resultados muy dispares."
Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos
mida esa variabilidad. Estamos hablando de las medidas de dispersión.
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la
variabilidad de los datos, es decir, si la distribución de los datos es más o menos
homogénea y por tanto nos dan una medida sobre la representatividad de los
parámetros de centralización (moda, mediana o media)
Como en los parámetros de centralización y de posición existen varios para medir
la dispersión. Los principales son:
Rango O Recorrido
Es la diferencia entre el mayor valor de los datos y el menor.
Re = Max {xi} - Min {xi}
La principal ventaja del rango es su fácil cálculo, aunque su valor es poco
significativo, ya que sólo tiene en cuenta los dos valores extremos.
Rango O Recorrido Intercuatílico
Es la diferencia entre el tercer cuartil y el primero, el rango donde se encuentra el
50% central de los datos.
RI = Q3 - Q1
En ocasiones también se suele usar como valor la mitad del rango intercuartílico,
hablando en este caso de recorrido semi-intercuartil.
Estas dos primeras medidas de dispersión se suelen utilizar cuando el cálculo de la
media no es posible o ésta no es significativa.
Desviación Media
La desviación media es la media de la distancia de los valores de los datos (en valor
absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con
distancias positivas, lo que daría como resultado que la desviación media sea cero
para cualquier distribución de datos.
Varianza
Como hemos referido antes para evitar que se anulen diferencias positivas y
negativas, en la desviación media se toma valor absoluto. Dado que la función valor
absoluto no tiene unas buenas propiedades matemáticas (por ejemplo, no es
derivable) otra manera de transformar los valores negativos en positivos es
elevando al cuadrado.
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores
de los datos a la media.
Desviación Típica
Definimos la desviación típica como la raíz cuadrada de la varianza.
MEDIDAS DE POSICIÓN
Las medidas de posición relativa se llaman en general cuantiles y se pueden
clasificar en tres grandes grupos: Cuartiles, deciles, percentiles.
Si bien la mediana divide el conjunto de datos en dos partes iguales, existen otros
parámetros estadísticos que dividen a la población en otras cuantías distintas.
Los cálculos son similares a los de la mediana, variando la posición a buscar y el
intervalo en el que se encuentra el cuantil.
Los más importantes son los siguientes:
Cuartiles
Dividen a la población de datos en cuatro partes iguales, correspondiendo cada uno
de ellos al 25% de los datos. Tenemos por tanto tres cuartiles que denotamos como
Q1, Q2, Q3, y se les llama primer, segundo y tercer cuartil.
El segundo cuartil coincide con la mediana.
Deciles
Dividen la distribución de datos en 10 partes iguales, correspondiendo cada uno al
10% de los datos. Tendríamos, por tanto, nueve deciles que denotamos por D1, D2,
D3, ..., D9
El quinto decil coincide con la mediana.
Percentiles
Tenemos 99 percentiles que dividirían a la población en 100 partes iguales,
denotados por P1, P2, ..., P98, P99.
Los percentiles 25, 50 y 75 coinciden con los cuartiles.