You are on page 1of 7

MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio
miden el grado de dispersión de los valores de la variable. Dicho en otros términos
las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre
sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir
un conjunto de datos entregando información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran
ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los
datos no están en una tabla hablaremos de datos “no agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para
datos no agrupados y luego para datos agrupados.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.
Las medidas de tendencia central más comunes son:
 La media aritmética: comúnmente conocida como media o promedio. Se
representa por medio de una letra M o por una X con una línea en la parte
superior.
 La mediana: la cual es el puntaje que se ubica en el centro de una
distribución. Se representa como Md.
 La moda: que es el puntaje que se presenta con mayor frecuencia en una
distribución. Se representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la mejor
y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos
puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable
utilizar la mediana o la moda. (Porque dadas las características de la media, esta
es afectada por los valores extremos).
La media es considerada como la mejor medida de tendencia central, por las
siguientes razones:
 Los puntajes contribuyen de manera proporcional al hacer el cómputo de la
media.
 Es la medida de tendencia central más conocida y utilizada.
 Las medias de dos o más distribuciones pueden ser fácilmente promediadas
mientras que las medianas y las modas de las distribuciones no se
promedian.
 La media se utiliza en procesos y técnicas estadísticas más complejas
mientras que la mediana y la moda en muy pocos casos.
MEDIDAS DE DISPERSIÓN
El objetivo del estudio de los parámetros estadísticos es obtener información
resumida del conjunto de datos en los que estamos interesados. Ya hemos
resumido nuestros datos en un número, por ejemplo, la media. Pero ¿es
representativo ese valor?
Comencemos con un ejemplo.
"Supongamos que dos alumnos han realizado cinco exámenes cada uno. Para
evaluarlos elegimos hacer la media de las cinco notas que han obtenido.
Las notas han sido:
ALUMNO 1: 4, 5, 5, 5, 6. Media = 5
ALUMNO 2: 1, 2, 5, 8, 9. Media = 5
Si vemos los dos tendrían la misma nota, lo que nos haría pensar que los dos
alumnos son similares, pero si observamos sus notas hay una gran diferencia entre
ambos. El alumno 1 tiene unas notas muy homogéneas, muy próximas a la media
mientras que el segundo tiene unos resultados muy dispares."
Para poder analizar bien sus resultados necesitaríamos otro parámetro que nos
mida esa variabilidad. Estamos hablando de las medidas de dispersión.
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la
variabilidad de los datos, es decir, si la distribución de los datos es más o menos
homogénea y por tanto nos dan una medida sobre la representatividad de los
parámetros de centralización (moda, mediana o media)
Como en los parámetros de centralización y de posición existen varios para medir
la dispersión. Los principales son:
Rango O Recorrido
Es la diferencia entre el mayor valor de los datos y el menor.
Re = Max {xi} - Min {xi}
La principal ventaja del rango es su fácil cálculo, aunque su valor es poco
significativo, ya que sólo tiene en cuenta los dos valores extremos.
Rango O Recorrido Intercuatílico
Es la diferencia entre el tercer cuartil y el primero, el rango donde se encuentra el
50% central de los datos.
RI = Q3 - Q1
En ocasiones también se suele usar como valor la mitad del rango intercuartílico,
hablando en este caso de recorrido semi-intercuartil.
Estas dos primeras medidas de dispersión se suelen utilizar cuando el cálculo de la
media no es posible o ésta no es significativa.
Desviación Media
La desviación media es la media de la distancia de los valores de los datos (en valor
absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con
distancias positivas, lo que daría como resultado que la desviación media sea cero
para cualquier distribución de datos.

Varianza
Como hemos referido antes para evitar que se anulen diferencias positivas y
negativas, en la desviación media se toma valor absoluto. Dado que la función valor
absoluto no tiene unas buenas propiedades matemáticas (por ejemplo, no es
derivable) otra manera de transformar los valores negativos en positivos es
elevando al cuadrado.
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores
de los datos a la media.

Para el cálculo se suele aplicar la expresión:

Desviación Típica
Definimos la desviación típica como la raíz cuadrada de la varianza.

o, usando la otra expresión:


El hecho de realizar la raíz cuadrada tiene por objetivo que la medida de dispersión
esté expresada en la misma unidad que la variable.
Coeficiente De Variación (De Pearson)
Dado que la desviación típica es una medida que está expresada en las mismas
unidades que la variable, si queremos comparar dispersiones a escalas distintas
necesitamos un parámetro adimensional. En estas situaciones usaremos el
coeficiente de variación que se expresa tanto de forma decimal como en tanto por
ciento, y nos expresaría la desviación típica como porcentaje con respecto a la
media.

MEDIDAS DE POSICIÓN
Las medidas de posición relativa se llaman en general cuantiles y se pueden
clasificar en tres grandes grupos: Cuartiles, deciles, percentiles.
Si bien la mediana divide el conjunto de datos en dos partes iguales, existen otros
parámetros estadísticos que dividen a la población en otras cuantías distintas.
Los cálculos son similares a los de la mediana, variando la posición a buscar y el
intervalo en el que se encuentra el cuantil.
Los más importantes son los siguientes:
Cuartiles
Dividen a la población de datos en cuatro partes iguales, correspondiendo cada uno
de ellos al 25% de los datos. Tenemos por tanto tres cuartiles que denotamos como
Q1, Q2, Q3, y se les llama primer, segundo y tercer cuartil.
El segundo cuartil coincide con la mediana.
Deciles
Dividen la distribución de datos en 10 partes iguales, correspondiendo cada uno al
10% de los datos. Tendríamos, por tanto, nueve deciles que denotamos por D1, D2,
D3, ..., D9
El quinto decil coincide con la mediana.

Percentiles
Tenemos 99 percentiles que dividirían a la población en 100 partes iguales,
denotados por P1, P2, ..., P98, P99.
Los percentiles 25, 50 y 75 coinciden con los cuartiles.

LA ESTADISTICA DURANTE LA PRIMERA Y SEGUNDA GUERRA MUNDIAL


Durante la Segunda Guerra Mundial las fuerzas aéreas estadounidenses buscaban
formas de reducir los derribos de sus aviones militares y con ello las bajas de sus
pilotos. Blindar un avión para aumentar su resistencia al fuego de los cañones
antiaéreos y aviones de caza enemigos, tiene como contrapartida un incremento de
su peso, lo que incide negativamente en sus prestaciones. Por ello el blindaje
integro no era una solución viable, pero la cuestión era si un considerable efecto
protector ya podría obtenerse solo blindando determinadas zonas de los aviones.
Porque a lo mejor gran parte de los derribos se debía a impactos de proyectiles en
unas zonas muy concretas.
Para intentar averiguarlo se registraba tras cada misión cuántos de los aviones de
la escuadrilla habían caído y cuántos habían regresado con o sin daños. Aquellos
que volvieron dañados se revisaban para determinar por cuántos proyectiles habían
sido alcanzados y en qué parte del avión habían impactado. Para visualizar como
se distribuían estos impactos sobre el cuerpo de los aviones, conviene marcar en
un mismo avión todos los impactos observados, para obtener algo así como el
siguiente gráfico, que muestra el avión desde abajo. (Estamos asumiendo aquí que
todos los aviones son del mismo tipo. Si hay varios tipos involucrados cuyas formas
difieren sustancialmente, puede repetirse este ejercicio para cada tipo por
separado.)
La estadística al rescate
La parte posterior del fuselaje y las alas, donde más se concentran los impactos en
nuestro ficticio ejemplo, pueden parecer a primera vista las candidatas obvias para
el blindaje, como las zonas más castigadas por los proyectiles enemigos. Pero como
veremos a continuación, el asunto es algo más complejo. Tanto es así que los
militares pidieron ayuda al Grupo de Investigación Estadística, perteneciente a la
agencia gubernamental que coordinaba las actividades de I+D con fines militares
durante la guerra, de la que también surgió el Proyecto Manhattan para el desarrollo
de la bomba atómica.
Ubicado en la Universidad de Columbia de Nueva York, el grupo contaba con
algunos de los matemáticos y estadísticos más destacados del siglo XX como
Frederick Mosteller, Jacob Wolfowitz, Leonard Jimmie Savage y W. Allen Wallis, su
director de investigación, así como los futuros premios nobel de economía Milton
Friedman y George Stigler. Pero en este contexto tenemos que destacar sobre todo
a Abraham Wald, que hostigado por los nazis en Viena debido a su condición de
judío se había visto forzado a emigrar a los Estados Unidos, donde pudo poner su
grano de arena para derrotar a la Alemania nazi. Con la colaboración de Wolfowitz,
Wallis y Friedman, desarrolló la técnica estadística del análisis secuencial, que
mejoró sustancialmente el control de calidad industrial, lo cual fue de gran
importancia en la guerra. También fue él quien se encargó del problema de la
vulnerabilidad de los aviones en base a los mencionados datos proporcionados por
las fuerzas aéreas.
El gran reto fue la ausencia de información alguna sobre los impactos de proyectiles
en los aviones derribados, de los cuales no se sabía ni cuántos disparos les habían
alcanzado ni dónde, una información solo extraíble de los aviones que consiguieron
regresar. Es por ello que no deben sacarse conclusiones precipitadas basadas en
la distribución de impactos que aparece en el gráfico, al tratarse solo de los impactos
en los aviones que regresaron.
Más bien cabe preguntarse a qué se debe semejante distribución. ¿Por qué algunas
zonas presentan una mucha menor densidad de impactos que otras, estando igual
de expuestos al fuego enemigo? ¿Acaso los tiradores enemigos disparaban
preferentemente por ejemplo a las alas más que a la zona entre las dos alas? Aparte
de que no había ningún motivo para hacerlo, no parece factible tanta puntería dada
la velocidad con la que se mueven los aviones.
Parece más realista asumir un fuego indiscriminado en dirección al avión o a la
escuadrilla de aviones. Por tanto, cabía esperar una cierta uniformidad de la
distribución de los impactos, en todo caso variando según la exposición de la zona
del avión a los disparos (por ejemplo, menos impactos en la parte superior del avión
que en la inferior, mucho más expuesta, particularmente al fuego desde tierra). Wald
argumentó que la distribución esperable de los impactos podía estimarse
ponderando las diferentes orientaciones con respecto al fuego enemigo, o bien
mediante un simulacro de combates aéreos con inofensivos cartuchos de pintura,
para registrar así – sin perdidas de aviones – todos los impactos.

You might also like