Professional Documents
Culture Documents
Para hallar la media de un conjunto de datos, dividimos la suma de todos ellos entre el nmero de
datos que hay.
Para poder calcular la media, los datos han de ser valores numricos. No podemos, por ejemplo, hallar
la media en un estudio que hemos hecho sobre el color de pelo de los alumnos de clase, pues moreno,
rubio... son cualidades, no nmeros. Veamos con un ejemplo cmo se calcula la media.
En la prueba de salto de longitud, los 22 alumnos de clase hemos obtenido los siguientes resultados
aproximados:
170 cm 160 cm 150 cm 170 cm 160 cm 160 cm 170 cm 150 cm 190 cm 160 cm 170 cm
180 cm 160 cm 180 cm 190 cm 200 cm 190 cm 180 cm 160 cm 170 cm 180 cm 190 cm
Hacemos el recuento de los datos. Los ordenamos de menor a mayor y vemos el nmero de veces que
se ha dado cada salto:
150 - 150 160 - 160 - 160 - 160 - 160 - 160 170 170 170 170 170 180 180 180 180 190
190 190 190 - 200
La frecuencia absoluta es el nmero de veces que se da cada salto, y su suma ha de ser igual al
nmero total de saltos: 2 + 6 + 5 + 4 + 4 + 1 = 22Ahora completamos la tabla con una nueva columna a
la derecha en la que multiplicamos el valor del salto por su frecuencia absoluta:
La suma de estos valores es la suma de todos los saltos:
300 + 960 + 850 + 720 + 760 + 200 = 3.790
Y la media de los saltos de longitud ser:
Vemos que la media no coincide con ninguno de los valores que se haban obtenido, es un valor no
entero y comprendido entre dos de ellos: 170 cm y 180 cm.
LA MODA
Llamamos moda de un conjunto de datos al valor que ms se repite; o dicho de otra forma, el que
tiene la mayor frecuencia absoluta de entre ellos.
En el ejemplo anterior, el valor con mayor frecuencia (el que ms se repite) es el salto de 160 cm.
Si quieres, puedes practicar con el ejemplo siguiente.
En la prueba de natacin de 100 metros libres, los tiempos aproximados obtenidos por los 22 alumnos
de la clase han sido los siguientes:
150 s 140 s 130 s 120 s 140 s 140 s 160 s 150 s 130 s 120 s 130 s 140 s 130 s 150 s
140 s 150 s 160 s 160 s 160 s 140 s 150 s 160 s
La suma de todos los tiempos empleados en nadar los 100 metros libres es:
Puesto que el nmero de datos es impar (5), la mediana ser el valor que ocupa la posicin central, en
este caso la tercera posicin: 140 s.
La moda o valor que ms se repite es 140 s, pues su frecuencia absoluta es la mayor, 6.
Varianza
En teora de probabilidad, la varianza (que suele representarse como ) de una variable
aleatoria es una medida de dispersin definida como la esperanza del cuadrado de la
desviacin de dicha variable respecto a su media.
Est medida en la unidad de medida de la variable al cuadrado. Por ejemplo, si la variable
mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviacin
estndar es la raz cuadrada de la varianza, es una medida de dispersin alternativa
expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza
tiene como valor mnimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atpicos y
no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas
pesadas. En tales casos se recomienda el uso de otras medidas de dispersin ms robustas.
Varianza y desviacin estndar
La desviacin slo significa qu tan lejos de lo normal
Desviacin estndar
Varianza
Ejemplo
T y tus amigos habis medido las alturas de vuestros perros (en milmetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Media = = = 394
5 5
Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media:
Varianza: 2 = = = 21,704
5 5
Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... pero
que no se enteren!