You are on page 1of 14

1

UTP STAT

Capítulo 2. Descripción de Datos


• Medidas de Posición o Medidas de Centro
▫ Media aritmética
▫ Mediana
▫ Moda
▫ Relación entre las tres
• Medidas de Dispersión
▫ Varianza
▫ Desviación estándar
▫ Coeficiente de variación
2

UTP STAT

Medidas de Posición o Medidas de


Centro
• Una medida de centro es un valor en el centro o
en el medio de un juego o conjunto de datos
• Las principales medidas de centro son:
▫ Media aritmética
▫ Mediana
▫ Moda
3

UTP STAT

Medidas de Posición o Medidas de


Centro
• Media Aritmética: es el número obtenido cuando
se suman los valores y se divide el total por el
número de valores (called arithmetic mean,
mean, or average)
4

UTP STAT

Medidas de Posición o Medidas de


Centro
• Mediana: es el valor que cae en el medio cuando
los valores de todos los datos se ordenan
▫ Si el número de datos es impar, la mediana caerá
en el centro de la lista
▫ Si el número de datos es par, encuentre la media
aritmética de los dos valores en el centro de la lista,
ésta será la mediana
5

UTP STAT

Medidas de Posición o Medidas de


Centro
• Moda: es el valor que ocurre con mayor
frecuencia
▫ Cuando dos o más valores ocurren con la misma
mayor frecuencia cada uno representa la moda y
los datos se dice que son bimodales, trimodales,
etc.
6

UTP STAT

Medidas de Posición o Medidas de


Centro
• Consideración importante:
▫ Mientras que la media es muy sensible a valores
aberrantes (outliers o valores periféricos) la
mediana no lo es
▫ En general, la mediana provee una mejor
descripción del centro de los datos cuando la
distribución de los datos es altamente sesgada
▫ Veamos ejemplos
7

UTP STAT

Medidas de Posición o Medidas de


Centro
• Ejemplo:
• Supóngase que las observaciones de una
muestra son: 1, 3, 4, 2, 7, 6 y 8
▫ La media muestral es 4.4 mientras que la mediana
muestral es 4
• Ahora supóngase que la penúltima observación
cambia, de modo que los datos son: 1, 3, 4, 2, 7,
2450 y 8
▫ Cuál es la media muestral? Cuál es la mediana
muestral?
8

UTP STAT

Medidas de Dispersión o Medidas de


Variabilidad
• Se refieren a la cantidad que los valores varian
entre ellos mismos o la dispersión entre los
datos
• Varianza: medida de dispersión de los datos con
respecto a la media (mean)

• Deviación estándar: es la raíz cuadrada de la


varianza.
9

UTP STAT

Medidas de Dispersión o Medidas de


Variabilidad
• Coeficiente de variación: es una medida relativa
de dispersión de datos en comparación con la
media
• Cuando su valor es pequeño, la dispersión de los
datos en relación a la media es pequeña
• Cuando su valor es grande, la dispersión de los
datos en relación a la media es grande
10

Rango UTP STAT

• Es igual al valor mayor menos el valor menor


• Mide la distribución total del conjunto de datos,
sin tomar en cuenta cómo se distribuyen los
datos entre los valores menor y mayor.
• Es una medida de variación o dispersión, pero
resulta engañosa en presencia de valores
extremos.
11

UTP STAT

FORMA
• Propiedad que describe a un conjunto de datos
numéricos
▫ Media < Mediana: asimétrica negativa o sesgo
izquierdo
▫ Media = Mediana: simétrica o asimetría cero
▫ Media > Mediana: asimétrica positiva o sesgo
derecho
12

UTP STAT

EJEMPLOS
1. A continuación se muestra un conjunto de datos
procedente de una muestra de n=5:
7 -5 -8 7 9

• Calcule la media y la mediana


• Calcule el rango, la varianza y la desviación
estándar
• Describa la forma del conjunto de datos
13

EJEMPLOS UTP STAT

2. Un fabricante de baterías para flashes toma una muestra de 13


baterías de la producción del día y las utiliza de manera continua hasta
que se agotan. El número de horas que se utilizaron hasta el momento
de fallar fue:
342 426 317 545 264 451
1,049 631 512 266 492 562 298

• Calcule la media y la mediana. Al observar la distribución de los


tiempos transcurridos hasta la falla, ¿cuál medida le parece más
apropiada? ¿Porqué?
• Calcule el rango, la varianza y la desviación estándar
• ¿Qué le recomendaría a un fabricante si quisiera anunciar que sus
baterías “duran 400 horas”?
14

EJEMPLOS UTP STAT

3. La mediana del precio de una casa en diciembre de 2003 alcanza


$92,000, un incremento del 6.7% respecto a diciembre de 2002. En
todo el año, las ventas alcanzaron un récord de 550 mil casas. Describa
la forma de la distribución correspondiente al precio de las casas
vendidas. ¿Por qué cree usted que este enunciado de problema
informa sobre la mediana de los precios y no sobre la media?

You might also like