Professional Documents
Culture Documents
=
=
n
Pm f
X
k
i
i i
=
=
1
.
Para datos agrupados:
Donde: Pm
i
: punto medio de la clase i
f
i
: frecuencia absoluta de la clase i
Es el valor que ocupa la posicin central de
un conjunto de observaciones, una vez que
han sido ordenados en forma ascendente o
descendente.
Divide al conjunto de datos en dos partes
iguales.
Para datos no agrupados:
Si n es impar: posicin donde se ubica la mediana
es igual a (n+1)/2.
Si n es par: (n+1)/2 no es entero, por lo tanto la
mediana ser igual al promedio de las dos
posiciones centrales.
Datos agrupados: clase mediana es la
que contiene a la observacin que
ocupa la posicin n/2.
I
f
F
x
Lm Md
i
aanterior
i
.
2
+ =
Donde: Lm: lmite inferior de la clase mediana.
F(a
anterior
): frecuencia acumulada de la clase
anterior a la clase mediana.
f
i
: frecuencia absoluta de la clase mediana.
I: amplitud o intervalo de la clase mediana.
Observacin o clase que tiene la mayor
frecuencia en un conjunto de observaciones.
Un conjunto de datos puede ser unimodal,
bimodal o multimodal.
Es la nica medida de tendencia central que
se puede determinar para datos de tipo
cualitativo.
Para datos no agrupados: es simplemente
la observacin que ms se repite.
Para datos agrupados:
I
f f
f
L Mo i .
2 1
2
+
+ =
Donde: Li: lmite inferior de la clase modal.
f
1
: diferencia entre f
i
de la clase modal y la
anterior.
f
2
: diferencia entre f
i
de la clase modal y la
posterior.
I: amplitud o intervalode la clase modal
(clase de mayor frecuencia).
Cuando los datos son sesgados es mejor emplear la Md
Propiedades:
La suma de las diferencias entre las media
muestral y el valor de cada observacin es cero.
La media de una constante es la constante.
Si todas las observaciones x
i
se multiplican por
una constante a, la X tambin se debe multiplicar
por ese mismo valor constante.
Si se somete a una variable estadstica X a un
cambio de origen y escala, Y = a + bX, la
media aritmtica de dicha variable X vara en
la misma proporcin.
La media de la suma de dos variables es igual
a la suma de sus medias.
Ventajas:
Emplea en su clculo toda la informacin
disponible.
Se expresa en las mismas unidades que la
variable en estudio.
Es el centro de gravedad de toda la
distribucin, representando a todos los
valores observados.
Es una valor nico.
Se trata de un concepto familiar para la
mayora de las personas.
Es til para llevar a cabo procedimientos
estadsticos como la comparacin de medias
de varios conjuntos de datos.
Desventajas:
Se ve adversamente afectada por valores
extremos, perdiendo representatividad.
Si el conjunto de datos es muy grande puede ser
tedioso su clculo manual.
No se puede calcular para datos cualitativos.
No se puede calcular para datos que tengan
clases de extremo abierto, tanto superior como
inferior.
Ventajas:
Fcil de calcular si el nmero de
observaciones no es muy grande.
No se ve influenciada por valores
extremos, ya que solo influyen los
valores centrales.
Fcil de entender.
Se puede calcular para cualquier tipos de
datos cuantitativos, incluso los datos con
clase de extremo abierto.
Es la medida de tendencia central ms
representativa en el caso de variables que
solo admiten la escala ordinal.
Desventajas:
No utiliza en su clculo toda la informacin
disponible.
No pondera cada valor por el nmero de
veces que se ha repetido.
Hay que ordenar los datos antes de
determinarla.
Ventajas:
No requiere clculos.
Puede usarse para datos tanto cuantitativos
como cualitativos.
Fcil de interpretar.
No se ve influenciada por valores extremos.
Se puede calcular en clases de extremo
abierto.
Desventajas:
Para conjuntos pequeos de datos su
valor no tiene casi utilidad, si es que de
hecho existe. Solo tiene significado en el
caso de una gran cantidad de datos.
No utiliza toda la informacin disponible.
No siempre existe, si los datos no se
repiten.
En ocasiones, el azar hace que una sola
observacin se no representativa se el valor
ms frecuente del conjunto de datos.
Difcil de interpretar si los datos tiene 3 o
ms modas.
Son valores numricos que indican o
describen la forma en que las observaciones
estn dispersas o diseminadas, con respecto
al valor central.
Son importantes debido a que dos muestras
de observaciones con el mismo valor central
pueden tener una variabilidad muy distinta.
Rango.
Varianza.
Desviacin Tpica.
Coeficiente de variacin.
Rango (amplitud o recorrido):
Est determinado por los dos valores
extremos de los datos muestrales, es
simplemente la diferencia entre la
mayor y menor observacin.
Es una medida de dispersin absoluta,
ya que depende solamente de los datos
y permite conocer la mxima
dispersin.
Casi no se emplea debido a que depende
nicamente de dos valores.
No proporciona una medida de variabilidad
de las observaciones con respecto al centro
de la distribucin.
Notacin: R
Es un valor numrico que mide el grado de
dispersin relativa porque depende de la
posicin de los datos x
1
,x
2
,,x
n
con respecto
a la media.
Es el promedio al cuadrado de las
desviaciones de cada observacin con
respecto a la media.
Notacin: s
2
, o
2
, var(X)
Si la varianza de un conjunto de
observaciones es grande se dice que los
datos tiene una mayor variabilidad que un
conjunto de datos que tenga un varianza
menor.
( )
n
x Pm f
s
n
i
i
i
=
=
1
2
.
2
Para datos NO
agrupados:
Para datos agrupados en una distribucin
de frecuencias:
( )
( )
2
1
2
2
1
2
2
x
n
f m
s
n
f x m
s
k
i
i i
k
i
i i
=
=
=
=
Es la raz cuadrada de la varianza.
Notacin: s, o.
2
s s =
Es una medida de dispersin relativa que
permite comparar el nivel de dispersin de
dos muestras de variables estadsticas
diferentes.
No tiene dimensiones.
Notacin: CV
% 100 =
x
s
CV
Ventajas:
til cuando se quiere conocer la extensin de
las variaciones extremas (valor mximo de la
dispersin).
Fcil de calcular.
Desventajas:
No es una MD con respecto al centro de la
distribucin.
Solo emplea dos valores en su clculo.
No se puede calcular en distribuciones de
lmite de clase abierto.
Propiedades:
1. Siempre es mayor o igual a cero y menor
que infinito.
2. La varianza de una constante es cero.
3. Si a una variable X la sometemos a Y=a+bX,
la varianza de Y ser Var(Y) = b
2
Var(X)
Ventajas:
Es til cuando se compara la variabilidad de dos
o ms conjuntos de datos.
Utiliza toda la informacin disponible.
Desventajas:
No proporciona ayuda inmediata cuando se
estudia la dispersin de un solo conjunto de
datos.
Difcil de interpretar por tener sus unidades
elevadas al cuadrado.
Ventajas:
Esta expresada en las mismas unidades que
la variable en estudio.
Utiliza todas las observaciones en su clculo.
Fcil de interpretar.
Desventajas:
No tiene.
Ventajas:
Es la nica MD que permite comparar el nivel
de dispersin de dos muestras de variables
diferentes.
Emplea toda la informacin disponible en su
clculo.
Fcil de calcular.
Desventaja:
No es una MD con respecto al centro de la
distribucin de los datos.
Son medidas numricas que permiten
determinar la forma que tiene la curva de los
datos, por lo tanto, sirven para corroborar lo
que los grficos muestran.
Medidas
de forma
-Asimetra
-Kurtosis o apuntamiento
Coeficiente de Pearson
Coeficiente de Fisher
Permiten estudiar la forma de la curva,
dependiendo de cmo se agrupan los datos.
Coeficiente de Asimetra de Pearson:
Fcil de calcular e interpretar.
Clculo:
( )
s
Md X
ASP
=
3
o Interpretacin:
ASP
= 0, X=Md Simtrica
> 0, X>Md Asimtrica Positiva
< 0, X<Md Asimtrica Negativa
Coeficiente de Asimetra de Fisher:
No es de fcil clculo, pero si su
interpretacin.
( )
( )
3
1
3
3
1
3
ns
f x Pm
ASF
ns
X x
ASF
k
i
i i
n
i
i
=
=
=
=
Datos NO agrupados
Datos Agrupados
o Interpretacin:
ASF
= 0, Simtrica
> 0, Asimtrica Positiva
< 0, Asimtrica Negativa
Miden si los valores de la distribucin estn
ms o menos concentrados alrededor de los
valores medios de la muestra (zona central de
la distribucin).
Se definen tres tipos de distribucin segn su
grado de Kurtosis:
Mesocrtica: grado de concentracin
medio alrededor de los valores centrales
de la variable.
Leptocrtica: grado de concentracin
elevado.
Platicrtica: grado de concentracin
reducido.
( )
( )
3
3
4
1
4
4
1
4
=
=
ns
f X Pm
CK
ns
X x
CK
k
i
i i
n
i
i
Datos No Agrupados
Datos Agrupados
Interpretacin:
CK
=0 Mesocrtica
>0 Leptocrtica
<0 Platicrtica