Professional Documents
Culture Documents
Mediana:
Es el valor de la variable que supera no ms de la mitad de las observaciones
(datos) y que es superado por no ms de la mitad de las observaciones.
Lo anterior permite concluir que la mediana es un estadgrafo que no se deja
afectar por valores extremos y/o extraos de la variable, como si ocurre con la
media aritmtica.
La mediana, contrario a la media, suele ser un valor posible de la variable.
Si ordenramos los vendedores de menores ventas a mayores ventas, el
vendedor que quedara en la mitad sera la mediana.
Estadsticos de posicin: Llamados Fractiles o Cuantiles son los que dividen una
distribucin en partes iguales.
Los tres tipos de fractiles ms usados son:
Cuartiles: parten la distribucin en cuartas partes.
Deciles: parten la distribucin en dcimas partes.
Percentiles: parten la distribucin en centsimas partes.
Cuartiles (Q):
Dividen la distribucin en cuatro partes, es decir, existen 3 cuartiles.
Q1
Q2
Q3
El Q2 se ubica en la mitad de la distribucin, por lo que Q2 = Me. Esto quiere decir que la
mediana tambin es un estadgrafo de posicin. Por tanto, la definicin de la Me facilita
definir estas medidas, as: Q1 es el valor de la variable que supera no ms de parte de la
distribucin pero es superado por no ms de partes de la distribucin.
Percentiles (P):
Dividen la distribucin en centsimas partes, es decir, existen 99 percentiles o centiles.
P3 P10
P25
P35
P50
P75
P90
Se entiende por percentil i aquel valor que supera el i% de los datos y es superado por el i%
de los datos.
Dispersin: Estadsticas que resumen la heterogeneidad de los valores de la
variable. En algunos casos, indican qu tan alejados estn los valores con
respecto a un punto de referencia o a un eje.
Las medidas de dispersin ms comunes, son:
Rango o recorrido (R):
Con esta medida se excluyen los valores ms altos y bajos, pues elimina el 25% de los
valores ms altos y el 25% de los valores ms bajos de la distribucin. En este sentido, es
una medida ms adecuada que el rango. Sin embargo, no se obtiene informacin acerca de
la dispersin de los datos al interior de la distribucin entre los cuartiles uno y tres.
Desviacin estndar (S):
Mediante el clculo de la desviacin estndar se facilita el entendimiento del significado de
la medida de variabilidad, puesto que sus unidades son las mismas de la variable de origen.
Indica en promedio que tan distante est la informacin de la media.
Coeficiente de variacin (CV):
Es una medida de dispersin relativa, la cual facilita comparar distribuciones o grupos
dentro de una distribucin. Se expresa ordinariamente en trminos porcentuales como la
divisin de la desviacin sobre la media
Otros tipos de estadgrafos tienen que ver con la forma de distribucin. De inters particular
es la simetra de la distribucin de la variable, la cual puede ser simtrica o asimtrica
Para que exista Simetra debe ocurrir que haya equidistancia entre pares de puntos
respecto a un eje de simetra. El modelo normal, el cual se tratar ms adelante, es el
modelo simtrico por excelencia, en el cual la moda, la mediana y la media tienen el
mismo valor.
Para observar la simetra se utilizan los histogramas. El histograma de una variable con una
distribucin simtrica debe ser similar al siguiente grfico:
DEFINICIN:
La Asimetra se da cuando no hay equidistancia entre pares de puntos respecto al eje.
Si la mayora de los datos estn ubicados hacia el lado positivo del eje, entonces es
asimetra positiva. Si la mayora estn hacia el lado negativo, entonces la asimetra es
negativa.
Las variables con una distribucin asimtrica negativa o asimtrica positiva se comportan
de la siguiente manera en un histograma:
FIGURA 1.7 GRFICO DE SIMETRIA
Por ejemplo:
Nmero de hijos por familia
Nmero de trabajadores por empresa
Variables escalares continuas: Son aquellas variables que pueden tomar
todos los valores posibles dentro de un intervalo determinado de los nmeros
reales.
Por ejemplo:
DEFINICIN:
Variables categricas: Son aquellas variables cuyos posibles valores no
son susceptibles de medicin cuantitativa directa pero si pueden ser
clasificados. Tambin son conocidas como variables no mtricas.
Color de un carro.
Por ejemplo:
Esta variable pasa a ser entonces una variable categrica de tipo ordinal, pues
los valores asociados con cada tipo de empresa muestran una ordenacin o
jerarqua, sin llegar a ser operables las categoras entre si.
DEFINICIN:
Kurtosis es el grado de apuntamiento o agudeza de la distribucin, y se mide por medio
del coeficiente de kurtosis (C.K.).
DEFINICIN:
Inferior Inferior
extern interno
Superio Superio
r
r
Median
Bigote
Bigote
Q1
Q3
Barrera
Barrera
Barrera
Barrera
Ejemplo 1.21
Rendimientos (%)
2.4
5.9
8.0
2.7
6.7
8.2
-2.6
-24.6
7.5
3.8
7.0
8.6
5.6
7.2
9.0
8.5
9.2
8.8
9.7
20.5
10.0
Solucin:
Mediana = 7.5 %
Q1 = 5.6 %
Q3 = 8.8 %
RIC = 3.2
Barrera inferior interna = 0.8
Barrera superior interna = 13.6
RIC = 3.2
-4
0.
8
13.6
2.4
10
5.6
-24.6
-2.6
18.4
8.
8
20.5