Professional Documents
Culture Documents
Tema 2: Estadsticos
Tema 2: Estadsticos
Parmetros y estadsticos
Parmetro: Es una medida numrica calculada en base a una poblacin. Es constante.
La altura media de los individuos de un pas
La idea es resumir toda la informacin que hay en la poblacin en unos pocos nmeros (parmetros).
Nos interesa conocer parmetros, pero por la dificultad de estudiar TODA la poblacin, calculamos un estimador en base a muestra y confiamos en que sean prximos.
Tema 2: Estadsticos 2
Tema 2: Estadsticos
Dispersin
Indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
Forma
Asimetra Apuntamiento o curtosis
Eduardo Vliz, Ing. Tema 2: Estadsticos 4
Altura mediana
Tema 2: Estadsticos
Variabilidad o dispersin
Los estudiantes de Bioestadstica reciben diferentes calificaciones en la asignatura (variabilidad). A qu puede deberse?
Diferencias individuales en el conocimiento de la materia.
Por ejemplo supongamos que todos los alumnos poseen el mismo nivel de conocimiento. Las notas seran las mismas en todos? Seguramente No.
Dormir poco el da del examen, el croissant estaba envenenado... Diferencias individuales en la habilidad para hacer un examen. El examen no es una medida perfecta del conocimiento. Variabilidad por error de medida. En alguna pregunta difcil, se duda entre varias opciones, y al azar se elige la mala Variabilidad por azar, aleatoriedad.
8
Tema 2: Estadsticos
Medidas de dispersin
Miden el grado de dispersin (variabilidad) de los datos, independientemente de su causa.
Amplitud o Rango: La diferencia entre las observacines extremas.
2,1,4,3,8,4. El rango es 8-1=7 (Mayor menor) Es muy sensible a los valores extremos.
25%
% 25% 25 25%
Rango intercuartl:
Es la distancia entre el primer y tercer cuartil.
Rango intercuartlico =
Q3 Q1
Parecida al rango, pero eliminando las observaciones ms extremas inferiores y superiores. No es tan sensible a valores extremos.
Eduardo Vliz, Ing. Tema 2: Estadsticos 9
Varianza S2: Mide el promedio las desviaciones (al cuadrado) de observaciones con respecto a la media.
S2 = 1 n1
de las
(x x )
i i
Es sensible a valores extremos (alejados de la media). Sus unidades son el cuadrado de las de la variable. Indica la distancia promedio de las observaciones hacia la media. Se eleva al cuadrado para suprimir signos, pues al sumar todos los datos restando la media el resultado es cero.
Eduardo Vliz, Ing. Tema 2: Estadsticos 10
50
Desviacin estndar o tpica Es la raz cuadrada de la varianza Tiene las misma dimensionalidad (unidades) que la variable.
40
30
20
S=
Eduardo Vliz, Ing.
Desviacin Media: Mide el promedio las desviaciones (en valor absoluto) de observaciones con respecto a la media.
de las
1 DM = xi x n i
Es sensible a valores extremos, pero menos que la varianza. Sus unidades son las mismas que las de la variable. Indica la distancia promedio de las observaciones hacia la media.
12
Tema 2: Estadsticos
Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de qu tamao tiene con respecto a la media Tambin se la denomina variabilidad relativa.
S CV = x
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente Por ejemplo 0C 0F
Tema 2: Estadsticos
13
Estadsticos de posicin
Se define el cuantil de orden como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
Tema 2: Estadsticos
14
Estadsticos de posicin
Percentil de orden k = cuantil de orden k/100
La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%
Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo. Qu peso se considera demasiado bajo?
Percentil 5
El colesterol se distribuye simtricamente en la poblacin. Se considera patolgico los valores extremos. El 90% de los individuos son normales Entre qu valores se encuentran los individuos normales?
Entre el percentil 5 y el 95
Tema 2: Estadsticos
16
Ejemplo
Qu peso no llega a alcanzar el 25% de los individuos?
Primer cuartil = percentil 25 = 60 Kg.
50%
25%
100
% 25% 25 25%
90
80
70
60
PESO Percentiles
25 50 75
50
40
Tema 2: Estadsticos
17
Asimetra o Sesgo
Una distribucin es simtrica si la mitad izquierda de su distribucin es la imagen especular de su mitad derecha. En las distribuciones simtricas media y mediana coinciden. Si slo hay una moda tambin coincide La asimetra es positiva o negativa en funcin de a qu lado se encuentra la cola de la distribucin. La media tiende a desplazarse hacia las valores extremos (colas). Las discrepancias entre las medidas de centralizacin son indicacin de asimetra.
Eduardo Vliz, Ing. Tema 2: Estadsticos 18
En funcin del signo del estadstico diremos que la asimetra es positiva o negativa.
3 x~ CA = x S
Tema 2: Estadsticos
( )
19
Apuntamiento o curtosis
La curtosis nos indica el grado de elevacin de una distribucin. Es adimensional.
Platicrtica: curtosis < 3
400
300
200
100
Frecuencia
Leptocrtica
300
Los grficos poseen la misma media y desviacin tpica, pero con diferente grado de elevacin.
200
100
Frecuencia
0 27 37 45 53 61 69 77 85 93
32
41
49
57
65
73
81
89
99
20
Qu hemos visto?
Parmetros Estadsticos y estimadores Clasificacin Medidas de tendencia central: Media, mediana y moda
Diferenciar sus propiedades.
Medidas de dispersin
con unidades: rango, rango intercuartlico, varianza, desv. tpica sin unidades: coeficiente de variacin Qu usamos para comparar dispersin de dos poblaciones?
Asimetra
positiva Negativa Podemos observar asimetra sin mirar la grfica?
Tema 2: Estadsticos
21