Professional Documents
Culture Documents
1
1.1. Introducción : conceptos básicos
ESTADÍSTICA: “Estudio de los métodos de recogida y descripción de datos, así
como del análisis de esta información”
1 Recogida de datos
2 Ordenación, tabulación y gráficos*
3 Descripción de características*
4 Análisis formal
* Estadística descriptiva: parte de la estadística que se ocupa
de las etapas 2 y 3
Ejemplos:
Nº de hijos de una familia
Nº de nidos de procesionarias por árbol
Nº de virus en un cultivo
Continuas: Numéricas no numerables
Ejemplos:
Estatura
Salario 4
Nivel de colesterol
1.2. Tablas estadísticas y representaciones
gráficas
Variables discretas
Frecuencias
xi fi Fi hi Hi Absolutas, fi
x1 f1 F1 h1 H1 Absolutas acumuladas,
... ... ... ... ... Fi
xi fi Fi hi Hi
... ... ... ... ...
Relativas
xk fk Fk hk Hk
h i = fi / n
n 1 Relativas
5
acumuladas
H i = Fi / n
Variables continuas: Intervalos
Intervalo I i xi fi Fi hi Hi
e0 – e1 x1 f1 F1 h1 H1
... ... ... ... ... ...
e i-1 – ei xi fi Fi hi Hi
... ... ... ... ... ...
e k -1 – ek xk fk Fk hk Hk
n 1
20
10
7
Negro Gris Blanco Rojo Violeta
V. E. Cualitativas: Gráfico de sectores
violeta
negro
rojo
gris
blanco
8
V. E. Discretas: Gráfico de barras
Nº de crías Nº animales: f i hi Hi
2 20 0.20 0.20
3 30 0.30 0.50
4 25 0.25 0.75
5 15 0.15 0.90
6 10 0.10 1
n = 100
9
V. E. Continuas: Histograma
Estatura fi hi = fi / ai
150 – 160 30 3
170 – 180 20 2
hi 190 – 200 10 1
100
k
�n i x i
33900
Media : x = i =1 = = 161.42
n 11 210
Moda
Variables discretas
Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3
Datos en tabla
♦ Ejemplo xi ni
1 34
2 36
3 45 Mo = 3
4 22
5 17
12
Variables continuas
h i - h i -1
Mo = e i -1 + ai
( hi - h i -1 ) + ( hi - h i +1 )
♦ Ejemplo xi fi hi = fi / ai
150 – 160 30 3
160 – 170 22 2,2
170 – 180 20 2
180 – 190 18 1,8
190 – 200 10 1
100
Mo = 160 +
(2.2 - 1.5 )
�10 = 167.777
( 2.2 - 1.5 ) + ( 2.2 - 2 )
Observaciones:
1. Puede utilizarse la frecuencia relativa
2. Si las amplitudes son iguales, la moda se puede obtener directamente
con las frecuencias 13
Mediana
Valor de la variable que ocupa el lugar central en una serie de datos ordenados.
El 50% de los elementos de la población tienen un valor de la variable menor o igual
que la mediana. El 50% de los elementos de la población tienen un valor de la variable
mayor o igual que la mediana.
Variables discretas
Datos en serie
Nº impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5
Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9 → Me = 6 – 7
Indeterminada entre 6 y 7
xi fi Fi hi Hi xi fi Fi hi Hi
2 3 3 0,333 0,333 3 1 1 0,1 0,1
3 1 4 0,111 0,444 4 1 2 0,1 0,2
5 1 5 0,111 0,555 6 3 5 0,3 0,5
6 1 6 0,111 0,666 7 1 6 0,1 0,6
7 2 8 0,222 0,888 14 8 2 8 0,2 0,8
8 1 9 0,111 0,999 9 2 10 0,2 1
Variables discretas
Datos en tabla
♦ Ejemplo
xi fi hi Hi n /2 = 14
Fi
0 4 4 0.142 0.142 Hi = 0,5
1 6 10 0.214 0.357
2 10 20 0.357 0.714
3 5 25 0.178 0.892
4 3 Me = 2
28 0.107 1
28 1
♦ Ejemplo
Estatura fi Fi hi Hi n/2 = 50
140 – 150 15 15 0.15 0.15 Hi = 0,5
150 – 160 30 45 0.30 0.45
160 – 170 25 70 0.25 0.70
170 – 180 20 90 0.20 0.90
180 – 200 10 100 0.10 1
100
0.5 - 0.45
Me = 160 + �10 = 160 + 2 = 162
0.25
Q1 = P25 Cuartil 1º
Q2 = P50 Cuartil 2º = Me
Decil
DQ13==PP1075 Cuartil
1º3º
D2 = P20 Decil 2º
….
Cálculo para v.e. discretas:
D9 = P90 Decil 9º
Igual que la mediana, cambiando:
50 k
n por n
100 100
xi ni Ni
2 20 20 k 40
n = 124 = 49, 6
3 30 50 100 100
4 44 94
5 20 114 k 95
n = 124 = 117, 8
100 100
6 10 124
124
Tallas ni Ni fi Fi
140-150 15 15 0.15 0.15
P40
150-160 30 45 0.30 0.45
160-170 25 70 0.25 0.70
P75
170-180 20 90 0.20 0.90
180-200 10 100 0.10 1
100
k nk
- Fi -1 - N i -1
Pk = ei -1 + 100 a i = ei -1 + 100 ai
fi ni
0.4 - 0.15 40 - 15
P40 = 150 + �10 = 150 + �10 = 158.33
0.30 30
0.75 - 0.70 75 - 70
P75 = 170 + �10 = 170 + �10 = 172.5 = Q 3
0.20 20
19
1.3.2. Características de Dispersión
Rango o recorrido
Recorrido intercuartílico
Q 3 – Q1
20
Varianza
k k
�n i ( )
2
xi - x �n i x i 2 2
s 2 = i =1 = i =1 - x
n n
Desviación típica
2
s = s
Coeficiente de variación
C. V . =
s
x
21
♦ Ejemplo
xi ni nixi nixi2
4 20 80 320
6 40 240 1440
8 44 352 2816
10 36 360 3600
12 22 264 3168
162 1296 11344
k
�n i x i 2 2
2 11344 1296 �
�
s 2 = Var [ X ] = i =1 - x = -� � = 6.02
n 162 �162 �
2
s = s = 6.02 = 2.4535
22
Momentos centrales (Respecto a la media)
k
( xi )
r
�n i - x
m r = i =1
n
k
�n i ( xi - x )
r =1 � m1 = i =1 = 0
n
k
�n i ( )
2
xi - x
r = 2 � m2 = i =1 =s2
n
23
1.3.3 Características de forma
m3
g1 =
3
s
► Si g1 = 0 �
Distribución simétrica
► Si g1 > 0 �
Distribución sesgada a la derecha
► Si g1 < 0 �
Distribución sesgada a la izquierda
24
Coeficiente de Curtosis (Aplastamiento)
m4
g 2 = 4
-3
s
25
1.4 Gráfico de caja
v.a.i. v.a.s.
mín F1 f1 Q1 Me Q3 f2 F2 máx
f1=Q1-1.5(Q3-Q1) frontera interior inferior
f2=Q3+1.5(Q3-Q1) frontera interior superior
F1=Q1-3(Q3-Q1) frontera exterior inferior
F2=Q3+3(Q3-Q1) frontera exterior superior
o ** * o
anómalos v.a.i.
Q1 Q3 v.a.s anómalos
Me
26
Ejemplo
Sea la variable estadística “nº de hijos”. Los
datos de 30 familias son los siguientes:
1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4
mín = 0
máx = 10 Datos ordenados:
Q1 = 1 00000011111111222223333444458 10
Q3 = 3
Me = 2
f1 = -2
f2 = 6
F1 = -5
F2 = 9
0 5
Vai = 01 2 3 4 6 7 8 9 10
Vas = 5
*
o
Valores anómalos = 8, 10
27