Professional Documents
Culture Documents
FORMULARIO
1. ESTADÍSTICA UNIDIMENSIONAL
Ejemplos
Tipos de Valor de la
Variable Valores
variables variable
Cualitativas Color preferido Blanco, rojo, azul, …
Cualidad
o atributos Sexo Hombre, mujer
Nº de libros leídos en un mes 0, 1, 2, 3, …
Discretas Número
Número de páginas de un libro 210, 211, 22, 309, …
Cuantitativas Entre 60 kg y 67 kg,
Peso
Continuas Infinitos números …
Altura Entre 1,50 y 1,80, …
Li Li 1
Marcas de clase son los puntos medios de cada intervalo [ Li , Li 1 ) . xi
2
Donde Li es el límite inferior del intervalo y Li 1 es el límite superior.
Una vez que se calcula la primera marca de clase, las siguientes se obtienen de sumar a la
marca de clase anterior la amplitud de la clase. marca de clase anterior + amplitud de la clase
O también la marca de clase se podría calcular sumando al límite inferior de la clase la mitad
de la amplitud de la clase. límite inferior de la clase + mitad de la amplitud de la clase
3. TABLA DE FRECUENCIAS
Distribución de frecuencias
Porcentaje
xi fi Fi f ri Fri
f ri 100 (%)
f1 F1
x1 Valor 1 f1 F1 Fr1 f r1 100
N N
f2 F
x2 Valor 2 f2 F2 Fr 2 2 f r 2 100
N N
f3 F
x3 Valor 3 f3 F3 Fr 3 3 f r 3 100
N N
f4 F
x4 Valor 4 f4 F4 Fr 4 4 f r 4 100
N N
… … … … … …
fn Fn
xn Valor n fn Fn Frn f rn 100
N N
Total N 1 100 %
4. GRÁFICOS ESTADÍSTICOS
Diagrama de barras.
Histograma.
Polígonos de frecuencias.
Diagrama de sectores.
Serie cronológica.
Pirámide de población.
5. PARÁMETROS ESTADÍSTICOS
Media aritmética
x i fi
xi marca de clase de cada intervalo.
x i 1
N
Me xi [ Li , Li 1 ) clase mediana o
intervalo mediana.
1) Ordenamos los datos de menor Valor aproximado Me xi = marca de
a mayor. clase del intervalo.
Si N es impar Me xc 1 N
Fi 1
xc xc 1 Valor exacto Me Li c 2
Si N es par Me
2 fi
Mediana
N Donde:
Donde: c
2 Li límite inferior.
N c amplitud de los intervalos.
2) Buscamos la primera Fi
2 c Li 1 Li
que es Fi nº Me xi Fi 1 frecuencia absoluta acumulada de
la clase anterior.
f i frecuencia absoluta.
Mo xi [ Li , Li 1 ) clase modal o
intervalo modal.
Valor aproximado Mo xi = marca de
clase del intervalo.
Valor exacto
Moda Buscamos la f i mayor Mo xi f i f i 1
Mo Li c
f i f i 1 f i f i 1
Donde:
Li límite inferior.
c amplitud de los intervalos.
c Li 1 Li
Variables cuantitativas
Tipos Cómo se calcula
continuas
Q1 xi [ Li , Li 1 )
Valor aproximado
1 N
Q1 : 25% N 0,25 N N Q1 : 1 Q1 xi = marca de clase
Primer 4 4
del intervalo.
cuartil N
Buscamos la primera Fi 1 que es Valor exacto
Q1
4 N
1 Fi 1
Fi nº Q1 xi 4
Q1 Li c
fi
Q2 xi [ Li , Li 1 )
Valor aproximado
1 N
Q2 : 50% N 0,50 N N Q2 : 2 Q2 xi = marca de clase
Segundo 2 4 del intervalo.
cuartil N Valor exacto
Q2 = Me Buscamos la primera Fi 2 que es
4
N
Fi nº Q2 xi 2 Fi 1
Q2 Li c 4
fi
Q3 xi [ Li , Li 1 )
Valor aproximado
3 N
Q3 : 75% N 0,75 N N Q3 : 3 Q3 xi = marca de clase
Tercer 4 4 del intervalo.
cuartil N Valor exacto
Q3 Buscamos la primera Fi 3 que es
4
N
Fi nº Q3 xi 3 Fi 1
Q3 Li c 4
fi
Recorrido
intercuartílico RIQ Q3 Q1
RIQ
Dk xi [ Li , Li 1 )
Valor aproximado
k N Dk xi = marca de clase
Dk : k % N N Dk : k
10 10 del intervalo.
Decil k
N Valor exacto
Dk Buscamos la primera Fi k que es
100
Fi nº Pk xi k
N
Fi 1
Dk Li c 10
fi
k N Pk xi [ Li , Li 1 )
Pk : k % N N Pk : k
100 100 Valor aproximado
Percentil k Pk xi = marca de clase
Pk
N
Buscamos la primera Fi k que es del intervalo.
100
Valor exacto
Fi nº Pk xi
N
k Fi 1
Pk Li c 100
fi
Desviación media
x i x fi
DM i 1
x
2
2
fi x fi
Varianza i
2
i
2 i 1
x i 1
N N
Desviación típica 2
Coeficiente de
CV
variación x
Para comparar la dispersión de dos poblaciones heterogéneas (con distinta media aritmética), se
utiliza el coeficiente de variación, pues indica la variación relativa.
La varianza y la desviación típica de una distribución son siempre positivas o nulas. Es nula
cuando todos los datos son iguales a la media.
Cuando la desviación típica toma valores mayores que uno, hay bastante dispersión.
Si las medidas de dispersión son “pequeñas”, se puede concluir que los datos están agrupados
alrededor de la media aritmética. Es decir, cuanto menores son las medidas de dispersión, más
concentrados están los datos.
Y si las medidas de dispersión son “grandes”, significa que los datos están bastante dispersos.