Professional Documents
Culture Documents
univariados
Profesor: Bricio Bouffanais
¿Qué es la Estadística?
Definición
Población:
Colección o conjunto de personas, objetos o eventos que poseen
características comunes y cuyas propiedades serán analizadas.
Muestra:
Subconjunto representativo de la población que comparte una determinada
característica.
Estadística
Variable estadística:
Es cada una de las características o cualidades que poseen los
individuos de una población. Existen dos tipos: cualitativas y
cuantitativas.
Cualitativa nominal
No admiten un criterio de orden.
Por ejemplo: estado civil
(soltero, casado, divorciado, viudo).
• Cualitativas
Tienen características no numéricas.
Por ejemplo: color de pelo, sexo,
estado civil, etc.
Cualitativa ordinal
Admiten un criterio de orden.
Por ejemplo: evaluación de un servicio
(bueno, regular, malo)
Estadística
Variable estadística:
Cuantitativa discreta
Se les puede asociar un número
entero y es imposible fraccionar.
• Cuantitativas Por ejemplo: número de hijos,
número de automóviles.
Representan características que se
pueden expresar con un número.
Por ejemplo: edad, estatura, número Cuantitativa continua
de hijos, etc. Se les puede asociar cualquier
número real dentro de un intervalo.
Por ejemplo: peso, estatura, tiempo.
Estadística
La suma de las frecuencias
Tipos de frecuencias absolutas es igual al número
total de datos.
• Frecuencia absoluta fi
Número de veces que aparece un determinado dato en un estudio estadístico.
Generalmente se le denomina solo “frecuencia”.
• Frecuencia acumulada Fi
Suma de las frecuencias absolutas de todos los datos inferiores o iguales al valor
considerado.
• Frecuencia relativa fr
Cociente entre la frecuencia absoluta de un determinado valor y el número total de
datos. También puede expresarse como porcentaje.
Estadística
Fuente: www.Meteochile.cl
Estadística
Distribución de frecuencias
La distribución de frecuencias es una representación (muchas veces en forma de
tabla) de la muestra estadística, donde se asigna a cada dato su frecuencia
correspondiente. Tabla de frecuencias
Ejemplo: Temperatura
mínima (°C)
Frecuencia
Las temperaturas mínimas registradas durante
el mes de mayo en la ciudad de Santiago son 1° 1
las siguientes: 2° 0
3° 1
10°, 10°, 7°, 5°, 4°, 5°, 10°, 7°, 4°, 4°, 5°, 5°,
5°, 3°, 7°, 4°, 4°, 5°, 6°, 8°, 6°, 4°, 5°, 4° 8
1°, 4°, 5°, 7°, 8°, 6°, 4°, 5° 5° 9
6° 3
7° 4
8° 2
9° 0
10° 3
Estadística
Actividad
En conjunto con los compañeros de la asignatura, crear una base de datos con
las siguientes categorías: Rendimiento académico (leyenda, bueno, regular,
sobreviviendo) – ¿Con cuanta gente vive? - Situación sentimental (soltero,
pololeando, casado, comprometido, lanzado) – Bebida alcohólica favorita-
Estatura
Actividad
Realizar una tabla de datos para la variable: Situación sentimental. Desde la base
de datos del curso
Soltero
Lanzado
Pololeando
Comprometido
Casado
Fuente:
Estadística
Datos agrupados
Cuando se tiene una gran cantidad de datos, se distribuyen en
clases o categorías. Los datos agrupados son aquellos que se
encuentran clasificados dentro de intervalos o clases.
Ejemplo:
Número de datos
La tabla adjunta representa las edades de los integrantes de un a
pertenecientes
equipo deportivo, agrupadas en intervalos de edad. cada clase.
Datos agrupados
Ejemplo:
La tabla adjunta representa las edades de los integrantes de un
equipo deportivo, agrupadas en intervalos de edad.
Datos agrupados
Ejemplo:
Usando el ejemplo anterior, la marca de clase de cada intervalo es
8 11
9,5
Edad (años) Frecuencia Marca de clase2
[8 – 11] 16 9,5
[12 – 15] 12 13,5
[16 – 19] 10 17,5
[20 – 23] 7 21,5
[24 – 27] 4 25,5
Estadística
Datos agrupados
1. Calcular rango:
𝑅 𝑥 = max 𝑥𝑖 − min{𝑥𝑖 }
Datos agrupados
Construcción de intervalos de clases:
5. Marca de clase :
𝐿𝑖 + 𝐿𝑖
𝑋𝑖′ =
2
La marca de clase es un valor representativo para cada intervalo
Estadística
Actividad
Realizar una tabla de datos agrupados por intervalos con la variable: Estatura de
los alumnos del curso.
Estadística
Gráficos Estadísticos
“Una imagen vale mas que mil palabras”
Consideraciones:
1. Debe ser sencillo y auto explicativo
2. Debe evitar distorsiones (no mentir con el gráfico):
- Elegir bien las escalas
- Elegir bien el origen
- Utilizar colores agradables a la vista
10%
29%
Fuente: www.Meteochile.cl
Estadística
Gráfico de barras
Se utiliza para presentar datos cualitativos o datos cuantitativos de tipo discreto.
Se construye colocando en el eje X las categorías o recorrido de la variable y en el
eje Y la frecuencia. La altura de cada barra corresponde a la frecuencia observada.
(todas las barras tienen igual ancho). Se puede apreciar el orden de la variable.
Ejemplo:
Los datos del ejemplo anterior se representan gráficamente de la
siguiente manera:
Temperaturas mínimas registradas
en mayo
10
8
Frecuencia
0
1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
Temperatura (°C)
Fuente: www.Meteochile.cl
Estadística
Actividad
Realizar una tabla de datos y un gráfico de barra para la variable: Cantidad de
integrantes en su hogar. Construir, además, un grafico de torta para la variable
situación sentimental.
Estadística
Actividad
Con la tabla de frecuencias agrupadas por intervalos de la estatura de
los alumnos del curso, realizada anteriormente, crear un Histograma
Estadística
Polígono de frecuencias
La construcción de un polígono de frecuencias es similar al grafico anterior. En el
eje X ubicamos cada intervalo con sus respectivas marcas de clase y en el eje Y
ubicamos la frecuencia.
Luego marcamos mediante “puntos” las frecuencias de cada marca de clase y a
continuación unimos mediante líneas lo puntos consecutivos. No se debe olvidar
considerar un intervalo adicional al inicio y al termino de los intervalos para
terminar y empezar el polígono.
Actividad
Hacer un polígono de frecuencias a partir del gráfico anterior.
Estadística
Tarea
Medidas de resumen
Son valores o índices que resumen la información extraída de una muestra o
población, permitiéndonos describir como se comportan los datos.
Definición
Moda
Medidas de
Mediana
tendencia central
Promedio
(media aritmética)
Medidas de tendencia central
Moda
La moda de una serie de datos es aquel valor que se presenta con
mayor frecuencia, es decir, es el valor que más se repite.
La moda puede no existir y si existe, puede no ser única.
Notación: Mo(x)
Moda
1, 3, 3, 4, 3, 4, 8, 4, 9, 3, 4, 7, 6, 4, 3
Temperatura Frecuencia
1° 1
2° 0
La moda es 5° y su
frecuencia es 9 3° 1
4° 8
Se interpreta
5° 9
6° 3 La temperatura mínima mas
7° 4 frecuente durante el mes de
8° 2 Mayo fueron 5°
9° 0
10° 3
Medidas de tendencia central
𝑓𝑖+1
𝑴𝒐 𝑥 = 𝐿𝑖 + ∙𝐴
𝑓𝑖+1 + 𝑓𝑖−1
En donde:
𝐿𝑖 ∶ Limite inferior del intervalo modal
𝑓𝑖+1 : Frecuencia absoluta posterior del intervalo modal
𝑓𝑖−1 : Frecuencia absoluta anterior al intervalo modal
A : amplitud del intervalo
ഥ
Promedio (o media aritmética) 𝒙
Ejemplo 1:
La duración, en horas, de 8 ampolletas de cierto tipo son los siguientes:
650 – 556 – 722 – 478 – 570 – 660 – 814 – 670
ഥ
Promedio (o media aritmética) 𝒙
Ejemplo 2:
En la siguiente tabla de frecuencias, se presentan
Temperatura Frecuencia
las temperaturas mínimas registradas durante el mínima fi
mes de mayo en la ciudad de Santiago.
1° 1
2° 0
¿Cuál fue el promedio de las temperaturas 3° 1
mínimas registradas? 4° 8
5° 9
6° 3
7° 4
8° 2
9° 0
10° 3
Medidas de tendencia central
ഥ
Promedio (o media aritmética) 𝒙
x1 f1 x 2 f2 x 3 f3 x 4 f4 ...
En general: x
n
Con: Temperatura
Frecuencia
xi : dato mínima (°C)
fi
xi
fi : frecuencia
1 1
n : total de datos
2 0
3 1
11 2 0 3 1 4 8 5 9 6 3 7 4 8 2 9 0 10 3
x 4 8
31 5 9
1 3 32 45 18 28 16 30
x 6 3
31 7 4
8 2
173
x 9 0
31 10 3
x 5,58...
Medidas de tendencia central
741,5
x 15,132...a ños
49
Medidas de tendencia central
x1 f1 x 2 f2 x 3 f3 x 4 f4 ...
En general: x
n
Con:
xi : marca de clase
fi : frecuencia
n : total de datos
Para datos sueltos: Para datos en tablas: Para datos en tablas agrupadas:
En donde:
𝑥𝑖 ∶ Dato de la posición i-esima
𝑓𝑖 : Frecuencia absoluta de la i-esima posición
𝑥𝑖 ′ : Marca de clase de la i-esima
𝑛 : Total de datos
𝑘 ∶ total de categorías, intervalos o clases
Ejemplo 1:
La duración, en horas, de 8 ampolletas de cierto tipo son las siguientes:
650 – 556 – 722 – 478 – 570 – 660 – 814 – 670
Datos
centrales
Solución: Primero, ordenaremos la duración de menor a mayor.
Ejemplo 2:
¿Cuál será la mediana de las siguientes puntuaciones en un juego?
Ejemplo 3:
En la siguiente tabla de frecuencias, se presentan las temperaturas mínimas
registradas durante el mes de mayo en la ciudad de Santiago. ¿Cuál es la
mediana de las temperaturas mínimas registradas?
Actividad
Desde la base de datos del curso, calcular cada una de las medidas de
tendencia central (si es posible) para las variables estudiadas, deben incluir
sus respectivas interpretaciones.
Medidas de posición
Medidas de posición
Percentiles
Ejemplo:
El percentil 35 corresponde al valor bajo el cual se encuentra el
35% de los datos.
Medidas de posición
Percentiles
Rango intercuartil
Dato menor Dato mayor
Cuartil 1 Cuartil 3
mediana
Dato
Esto también es conocido
como el resumen de los
cinco números.
Medidas de posición
Diagrama de cajas
Ejemplo:
22 dato mayor, 22
Cuartil 3 es 20
Mediana 15
Rango intercuartil:
20 – 8 = 12
Cuartil 1 es 8
3 dato menor, 3
Medidas de posición
Percentiles
Luego:
𝑛∙𝑘
𝑃𝑘 = 𝑋𝑖 𝑡𝑎𝑙 𝑞𝑢𝑒 𝐹𝑖 ≥ .
100
𝑛∙𝑘
( − 𝐹𝑖−1 ) ∙ 𝐴
𝑃𝑘 = 𝐿𝑖 + 100
𝑓𝑖
Actividad
Desde la base de datos del curso, realizar un box-plot para la variable
estatura.
Medidas de Dispersión
3 5 10 18
El promedio del conjunto es x 6
3 3
Los cuadrados de las diferencias entre los datos y el promedio son:
(3 – 6)² = (– 3)² = 9
(5 – 6)² = (– 1)² = 1
(10 – 6)² = 4² = 16
Medidas de dispersión
Varianza de un conjunto de datos
9 1 16 26
σ2
3 3
26
σ2 8,666...
3
Medidas de dispersión
Varianza de un conjunto de datos
Notación:
𝑆2
Varianzas muestrales
𝑠2
𝜎 2 ∶ varianza poblacional
¿Cómo se calcula?
𝑛 2
2
σ𝑖=1 𝑋𝑖 − 𝑥ҧ ∙ 𝑓𝑖 σ𝑛𝑖=1 𝑋𝑖 − 𝑥ҧ 2
∙ 𝑓𝑖
𝑆 = 𝑠2 =
𝑛−1 𝑛
26
La varianza del conjunto {3, 5, 10} es: σ2
3
26
σ σ2 2,944
3
Medidas de dispersión
Desviación estándar de un conjunto de datos
Ejemplo: Se determinó que la desviación estándar del conjunto
que se presenta a continuación, era aproximadamente 2,944.
3 5 10