You are on page 1of 25

Probabilidad y Estadística

Estadística I

Docente: Ing. Marjorie Tingo S.


Ingeniera en Estadística e Informática, ESPOL
Máster en Logística y Dirección de operaciones, UOC
Capítulo 1

TRATAMIENTO ESTADÍSTICO DE
DATOS
Definición
• “La estadística es una ciencia que estudia la
recolección, análisis e interpretación de datos,
ya sea para ayudar en la toma de decisiones o
para explicar condiciones regulares o
irregulares de algún fenómeno o estudio
aplicado, de ocurrencia en forma aleatoria o
condicional. Permite llevar a cabo el proceso
relacionado con la investigación científica”

Capítulo 1: Tratamiento Estadístico de datos


Áreas de estudio
• Los datos son analizados estadísticamente lo cual
sigue dos propósitos: descripción e inferencia
– La estadística descriptiva, se dedica a los métodos de
recolección, descripción, visualización y resumen de
datos originados a partir de los fenómenos de estudio.
Los datos pueden ser resumidos numérica o
gráficamente.
– La estadística inferencial, se dedica a la generación de
los modelos, inferencias y predicciones asociadas a los
fenómenos teniendo en cuenta la aleatoriedad de las
observaciones. Se usa para modelar patrones en los
datos y extraer inferencias acerca de la población bajo
estudio basados en una muestra.
A partir de la información muestral con la ayuda de métodos
estadísticos y elementos de probabilidad se obtienen
conclusiones acerca de alguna característica de la población

Estadística Teoría de Estadística


descriptiva probabilidad inferencial

La probabilidad mide la frecuencia con la que se


obtiene un resultado o conjunto de resultados al llevar a
cabo un experimento aleatorio o al azar, del que se
conocen todos los resultados posibles, bajo condiciones
suficientemente estables.
La probabilidad es la medida de nuestro grado de
incertidumbre
Lo malo
• Un dicho famoso, al parecer de
[2]
Benjamin Disraeli, dice: «Hay
tres tipos de mentiras:
mentiras pequeñas, mentiras
grandes y estadísticas»
Muestreo aleatorio
“ocurrencia en forma aleatoria o condicional”
• Aleatorio: Algo es aparentemente aleatorio si
su causa no puede ser determinada o
controlada (azar).
• Sesgo: Incluir preferencia o excluir cierto tipo
de resultados. El sesgo muestral puede ser el
resultado de fraudes científicos que
manipulan directamente la información.
El muestreo aleatorio simple significa que
cualquier muestra dada de un tamaño
muestral especifico tiene la misma
probabilidad de ser seleccionada de una
población que cualquier otra muestra del
mismo tamaño.
Tipo de observaciones
• Datos discretos: Observaciones que admiten
resultados de números enteros.
– # de hijos
– # de elementos defectuosos
• Datos continuos: Observaciones que admiten
resultados de números decimales.
– Edad
– Estatura
Medidas de tendencia central
• Promedio o Media aritmética
• Mediana
 x n21 si n es impar

x   x n  x n 1
~
 si n es par
2 2

 2
Moda
• Valor observado que mayormente se repite.
• Pueden existir varias modas dentro de un
conjunto de datos.
• Se la representa con M
Medidas de dispersión
• Varianza – Desviación estándar
• Rango de la muestra

R  X MÁX  X MÍN
Resumen de los datos
• Tabla de frecuencias
Intervalo de Marca de Frecuencia Frecuencia Frecuencia Frecuencia
clase clase absoluta relativa absoluta relativa
acumulada acumulada
f f/n F F/n

2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6


3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
Vida útil en años de las baterías para automóvil
Media Ponderada
• X pond = X1 * P1 + X2 * P2 + … + Xn Pn

• La ponderación es establecida por el investigador en


base a la importancia o “peso” que represente la
observación
Cuantiles
• Los cuantiles son medidas de posición que se
determinan mediante un método que
determina la ubicación de los valores que
dividen un conjunto de observaciones en
partes iguales.
• Los más usados:
– Cuartiles: 4 partes (25%, 50%, 75%, 100%)
– Deciles: 10 partes (10%, 20%, … , 100%)
– Percentiles: 100 partes (1%, 2%, … , 100%)
Percentiles



X j  X j 1
g 0
PK   2

 X
 j 1 g 0
k *n  j  g k = rango percentil
j = parte entera
g = parte decimal
Relación con Cuartiles y deciles
• Q1 = P25 El primer cuartil es el percentil 25
• Q2 = P50 El segundo cuartil es el percentil 50
• Q3 = P75 El tercer cuartil es el percentil 75
• D1 = P10 El primer decil es el percentil 10
• D2 = P20 El segundo decil es el percentil 20
• D9 = P90 El noveno decil es el percentil 90
Graficas
• Histogramas
• Ojiva de frecuencias
• Diagrama de barras
• Diagramas circulares
• Diagrama de cajas
¿Qué es un histograma?

Un histograma es un diagrama de barras empleado


para resumir e ilustrar la variación que se presenta en
un conjunto de datos en cuanto a su tendencia
central, forma y dispersión. En donde la superficie de
cada barra es proporcional a la frecuencia de los
valores representados. En el eje vertical se
representan las frecuencias, y en el eje horizontal los
valores de las variables, normalmente señalando las
marcas de clase, es decir, la mitad del intervalo en el
que están agrupados los datos.
Histograma de frecuencias
Ojiva de frecuencias
Diagrama de barras
Diagrama de cajas

You might also like