You are on page 1of 87

Estadística Básica

Estadística descriptiva

Alex J. Zambrano1
azambran@poligran.edu.co

1 Docente, Fundación Universitaria Politécnico GranColombiano

Departamento de Ciencias Básicas


Fundación Universitaria Politécnico GranColombiano, 2016

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 1 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 2 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 3 / 73


Importancia de la estadística

H. G. Wells, precursor de la novela basada en ciencia ficción, escritor de ciento de obras


tales como “La máquina del tiempo”, “la guerra de los mundos”, dejo la siguiente cita
Llegara el día en el que el pensamiento estadístico
sera una condición tan necesaria para la convivencia eficiente
como la capacidad de leer y escribir
H. G. Wells

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 4 / 73


Año Internacional de la estadística

El año 2013 fue bautizado como el año de la estadística

Video sobre el año de la estadística

Año Internacional de la estadística -DANE-

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 5 / 73


¿Que es la estadística?

Definición (Estadística)
Ciencia destinada al estudio de fenómenos aleatorios, la misma está ligada con los
métodos científicos en la toma, recopilación, organización, presentación y análisis de
datos; tanto para la deducción de conclusiones como para la toma de decisiones
razonables de acuerdo a tales análisis.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 6 / 73


¿Por qué usted necesita conocer estadística?

1 Presentar y describir la información en forma adecuada.


2 Inferir conclusiones sobre poblaciones grandes basándose solamente en la
información obtenida de subconjuntos de ellas.
3 Utilizar modelos para obtener pronósticos confiables.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 7 / 73


Clasificación de la estadística

Estadística descriptiva Se compone de aquellos métodos que incluyen técnicas para


recolectar, presentar, analizar e interpretar datos.
Estadística inferencial Abarca aquellos métodos y conjuntos de técnicas que se utilizan
para obtener conclusiones sobre las leyes de comportamiento de una
población basándose en los datos de muestras tomadas de esa población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 8 / 73


Definiciones básicas

Definición (Población)
Conjunto total de objetos que tienen un característica en común. Está característica es de
interés para un problema dado.

Definición (Elementos o individuos)


Seres u objetos (en general, unidades experimentales) que contienen la información que
se desea estudiar. Los objetos pueden ser personas, animales, productos, etc.

Definición (Datos u observaciones)


Son números o denominaciones que podemos asignar a un individuo o elemento de la
población.

Definición (Parámetro)
Es cualquier característica medible de una población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 9 / 73


Definiciones básicas

Definición (Población)
Conjunto total de objetos que tienen un característica en común. Está característica es de
interés para un problema dado.

Definición (Elementos o individuos)


Seres u objetos (en general, unidades experimentales) que contienen la información que
se desea estudiar. Los objetos pueden ser personas, animales, productos, etc.

Definición (Datos u observaciones)


Son números o denominaciones que podemos asignar a un individuo o elemento de la
población.

Definición (Parámetro)
Es cualquier característica medible de una población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 9 / 73


Definiciones básicas

Definición (Población)
Conjunto total de objetos que tienen un característica en común. Está característica es de
interés para un problema dado.

Definición (Elementos o individuos)


Seres u objetos (en general, unidades experimentales) que contienen la información que
se desea estudiar. Los objetos pueden ser personas, animales, productos, etc.

Definición (Datos u observaciones)


Son números o denominaciones que podemos asignar a un individuo o elemento de la
población.

Definición (Parámetro)
Es cualquier característica medible de una población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 9 / 73


Definiciones básicas

Definición (Población)
Conjunto total de objetos que tienen un característica en común. Está característica es de
interés para un problema dado.

Definición (Elementos o individuos)


Seres u objetos (en general, unidades experimentales) que contienen la información que
se desea estudiar. Los objetos pueden ser personas, animales, productos, etc.

Definición (Datos u observaciones)


Son números o denominaciones que podemos asignar a un individuo o elemento de la
población.

Definición (Parámetro)
Es cualquier característica medible de una población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 9 / 73


Definición (Muestra)
Subconjunto de la población.

Definición (Estadístico)
Cualquier característica medible de una muestra.

Definición (Variable)
Característica de la población que se analiza en el estudio estadístico.

Definición (Censo)
Palabra derivada del latín censere, que significa “valuar o tasar”. Es la enumeración
completa de la población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 10 / 73


Definición (Muestra)
Subconjunto de la población.

Definición (Estadístico)
Cualquier característica medible de una muestra.

Definición (Variable)
Característica de la población que se analiza en el estudio estadístico.

Definición (Censo)
Palabra derivada del latín censere, que significa “valuar o tasar”. Es la enumeración
completa de la población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 10 / 73


Definición (Muestra)
Subconjunto de la población.

Definición (Estadístico)
Cualquier característica medible de una muestra.

Definición (Variable)
Característica de la población que se analiza en el estudio estadístico.

Definición (Censo)
Palabra derivada del latín censere, que significa “valuar o tasar”. Es la enumeración
completa de la población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 10 / 73


Definición (Muestra)
Subconjunto de la población.

Definición (Estadístico)
Cualquier característica medible de una muestra.

Definición (Variable)
Característica de la población que se analiza en el estudio estadístico.

Definición (Censo)
Palabra derivada del latín censere, que significa “valuar o tasar”. Es la enumeración
completa de la población.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 10 / 73


Tipos de datos

Definición (Datos categóricos o cualitativos)


Representan categorías o atributos que pueden clasificarse como un criterio o cualidad.

Definición (Datos numéricos o cuantitativos)


Producen respuestas numéricas. Estas pueden ser discretas o continuas.

Definición (Datos discretos)


Producen respuestas numéricas que surgen de un conteo.

Definición (Datos continuos)


Producen respuestas numéricas que surgen de un proceso de medición, donde la
característica de que se mide puede tomar cualquier valor numérico en un intervalo.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 11 / 73


Tipos de datos

Definición (Datos categóricos o cualitativos)


Representan categorías o atributos que pueden clasificarse como un criterio o cualidad.

Definición (Datos numéricos o cuantitativos)


Producen respuestas numéricas. Estas pueden ser discretas o continuas.

Definición (Datos discretos)


Producen respuestas numéricas que surgen de un conteo.

Definición (Datos continuos)


Producen respuestas numéricas que surgen de un proceso de medición, donde la
característica de que se mide puede tomar cualquier valor numérico en un intervalo.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 11 / 73


Tipos de datos

Definición (Datos categóricos o cualitativos)


Representan categorías o atributos que pueden clasificarse como un criterio o cualidad.

Definición (Datos numéricos o cuantitativos)


Producen respuestas numéricas. Estas pueden ser discretas o continuas.

Definición (Datos discretos)


Producen respuestas numéricas que surgen de un conteo.

Definición (Datos continuos)


Producen respuestas numéricas que surgen de un proceso de medición, donde la
característica de que se mide puede tomar cualquier valor numérico en un intervalo.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 11 / 73


Tipos de datos

Definición (Datos categóricos o cualitativos)


Representan categorías o atributos que pueden clasificarse como un criterio o cualidad.

Definición (Datos numéricos o cuantitativos)


Producen respuestas numéricas. Estas pueden ser discretas o continuas.

Definición (Datos discretos)


Producen respuestas numéricas que surgen de un conteo.

Definición (Datos continuos)


Producen respuestas numéricas que surgen de un proceso de medición, donde la
característica de que se mide puede tomar cualquier valor numérico en un intervalo.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 11 / 73


Tipos de datos según escala de medidas

Definición (Datos de nivel nominal)


Se crean cuando se utilizan nombres para establecer categorías con la condición de que
cada dato pertenezca única y exclusivamente a una de estas categorías. No poseen ni
orden, ni distancia, ni origen.

Definición (Escala nominal para datos numéricos)


Asigna números a las categorías. (Ejemplo: Camiseta deportiva, números telefónicos,
identificación)

Definición (Escala nominal para datos categóricos)


Es un agrupamiento no ordenado de los datos en categorías discretas, donde cada dato
puede incluirse solamente en un de los grupos. (Ejemplo: Sexo, tipo de sangre, religión,
color, gusto)

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 12 / 73


Tipos de datos según escala de medidas

Definición (Datos de nivel nominal)


Se crean cuando se utilizan nombres para establecer categorías con la condición de que
cada dato pertenezca única y exclusivamente a una de estas categorías. No poseen ni
orden, ni distancia, ni origen.

Definición (Escala nominal para datos numéricos)


Asigna números a las categorías. (Ejemplo: Camiseta deportiva, números telefónicos,
identificación)

Definición (Escala nominal para datos categóricos)


Es un agrupamiento no ordenado de los datos en categorías discretas, donde cada dato
puede incluirse solamente en un de los grupos. (Ejemplo: Sexo, tipo de sangre, religión,
color, gusto)

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 12 / 73


Tipos de datos según escala de medidas

Definición (Datos de nivel nominal)


Se crean cuando se utilizan nombres para establecer categorías con la condición de que
cada dato pertenezca única y exclusivamente a una de estas categorías. No poseen ni
orden, ni distancia, ni origen.

Definición (Escala nominal para datos numéricos)


Asigna números a las categorías. (Ejemplo: Camiseta deportiva, números telefónicos,
identificación)

Definición (Escala nominal para datos categóricos)


Es un agrupamiento no ordenado de los datos en categorías discretas, donde cada dato
puede incluirse solamente en un de los grupos. (Ejemplo: Sexo, tipo de sangre, religión,
color, gusto)

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 12 / 73


Definición (Datos ordinales)
Son datos medidos en una escala nominal ordenada de alguna manera cuyas categorías,
cada una de las cuales indica un nivel distinto respecto a un atributo que se está
midiendo. Solo poseen la propiedad de orden. (Ejemplo: Nivel de estudio, Rangos de
trabajo, Evaluación docente)

Definición (Datos de intervalo)


Son aquellos datos medidos en una escala ordinal para los cuales pueden clasificarse las
distancias entre los valores. Poseen las propiedades de orden y distancia. En los datos de
intervalo no siempre tiene un punto cero (cero relativo). (Ejemplo: Temperatura,
ubicación en una carretera respecto a un punto de referencia, nivel de aceite medido con
una vara graduada)

Definición (Datos de razón)


Son aquellos datos medidos e una escala de intervalo con un punto cero que significa
“ninguno” (cero absoluto). Con datos medidos en una escala de razón podemos
determinar cuántas veces es mayor una medida que otra. Tiene propiedades de orden,
distancia y origen. (Ejemplo: Salario, producción, peso, altura, número de goles)

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 13 / 73


Definición (Datos ordinales)
Son datos medidos en una escala nominal ordenada de alguna manera cuyas categorías,
cada una de las cuales indica un nivel distinto respecto a un atributo que se está
midiendo. Solo poseen la propiedad de orden. (Ejemplo: Nivel de estudio, Rangos de
trabajo, Evaluación docente)

Definición (Datos de intervalo)


Son aquellos datos medidos en una escala ordinal para los cuales pueden clasificarse las
distancias entre los valores. Poseen las propiedades de orden y distancia. En los datos de
intervalo no siempre tiene un punto cero (cero relativo). (Ejemplo: Temperatura,
ubicación en una carretera respecto a un punto de referencia, nivel de aceite medido con
una vara graduada)

Definición (Datos de razón)


Son aquellos datos medidos e una escala de intervalo con un punto cero que significa
“ninguno” (cero absoluto). Con datos medidos en una escala de razón podemos
determinar cuántas veces es mayor una medida que otra. Tiene propiedades de orden,
distancia y origen. (Ejemplo: Salario, producción, peso, altura, número de goles)

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 13 / 73


Definición (Datos ordinales)
Son datos medidos en una escala nominal ordenada de alguna manera cuyas categorías,
cada una de las cuales indica un nivel distinto respecto a un atributo que se está
midiendo. Solo poseen la propiedad de orden. (Ejemplo: Nivel de estudio, Rangos de
trabajo, Evaluación docente)

Definición (Datos de intervalo)


Son aquellos datos medidos en una escala ordinal para los cuales pueden clasificarse las
distancias entre los valores. Poseen las propiedades de orden y distancia. En los datos de
intervalo no siempre tiene un punto cero (cero relativo). (Ejemplo: Temperatura,
ubicación en una carretera respecto a un punto de referencia, nivel de aceite medido con
una vara graduada)

Definición (Datos de razón)


Son aquellos datos medidos e una escala de intervalo con un punto cero que significa
“ninguno” (cero absoluto). Con datos medidos en una escala de razón podemos
determinar cuántas veces es mayor una medida que otra. Tiene propiedades de orden,
distancia y origen. (Ejemplo: Salario, producción, peso, altura, número de goles)

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 13 / 73


Resumen de datos según escala

Escala Características Ejemplos Aplicaciones Tratamiento Estadístico Ventajas Inconvenientes


Sirve para identificar objetos. Género Identificación de cuestionarios No se pueden hacer operaciones matemáticas Muy fácil de diseñar Pocas posibilidades de tratamiento estadístico
Los valores numéricos son nombres de categorías. Profesiones Variables ilustradas en análisis factoriales Análisis cualitativo Muy fácil de comprender Puede cansar en cuestionarios largos
Los números no tienen magnitud. Usuarios/no usuarios Estudios de segmentación Tablas cruzadas Ausencia de sesgos en su redacción Requiere experiencia o conocimientos para poder jerarquizar
Los números no miden ninguna relación. Tipos de establecimientos Identificación de perfiles de consumidores Frecuencias No requiere conocimientos especiales del encuestado Puede ser difícil de aplicar cuando la lista a ordenar es amplia
Nominal Niveles de renta Tablas de porcentajes simples y acumulados Muy útil en estudios con variables cualitativas
Nivel de estudios Gráficos No fatiga
Tallas de la ropa o calzado Análisis factorial de correspondencias múltiples
DNI Elementos ilustrativos en análisis de componentes principales o factoriales de correspondencia
Dorsales de los ciclistas
Establecen un orden de preferencias Estudios de preferencias Métodos no paramétricos Muy fácil de diseñar Pocas posibilidades de tratamiento estadístico
Los valores numéricos muestran un orden o secuencia Similitudes Correlaciones Muy fácil de comprender Puede cansar en cuestionarios largos
Los intervalos no miden magnitudes Disimilitudes Análisis de la varianza por rangos Ausencia de sesgos en su redacción Requiere experiencia o conocimientos para poder jerarquizar
Ordinal Es una forma fácil de recoger información sobre cualquier tipo de ítems Preferencia de marcas Posicionamiento Escalas multidimensionales No fatiga Puede ser difícil de aplicar cuando la lista a ordenar es amplia
Percentiles
Medianas
Tablas cruzadas
Miden diferencias entre objetos Correlaciones Facíl de redactar Reservada a personas con conocimientos elevados de la materia que se investiga
Los valores numéricos muestran orden y magnitud Grados de acuerdo Estudios de actitudes Contrastes de hipótesis Riesgo bajo de introducir sesgos en su redacción Requiere un nivel de cultura medio o alto
Métrica de intervalo Los intervalos son iguales Temperaturas Estudios de opinión Análisis de la varianza Muchas posibilidades de tratamiento cuantitativo Obliga a reflexionar mucho
El cero no es origen Análisis factorial Fatiga
El cero es arbitrario
Sirve para hacer comparaciones absolutas de magnitudes Edad Fácil de redactar Reservada a personas con conocimientos elevados de la materia que se investiga
Los valores numéricos muestran origen, orden y distancia Peso Estudios de imagen Permiten la utilización de cualquier tipo de técnica estadística o matemática Máximas posibilidades de tratamiento cuantitativo Requiere un nivel de cultura medio o alto
Métrica continua Los intervalos son iguales Renta Estudios de segmentación Obliga a reflexionar mucho
El cero indica ausencia de magnitud Ventas Estudios de posicionamiento Requiere una redacción muy precisa
Cuotas de mercado Puede haber dificultades de comprensión

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 14 / 73


Ejemplo
En una encuesta de The Wall Street Journal (13 de octubre de 2003) se les hacen a los
suscriptores 46 preguntas acerca de sus características e intereses. De cada una de las
preguntas siguientes, ¿cuál proporciona datos cualitativos o cuantitativos e indica la
escala de medición apropiada?
¿Cuál es su edad?
¿Es usted hombre o mujer?
¿Cuándo empezó a leer el WSJ? Preparatoria, universidad al comienzo de la carrera,
a la mitad de la carrera, al final de la carrera o ya retirado.
¿Cuánto tiempo hace que tiene su trabajo o cargo actual?
¿Qué tipo de automóvil piensa comprarse la próxima vez que compre uno? Ocho
categorías para las respuestas, entre las que se encontraban sedán, automóvil
deportivo, miniván, etcétera.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 15 / 73


Ejemplo
Diga de cada una de las variables siguientes si es cualitativa o cuantitativa e indique la
escala de medición a la que pertenece.
Ventas anuales.
Tamaño de los refrescos (pequeño, mediano, grande).
Clasificación como empleado (GS 1 a GS 18).
Ganancia por acción.
Modo de pago (al contado, cheque, tarjeta de crédito).

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 16 / 73


Ejercicio de datos

Ejercicio
En un centro de información turística de Londres, se realizó una serie de preguntas a una
muestra aleatoria de turistas que entraron. Describa el tipo de datos obtenidos con cada
pregunta.
¿Va a pasar la noche en Londres?
¿Cuántas veces había estado anteriormente en Londres?
¿Cuál de las siguientes atracciones ha visitado?
Torre de Londres
Palacio de Buckingham
Big Ben
Covent Garden
Abadía de Westminster
¿Qué probabilidades hay de que vuelva a Londres en los próximos 12 meses: (1)
improbable, (2) probable, (3) muy probable?

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 17 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 18 / 73


Distribución de frecuencia

Definición (Distribución de frecuencia)


Es un resumen tabular de datos que muestra el número (frecuencia) de elementos en
cada una de las diferentes clases disyuntas (que no se sobreponen).

Ejemplos (Frecuencias)
Tipos de distribución de frecuencias
Absoluta
Relativa
Absoluta acumulada
Relativa acumulada

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 19 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 20 / 73


Distribución de frecuencia (Datos Cualitativos)

Cuadro: Ejemplo distribución de frecuencias datos cualitativos

Variable Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa


absoluta relativa acumulada acumulada
X fi hi Fi Hi
Categoría 1 f1 h1 F1 H1
Categoría 2 f2 h2 F2 H2
.. .. .. .. ..
. . . . .
Categoría k fk hk n 1
n 1

hi = fni ,
Fi = f1 + f2 + · · · + fi ,
Hi = h1 + h2 + · · · + hi

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 21 / 73


Ejemplo

Ejemplo
¿Cuál es la marca de gaseosa que más le gusta?
Coke Classic Coke Classic Coke Classic Sprite Coke Classic
Diet Coke Dr. Pepper Diet Coke Dr. Pepper Diet Coke
Pepsi Sprite Coke Classic Pepsi Pepsi
Diet Coke Coke Classic Sprite Diet Coke Pepsi
Coke Classic Diet Coke Pepsi Pepsi Pepsi
Coke Classic Coke Classic Coke Classic Coke Classic Pepsi
Dr. Pepper Coke Classic Coke Classic Coke Classic Coke Classic
Diet Coke Sprite Coke Classic Coke Classic Dr. Pepper
Pepsi Coke Classic Pepsi Pepsi Pepsi
Pepsi Diet Coke Coke Classic Dr. Pepper Sprite

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 22 / 73


Representaciones gráficas para datos cualitativos

Definición (Gráfica de barras)


Gráfica para representar datos cualitativos que hayan sido resumidos en una distribución
de frecuencia, de frecuencia relativa o de frecuencia porcentual.

Definición (Gráfica circular (pastel))


Gráfica para representar datos resumidos mediante una distribución de frecuencia relativa
y que se basa en la subdivisión de un círculo en sectores que corresponden a la frecuencia
relativa de las clases.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 23 / 73


Ejemplo

Ejemplo
Distribución de frecuencia del gusto de la gaseosa
Gaseosas Frecuencia
Coke Classic 19
Diet Coke 8
Dr. Pepper 5
Pepsi 13
Sprite 5
Total general 50

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 24 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 25 / 73


Distribución de frecuencia (Datos Cuantitativos)

Cuadro: Ejemplo distribución de frecuencias datos cuantitativos

Intervalos de Marca de Frecuencia absoluta Frecuencia relativa Frecuencia absoluta Frecuencia relativa
clase [−) clase absoluta relativa acumulada acumulada
Variable xi fi hi Fi Hi
[L0 − L1 ) x1 f1 h1 F1 H1
[L1 − L2 ) x2 f2 h2 F2 H2
.. .. .. .. .. ..
. . . . . .
[Lk−1 − Lk ) xk fk hk n 1
n 1

límite infi +límite supi


xi = 2
,
fi
hi = n
,
Fi = f1 + f2 + · · · + fi ,
Hi = h1 + h2 + · · · + hi

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 26 / 73


Pasos para distribución de frecuencias datos cuantitativos

Construcción de una tabla de distribución de frecuencias


1 Determine el rango de los datos R = Xmáx − Xmı́n .
2 Seleccione el número de clase o intervalos K
R
3 Calcule la amplitud de los intervalos redondeando por encima C = K

Sugerencia para determinar el número de intervalos


Criterio del investigador.

K= n
K = 3.322 log10 (n) + 1 (Regla de Sturges)
Atendiendo al número de observaciones
Número de observaciones K
Menos de 50 5 -7
De 50 a 100 7-8
De 100 a 500 8- 10
De 500 a 1000 10 - 11
De 1000 a 5000 11 - 14
Más de 5000 14 - 20

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 27 / 73


Ejemplo

Ejemplo
Nielsen Home Technology Report informa sobre la tecnología en el hogar y su uso. Los
datos siguientes son las horas de uso de computadora por semana en una muestra de 50
personas.
4.1 10.4 3.4 1.6 3.0
3.1 2.0 5.4 3.9 11.1
4.1 8.8 4.3 7.1 6.2
10.8 9.5 12.1 4.0 4.4
7.2 5.7 4.7 3.7 6.1
1.5 5.9 5.7 6.1 3.7
4.8 14.8 4.2 4.1 3.5
4.1 5.6 3.3 10.3 7.6
2.8 12.9 0.7 9.2 5.7
6.1 5.9 3.9 3.1 3.1

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 28 / 73


Representaciones gráficas para datos cuantitativos

Definición (Histograma)
Representación gráfica de una distribución de frecuencia, de frecuencia relativa o de
frecuencia porcentual que se construye colocando los intervalos de clase sobre un eje
horizontal y la frecuencia, la frecuencia relativa o la frecuencia porcentual sobre un eje
vertical.

Definición (Ojiva)
Gráfica de una distribución acumulada.

Definición (Diagrama de tallo y hojas)


Técnica para el análisis exploratorio de datos que tanto ordena por jerarquía datos
cuantitativos como proporciona claridad acerca de la forma de la distribución.

Definición (Diagrama de caja)


Resumen gráfico de los datos que se basa en el resumen de cinco números (el valor
menor, el primer cuartil, la mediana, el tercer cuartil, y el valor mayor).

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 29 / 73


Ejemplo

Ejemplo
Distribución de frecuencia de las horas de uso de computadora por semana

Horas Frecuencias
0.7-2.8 4
2.8-4.9 22
4.9-7 11
7-9.1 4
9.1-11.2 6
11.2-13.3 2
13.3-15.4 1
Total 50

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 30 / 73


Horas de uso computadora por semana
Stem-and-Leaf Plot
Ejemplo
Frequency Stem & Leaf Distribución de frecuencia de las horas de uso
de computadora por semana
1,00 0. 7
2,00 1 . 56
2,00 2 . 08
11,00 3 . 01113457799
10,00 4 . 0111123478
7,00 5 . 4677799
4,00 6 . 1112
3,00 7 . 126
1,00 8. 8
2,00 9 . 25
3,00 10 . 348
1,00 11 . 1
1,00 12 . 1
2,00 Extremes (>=12,9)

Stem width: 1,00


Each leaf: 1 case(s)

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 31 / 73


Aplicación de gráfico de ojivas (Van Westerdorp)
Cuál precio considera usted tan BARATO para el producto que dudaría de su calidad y no lo
compraría
Cuál es precio que usted consideraría JUSTO para el producto
Cuál precio considera usted CARO para el producto estaría dispuesta a pagar
Cuál es precio que considera usted TAN CARO para el producto que no lo compraría

Punto de indiferencia al precio (PIP): Es el precio considerado como base o justo del mercado.
Punto de precio óptimo (PPO): Es el precio viable para el mercado.
Punto Económico Marginal (PEM): Es el precio más bajo que el usuario esperaria*.
Punto Caro Marginal (PCM): Es el precio máximo tolerable por el consumidor*.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 32 / 73


Asimetría y sesgo

Definición (Simetría)
Se dice que la forma de una distribución es simétrica si las observaciones están
equilibradas, es decir, distribuidas de una manera uniforme a un lado y a otro de su
centro.

Definición (Sesgo)
Una distribución está sesgada o es asímétrica si las observaciones no están distribuidas
simétricamente en ninguno de los lados del centro. Una distribución sesgada hacia la
derecha (llamada a veces sesgada positivamente) tiene una cola que se extiende hacia la
derecha. Una distribución sesgada hacia la izquierda (llamada a veces sesgada
negativamente) tiene una cola que se extiende hacia la izquierda.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 33 / 73


Ejercicios

Ejercicio
Se realizó un estudio sobre satisfacción en el empleo en cuatro ocupaciones. La
satisfacción en el empleo se midió mediante un cuestionario de 18 puntos en el que a
cada punto había que calificarlo con una escala del 1 al 5; las puntuaciones más altas
correspondían a mayor satisfacción en el empleo. La suma de las calificaciones dadas a
los 18 puntos proporcionaba una medida de la satisfacción en el empleo de cada uno de
los individuos de la muestra. Los datos obtenidos fueron los siguientes.
1 Realice un diagrama circular para la ocupación de los trabajadores.
2 Realice una histograma para la satisfacción de los trabajadores.
3 ¿Qué conclusiones se pueden de los gráficos anteriores?

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 34 / 73


Observación Ocupación Satisfacción Observación Ocupación Satisfacción
1 Abogado 42 21 Terapeuta Físico 80
2 Terapeuta Físico 86 22 Analista de sistemas 64
3 Abogado 42 23 Terapeuta Físico 55
4 Analista de sistemas 55 24 Ebanista 64
5 Abogado 38 25 Ebanista 59
6 Ebanista 79 26 Ebanista 54
7 Abogado 44 27 Analista de sistemas 76
8 Analista de sistemas 41 28 Analista de sistemas 60
9 Terapeuta Físico 55 29 Terapeuta Físico 59
10 Analista de sistemas 66 30 Ebanista 78
11 Abogado 53 31 Terapeuta Físico 60
12 Ebanista 65 32 Terapeuta Físico 50
13 Abogado 74 33 Ebanista 79
14 Terapeuta Físico 52 34 Analista de sistemas 62
15 Terapeuta Físico 78 35 Abogado 45
16 Analista de sistemas 44 36 Ebanista 84
17 Analista de sistemas 71 37 Terapeuta Físico 62
18 Abogado 50 38 Analista de sistemas 73
19 Abogado 48 39 Ebanista 60
20 Ebanista 69 40 Abogado 64

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 35 / 73


Ejercicio
Una muestra aleatoria de 100 estudiantes de administración de empresas tuvo que
responder una serie de preguntas demográficas, entre las que se encontraba la
especialidad, el sexo, la edad, el año, el curso y la calificación media. También se le
pregunto por su nivel de satisfacción con el aparcamiento, el alojamiento y los comedores
del campus universitario. Las respuestas a estas preguntas sobre la satisfacción se
midieron en una escala de 1 a 5, en la que 5 correspondía al nivel de satisfacción más
alto. Por último, se les preguntó si tenían intención de hacer estudios de postgrados en su
plazo de 5 años una vez terminado el grado (0: no, 1: sí). Estos datos se encuentran en el
fichero de datos Finstad and Lie Study.
1 Construya un gráfico de barras agrupado de la especialidad y el sexo de los
encuestados.
2 Construya un gráfico circular de sus especialidades.
3 Construya un histograma para la calificación media.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 36 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 37 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 38 / 73


Dos variables cualitativas

Ejercicio
Se quiere estudiar el tipo de categoría de un grupo de profesores y el tipo de universidad
en la que trabaja.
Tipo de Universidad Categoría del Profesor
Pública Tiempo Completo
Privada Asociado
Privada Asociado
Privada Tiempo Completo
Privada Cátedra
Privada Cátedra
Pública Cátedra
Pública Tiempo Completo
Privada Tiempo Completo
Privada Tiempo Completo
Privada Asociado
Privada Asociado
Privada Tiempo Completo
Pública Tiempo Completo
Pública Asociado
Pública Asociado
Pública Asociado
Privada Asociado

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 39 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 40 / 73


Una variable cualitativa y una cuantitativa

Ejercicio
Se realizó un estudio sobre satisfacción en el empleo en cuatro ocupaciones. La
satisfacción en el empleo se midió mediante un cuestionario de 18 puntos en el que a
cada punto había que calificarlo con una escala del 1 al 5; las puntuaciones más altas
correspondían a mayor satisfacción en el empleo. La suma de las calificaciones dadas a
los 18 puntos proporcionaba una medida de la satisfacción en el empleo de cada uno de
los individuos de la muestra. Los datos obtenidos fueron los siguientes.
1 Realice una tabulación cruzada para ocupación y satisfacción en el trabajo.
2 ¿Qué observaciones puede hacer respecto a la satisfacción en el trabajo en estas
ocupaciones?

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 41 / 73


Una variable cualitativa y una cuantitativa

Observación Ocupación Satisfacción Observación Ocupación Satisfacción


1 Abogado 42 21 Terapeuta Físico 80
2 Terapeuta Físico 86 22 Analista de sistemas 64
3 Abogado 42 23 Terapeuta Físico 55
4 Analista de sistemas 55 24 Ebanista 64
5 Abogado 38 25 Ebanista 59
6 Ebanista 79 26 Ebanista 54
7 Abogado 44 27 Analista de sistemas 76
8 Analista de sistemas 41 28 Analista de sistemas 60
9 Terapeuta Físico 55 29 Terapeuta Físico 59
10 Analista de sistemas 66 30 Ebanista 78
11 Abogado 53 31 Terapeuta Físico 60
12 Ebanista 65 32 Terapeuta Físico 50
13 Abogado 74 33 Ebanista 79
14 Terapeuta Físico 52 34 Analista de sistemas 62
15 Terapeuta Físico 78 35 Abogado 45
16 Analista de sistemas 44 36 Ebanista 84
17 Analista de sistemas 71 37 Terapeuta Físico 62
18 Abogado 50 38 Analista de sistemas 73
19 Abogado 48 39 Ebanista 60
20 Ebanista 69 40 Abogado 64

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 42 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 43 / 73


Dos variables cuantitativas

Ejercicio
Considere la relación publicidad/ventas en una tienda de equipos de sonido. Durante los
últimos tres meses, en 10 ocasiones la tienda apareció en comerciales de televisión, en el
fin de semana, para promover sus ventas. Los directivos quieren investigar si hay relación
entre el número de comerciales emitidos el fin de semana y las ventas en la semana
siguiente. En la tabla siguiente se presentan datos muestrales de las 10 semanas dando
las ventas en cientos de dólares.
Semana Número de comerciales Ventas (en ciento de dólares)
1 2 50
2 5 57
3 1 41
4 3 54
5 4 54
6 1 38
7 5 63
8 3 48
9 4 59
10 2 46

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 44 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 45 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 46 / 73


Media

Definición (Media)
La media aritmética de cierto conjunto de datos se encuentra sumando los números y
dividiendo después entre la cantidad de datos (promedio).
Media Poblacional Media Muestral
1
P
N P
n
µ= N Xi x̄ = n1 xi
i=1 i=1

Observación
Ventajas
Fácil de calcular.
Buenas ventajas como estimador.
Desventajas
Se ve afectada por los valores extremos.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 47 / 73


Mediana

Definición (Mediana)
Es aquel valor en el cual el 50 % de los datos se encuentran por debajo del él y el otro
50 % de los datos se encuentran por encima de él. Es decir, es la observación que ocupa
el lugar central de un conjunto de datos ordenados en forma ascendente.
Sea x[1] 6 x[2] 6 · · · 6 x[n] un conjunto de datos ordenados en forma ascendente donde
x[i] representa el valor en la posición i-ésima. La mediana se definen como:

x n+1 si n es impar
[ ]
x̃ = x n2 +x n +1
 [ 2 ] [ 2 ] si n es par
2

Observación
Ventajas
No se ve afectada por valores extremos.
Desventajas
No es fácil determinar la mediana si el conjunto de datos es grande.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 48 / 73


Moda

Definición (Moda)
Si existe, es el valor con mayor frecuencia. Se denota por x̂.

Observación
Ventajas
No se ve afectada por valores extremos.
Es útil para datos categóricos.
Desventajas
La moda puede que no exista.
La moda puede no ser única.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 49 / 73


Ejemplo

Ejemplo (Sueldos egresados)


Una asociación recaba información sobre sueldos anuales iniciales de los recién egresados
de universidades de acuerdo con su especialidad. El salario anual inicial de los
administradores de empresas es $39 580 (CNNMoney.com, 15 de febrero de 2006). A
continuación se presentan muestras de los sueldos anuales iniciales de especialistas en
marketing y en administración (los datos están en miles de dolares):
Egresados de marketing 34.2 45.0 39.5 28.4 37.7 35.8 30.6 35.2 34.2 42.4.
Egresados de administradores 33.5 57.1 49.7 40.2 44.2 45.2 47.8 38.0 53.9 41.1 41.7
40.8 55.5 43.5 49.1 49.9.
1 Para cada uno de los grupos de sueldos iniciales calcule moda, mediana y media.
2 Los egresados de contaduría suelen tener mejores salarios iniciales. ¿Qué indican los
datos muestrales acerca de la diferencia entre los sueldos anuales iniciales de
egresados de marketing y de contaduría?

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 50 / 73


Ejercicio

Ejercicio (Edades)
Millones de estadounidenses trabajan para sus empresas desde sus hogares. A
continuación se presenta una muestra de datos que dan las edades de estas personas que
trabajan desde sus hogares.
18 54 20 46 25 48 53 27 26 37 40 36 42 25 27 33 28 40 45 25

1 Calcule la media y la moda.


2 La edad mediana de la población de todos los adultos es de 36 años (The World
Almanac, 2006). Use la edad mediana de los datos anteriores para decir si las
personas que trabajan desde sus hogares tienden a ser más jóvenes o más viejos que
la población de todos los adultos.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 51 / 73


Ejercicio

Ejercicio (Media ponderada)


En una investigación realizada entre los suscriptores de la revista Fortune se hizo la
pregunta siguiente: “De los últimos números ¿cuántos ha leído?” Suponga que en la
distribución de frecuencia siguiente se resumen las 500 respuestas.
Números leídos Frecuencia
0 15
1 10
2 40
3 85
4 350
Total 500
¿Cuál es la cantidad media de los últimos números que han leído los suscriptores?

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 52 / 73


Ejercicio

Ejercicio (Media agrupada)


Una compañia farmacéutica que vende por Internet obtuvo la siguiente distribución de
frecuencias de los tiempos de envió (número de horas transcurridas entre el momento en
el que se hace el pedido y el momento en el que se envía) de una muestra aleatoria de 40
pedidos
Números de horas fi
4 6 x < 10 8
10 6 x < 16 15
16 6 x < 22 10
22 6 x < 28 7
¿Cuál es el tiempo de envío medio aproximado?

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 53 / 73


Media Geométrica

Definición (Media Geométrica)


Para un conjunto de n números enteros positivos la media geométrica se define como la
n-ésima raíz del producto de los n valores. Es decir,
!1/n
Y
n
x̄g = (x1 · · · xn )1/n = xi .
i=1

Notese que
1X
n
1
log x̄g = (log x1 + · · · + log xn ) = log xi .
n n i=1

Observación
La media geométrica es útil para encontrar los cambios porcentuales en una serie de
números positivos, inclusive, para encontrar el promedio de proporciones, índices, o tasas
de crecimiento. Tiene mucha aplicación en el comercio y en la economía porque nos
interesa encontrar el cambio porcentual en las ventas, salarios o datos económicos, tales
como el producto nacional bruto.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 54 / 73


Media Geométrica

Observación
La media geométrica siempre será menor que la media aritmética, salvo en el extraño
caso en el que todos los incrementos porcentuales sean iguales. Si esto último sucede, las
dos medias serán iguales.

Ejemplo
Supongamos que los intereses durante 5 años consecutivos son 3,6,10, 12 y 8 %
respectivamente. Cuanto voy a obtener después de 5 años si coloco 100000 pesos. ¿Cuál
es la tasa promedio de interés que se obtiene?

Ejercicio
Una cadena de grande almacenes eligió aleatoriamente 10 establecimientos situados en
una región. Tras examinar los datos de ventas, observó que ese año se habían conseguido
en las Navidades los siguientes aumentos porcentuales de las ventas en dólares con
respecto al año anterior: 10.2, 3.1, 5.9, 7.0, 3.7, 2.9, 6.8, 7.3, 8.2 y 4.3 %.
Calculé el aumento porcentual medio de las ventas en dólares.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 55 / 73


Otros estadísticos de centralidad

Ejercicio
Investigar ejemplos y aplicaciones de cada una de las siguientes medias.
Media armónica.
Rango medio.
Media cuadrática.
Media recortada.
Media winsorizada.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 56 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 57 / 73


Medidas de localización

Definición
Una medida de localización para una distribución de frecuencias es aquel valor para el
cual una porción específica de la distribución queda en o debajo de esté valor.

Definición (Percentil)
Es aquel valor tal que lo más un p % de los datos están por debajo de esté valor y, el otro
(100 − p) % de los datos se encuentran por encima de él.

Observación (Cálculo del p-ésimo percentil)


1 Ordene los datos de manera ascendente.
2 Calcule el índice i = np/100, siendo p el percentil de interés y n, la cantidad de
datos.
3 Si el índice i no es entero, redondeamos al entero siguiente El valor en la posición i
indica el p-ésimo percentil.
Si el índice i es entero, el p-ésimo percentil es el promedio de los valores en la posición
i e i + 1.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 58 / 73


Medidas de localización

Ejemplo
Teniendo en cuenta el ejemplo de los sueldos de los estudiantes egresados en Marketing y
Administración (diapositiva 50), determine cual es 85-ésimo percentil de los egresados en
marketing y el 15-ésimo percentil de los egresado en administración.

Ejercicio
Teniendo en cuenta el ejercicio de la muestra de las edades de los trabajadores que
desempeñan su labor desde las casas (diapositiva 51), determine el 25-ésimo percentil y
75-ésimo percentil.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 59 / 73


Medidas de localización

Definición (Cuartiles)
Son las medidas de localización que separan grandes conjuntos de datos en cuatro partes
(iguales) y se definen así.
Q1 primer cuartil o 25-ésimo percentil.
Q2 segundo cuartil o 50-ésimo percentil (mediana).
Q3 tercer cuartil o 75-ésimo percentil.

Definición (Deciles)
Son las medidas de localización que separan grandes conjuntos de datos en diez partes
(iguales) de tal forma que cada parte contiene aproximadamente 10 % de los datos. se
denotan por Dn .

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 60 / 73


Resumen de cinco números y diagrama de box-plot

Definición
El resumen de cinco números se refiere a las cinco medidas descriptivas:
Mínimo (xmı́n ).
Primer cuartil (Q1 ).
Mediana (x̃).
Tercer cuartil (Q3 ).
Máximo (xmáx ).
xmı́n 6 Q1 6 x̃ 6 Q3 6 xmáx

Definición (Diagrama box-plot)


Un diagrama de box-plot (cajas y bigotes) es un gráfico que describe la forma de una
distribución por medio del resumen de cinco números.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 61 / 73


Diagrama de box-plot

Observación (Construcción un diagrama box-plot)


1 Se ubican los valores Q1 y Q3 los cuales representa la caja del gráfico.
2 Se localiza el valor x̃ como una línea vertical en la caja del gráfico.
3 Se calcula el rango intercuartílico RI = Q3 − Q1 .
4 Se traza el bigote de la izquierda que va desde el Q1 hasta el valor mayor más
cercano al límite inferior Q1 − 1.5 ∗ RI.
5 Se traza el bigote de la derecha que va desde el Q3 hasta el valor menor más
cercano al límite superior Q3 + 1.5 ∗ RI.
6 Si hay datos que se encuentran a la izquierda del bigote izquierdo o la derecha del
bigote derecho, se les denominan valores atípicos y se describen mediante un
asterístico.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 62 / 73


Diagrama de box-plot

Ejemplo
Teniendo en cuenta el ejemplo de los sueldos de los estudiantes egresados en Marketing y
Administración (diapositiva 50), construya un diagrama box-plot para cada uno de los
sueldos. ¿Qué se puede observar acerca de los sueldos de los egresados?

Ejercicio
Teniendo en cuenta el ejercicio de la muestra de las edades de los trabajores que
desempeñan su labor desde las casas (diapositiva 51), construya un digrama box-plot y
realice una descripción de los resultados.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 63 / 73


Diagrama de box-plot

Ejercicio
La pizería Gilotti’s tiene cuatro locales en una gran área metropolitana. La tabla a
continuación muestra las ventas diarias (en cientos de dólares) de una muestra aleatoria
de diez días procedente de los cuatro locales. Represente los datos de cada local con un
diagrama de box-plot y compare los resultados. ¿Como son las ventas de estos locales?
Local 1 Local 2 Local 3 Local 4
6 1 2 22
8 19 3 20
10 2 25 10
12 18 20 13
14 11 22 12
9 10 19 10
11 3 25 11
7 17 20 9
13 4 22 10
11 17 26 8

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 64 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 65 / 73


Medidas de variabilidad

Ejercicio
Observemos el siguiente conjunto de datos los cuales describen los salarios anuales de
siete supervisores de ventas de una pera y los de site de otra empresa.
Empresa 1 34.5 30.7 32.9 36 34.1 33.8 32.5
Empresa 2 34.9 27.5 31.6 39.7 35.3 33.8 31.7
Determine la media y mediana del conjunto de datos.

Aunque los conjuntos de datos presenten igual media, es evidente que los datos presentan
diferente dispersión sobre la media. Por ello se prefieren medidas de variabilidad que
permitan cuantificar la variabilidad de los datos.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 66 / 73


Medidas de variabilidad

Ejercicio
Observemos el siguiente conjunto de datos los cuales describen los salarios anuales de
siete supervisores de ventas de una pera y los de site de otra empresa.
Empresa 1 34.5 30.7 32.9 36 34.1 33.8 32.5
Empresa 2 34.9 27.5 31.6 39.7 35.3 33.8 31.7
Determine la media y mediana del conjunto de datos.

Aunque los conjuntos de datos presenten igual media, es evidente que los datos presentan
diferente dispersión sobre la media. Por ello se prefieren medidas de variabilidad que
permitan cuantificar la variabilidad de los datos.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 66 / 73


Medidas de variabilidad

Definición (Rango)
Es la diferencia entre la observación mayor y la menor.

R = xmáx − xmı́n

Definición (Rango Intercuartilico)


Mide la dispersión que hay en el 50 % central de los datos; es la diferencia entre el tercer
cuartil y el primer cuartil.
RI = Q3 − Q1

Definición (Varianza)
Es el promedio de los cuadrados de las desviaciones de los valores con respecto a la media
Varianza Poblacional Varianza Muestral
1
P
N
1
P
n
σ2 = N (Xi − µ)2 s2 = n−1 (xi − x̄)2
i=1 i=1

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 67 / 73


Medidas de variabilidad

Definición (Desviación estándar o típica)


Es la raíz cuadrada de la varianza
Desviación Poblacional
√ Varianza √
Muestral
σ = σ2 s = s2

Observación
1 Aunque la varianza es una medida de dispersión muy utilizada, interpretarla es
complicado, ya que las unidades de la varianza son el cuadrado de las unidades de
medida.
2 La varianza y la desviación estándar tiene una limitación y es que frente a presencia
de datos atípicos, pueden verse afectados los cálculos.
3 Otra forma de expresar la varianza muestral es dada por la siguiente ecuación
!2
P
n
P
n P
n
i=1
xi
x2i − nx̄2 x2i − n
2 i=1 i=1
s = =
n−1 n−1

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 68 / 73


Medidas de variabilidad

Definición (Coeficiente de variación)


Es una medida de la dispersión relativa que expresa la desviación estándar en porcentaje
de la media. Es igual a la desviación estándar sobre el valor absoluto de la media
multiplicado por 100 %.
Coeficiente de variación poblacional Coeficiente de variación muestral
σ s
CV = |µ| x100 % CV = |x̄| x100 %

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 69 / 73


Contenido

1 Introducción

2 Distribución de frecuencia
Datos Cualitativos
Datos Cuantitativos

3 Análisis de datos bivariados


Dos variables cualitativas
Una variable cualitativa y una cuantitativa
Dos variables cuantitativas

4 Estadística descriptiva
Medidas de tendencia central
Medidas de localización
Medidas de variabilidad

5 Referencias

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 70 / 73


Referencias I

David R. Anderson, Dennis J. Sweeney, and Thomas A. Williams.


Estadística para administración y economía.
Cengage, México, 10 edition, 2008.
Jesús Esteban García, José Bachetero Nebot, Olga M. Blasco Blasco, Vicente
Coll Serrano, Rafael Díez García, Antonia Ivars Escortell, María Isabel López García,
Concha Rojo Olivas, and Félix Ruiz Ponce.
Estadística descriptiva y nociones de probabilidad.
Thomson, España, 2006.
Idefonso Grande Esteba and Elena Abascal.
Fundamentos y técnicas de investigación comercial.
ESIC, 11 edition, 2011.
Humberto Llinas and Carlos Rojas.
Estadística descriptiva y distribuciones de probabilidad.
Ediciones Uninorte, Barranquilla, 2006.
Paul Newbold, William L. Carlson, and Betty M. Thore.
Estadística para los negocios y la Economía.
McGraw-Hill, 8 edition, 2013.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 71 / 73


Referencias II

H. Yesid Rodríguez.
Estadística Descriptiva.
Ediciones USTA, 2012.
Mario F. Triola.
Estadística.
Pearson, 10 edition, 2009.

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 72 / 73


Muchas gracias...

Se o mundo não têm nenhum conhecimento


da variação estatística dos dados,
não podia interpretar o mundo em que vivemos.
A. J. Zambrano - Bitácoras en Estadística.
http://experienceinstatistics.blogspot.com

Alex J. Zambrano (POLIGRAN) Estadística Básica 2015 73 / 73

You might also like