You are on page 1of 238

Universidad Peruana de

Ciencias Aplicadas

Estudios Profesionales
para Ejecutivos

ESTADÍSTICA
CE104

Los profesores del curso


Cuaderno de trabajo
2017 02
Presentación
La presente guía resume la teoría necesaria para llevar el curso Estadística (CE104) de Estudios Profe-
sionales para Ejecutivos de la Universidad Peruanas de Ciencias Aplicadas. Se ha realizado con la fina-
lidad de brindar a nuestros alumnos una ayuda en su proceso educativo y una herramienta que cola-
bore en el dictado de las clases.

Esta guía ha sido realizada con el trabajo de la profesora Silvia Gutiérrez y el profesor Walter Luna y
los aportes de los profesores Jimmy Chávez, Elba Vega, Fanny Campomanes, Raúl Aliaga, Violeta Val-
cárcel, Pilar Depaz, Miluska Osorio y los demás profesores del curso.

Los autores agradeceremos que los usuarios de esta guía nos hagan llegar sus críticas y comentarios
a esta publicación.

Los autores.

Lima, agosto del 2017


Contenido

Unidad 1. Organización de datos 9


Estadística 9
Subdivisión de la Estadística .....................................................................................................9
Estadística descriptiva ..............................................................................................................9
Estadística inferencial ...............................................................................................................9
Población ................................................................................................................................10
Muestra ..................................................................................................................................10
Unidad elemental ...................................................................................................................10
Encuesta .................................................................................................................................10
Dato ........................................................................................................................................12
Observación ............................................................................................................................12
Variable ..................................................................................................................................13
Variables cualitativas ..............................................................................................................13
Variables cuantitativas ............................................................................................................13
Escalas de medición ................................................................................................................14
Parámetro ...............................................................................................................................16
Estadístico...............................................................................................................................16
Organización y presentación de datos 20
Distribución de frecuencias ....................................................................................................21
Frecuencias absolutas, relativas y porcentuales .....................................................................21
Distribución de frecuencias para variables cualitativas ..........................................................21
Representación gráfica de variables cualitativas ....................................................................22
Distribución de frecuencias de variables discretas .................................................................26
Representación gráfica de variables cuantitativas discretas ...................................................26
Distribución de frecuencias de variables continuas ................................................................29
Representación gráfica de variables cuantitativas continuas .................................................32
Tablas cruzadas .......................................................................................................................34
Gráficos comparativos ............................................................................................................39
Unidad 2. Medidas de resumen 52
Medidas de tendencia central 53
Media......................................................................................................................................54
Mediana..................................................................................................................................55
Moda ......................................................................................................................................56
Medidas de posición o cuantiles .............................................................................................58
Percentil..................................................................................................................................59
Medidas de dispersión o variabilidad .....................................................................................61
Rango ......................................................................................................................................62
Rango intercuartil ...................................................................................................................62
Varianza ..................................................................................................................................64
Desviación estándar................................................................................................................64
Coeficiente de variación .........................................................................................................66
Medidas de asimetría .............................................................................................................70
Coeficiente de asimetría de Fisher..........................................................................................70
Estadística descriptiva en Excel 81
Tabla de distribución de frecuencias para variables cualitativas ............................................81
Gráfico de barras ....................................................................................................................84
Gráfico circular en Excel .........................................................................................................89
Distribución de frecuencias de variables discretas .................................................................95
Gráfico de bastones en Excel ..................................................................................................99
Distribución de frecuencias para variables por intervalos en Excel ......................................105
Histograma de frecuencias ...................................................................................................110
Tabulación cruzada ...............................................................................................................114
Gráfico de barras comparativas ............................................................................................116
Gráfico de barras apiladas al 100% .......................................................................................117
Medidas de resumen ............................................................................................................118
Unidad 3. Probabilidades 119
Experimento aleatorio ..........................................................................................................120
Espacio muestral ...................................................................................................................120
Evento...................................................................................................................................120
Probabilidad .........................................................................................................................120
Definición clásica de probabilidad ........................................................................................121
Álgebra de eventos ...............................................................................................................122
Complemento de un evento .................................................................................................122
Unión de eventos ..................................................................................................................122
Intersección de eventos ........................................................................................................122
Diferencia de eventos ...........................................................................................................122
Diferencia simétrica de eventos ...........................................................................................122
Axiomas de la probabilidad ..................................................................................................124
Teoremas de probabilidad ....................................................................................................124
Probabilidad condicional ......................................................................................................125
Eventos independientes .......................................................................................................129
Partición de un espacio muestral..........................................................................................132
Diagrama de árbol ................................................................................................................132
Teorema de la probabilidad total .........................................................................................132
Teorema de Bayes ................................................................................................................132
Unidad 4. Variable aleatoria y distribución de probabilidad 143
Variable aleatoria .................................................................................................................143
Variable aleatoria discreta 144
Distribución de probabilidad de una variable aleatoria discreta ..........................................144
Valor esperado de una variable aleatoria discreta ...............................................................146
Varianza de una variable aleatoria discreta ..........................................................................146
Desviación estándar de una variable discreta.......................................................................146
Distribuciones discretas especiales 153
Distribución binomial............................................................................................................153
Distribución de Poisson ........................................................................................................157
Distribuciones continuas especiales 161
Distribución normal ..............................................................................................................161
Distribución exponencial ......................................................................................................168
Unidad 5. Prueba de hipótesis 176
Hipótesis estadística .............................................................................................................176
Hipótesis a establecer ...........................................................................................................176
Tipos de errores ....................................................................................................................178
Pasos a seguir en una prueba de hipótesis 179
Prueba de hipótesis para una media poblacional con varianza desconocida .......................180
Prueba de hipótesis para una proporción poblacional .........................................................186
Prueba de hipótesis para la razón de varianzas poblacionales .............................................190
Prueba de hipótesis para la diferencia de medias con varianzas poblacionales desconocidas y
supuestas iguales ..................................................................................................................193
Prueba de hipótesis para la diferencia de medias con varianzas poblacionales desconocidas y
supuestas desiguales ............................................................................................................196
Prueba de hipótesis para la diferencia de medias en muestras relacionadas .......................199
Prueba de hipótesis para la diferencia de proporciones poblacionales ................................202
Prueba de hipótesis en Excel 206
Unidad 6. Análisis de Regresión 218
Regresión lineal simple 218
Diagrama de dispersión ........................................................................................................218
Supuestos .............................................................................................................................218
Estimación de los parámetros del modelo ............................................................................220
Coeficiente de correlación ....................................................................................................220
Coeficiente de determinación ..............................................................................................221
Validación del modelo. Prueba de hipótesis sobre la pendiente ..........................................223
Reporte de regresión en Excel ..............................................................................................223
Análisis de regresión lineal ...................................................................................................229
Logro del curso
Al finalizar el curso, el estudiante aplica un conjunto de herramientas y técnicas
estadísticas para resolver problemas propuestos en base a situaciones reales
propias del desempeño profesional, que involucren un proceso de análisis de
datos y toma de decisiones.

Unidad 1. Al finalizar la unidad, el estudiante aplica métodos de organización y


Organización presentación utilizando tablas y gráficos a partir de datos reales, en
de datos función del tipo de variable y su escala de medida.

Unidad 2. Al finalizar la unidad, el estudiante interpreta los resultados


Medidas de correspondientes a las medidas de resumen obtenidas de los datos
resumen de una situación real obtenidas con programas informáticos.

Unidad 3. Al finalizar la unidad, el estudiante aplica los conceptos de


Probabilidades probabilidades más convenientes frente a situaciones reales.

Unidad 4. Al finalizar la unidad, el estudiante aplica correctamente la


Variable distribución de probabilidad, identificando el comportamiento de la
aleatoria y variable involucrada para la toma de decisiones de una situación
distribución de real.
probabilidad

Unidad 5. Al finalizar la unidad, el estudiante desarrolla los conceptos y


Prueba de procedimientos de prueba estadística sobre problemas relacionados
hipótesis con información propia de su especialidad y modela
satisfactoriamente casos que conducen a la verificación de
hipótesis.

Unidad 6. Al finalizar la unidad, el estudiante modela regresiones lineales con


Análisis de información propia de su especialidad, estableciendo patrones de
regresión comportamiento actuales y pronostica futuros eventos en el campo
de su especialidad.
EPE UPC 9

Unidad 1. Organización de datos

Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.

Recopilar Organizar Presentar Analizar Tomar


datos datos datos datos decisiones

Subdivisión de la Estadística

Estadística

Descriptiva Inferencial

Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación
de datos, que permiten describirlos apropiadamente. Comprende el
uso de gráficos, tablas e indicadores de resumen obtenidos al realizar
algunos cálculos.

Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más caracte-
rísticas de una población o tomar decisiones referentes a una pobla-
ción, basados en los resultados obtenidos del estudio de muestras ele- Flash
gidas adecuadamente.
electoral
Estas conclusiones no tienen que ser totalmente válidas, pueden tener
cierto margen de error, por eso se dan con una medida de confiabili-
dad o probabilidad.

Notas
10 CE104 Estadística

Población
Es el conjunto de todas las unidades elementales de interés en un determinado estudio.
 Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a
partir de una o más características observables de naturaleza cualitativa o cuantitativa

Muestra
Es una parte o un subconjunto de la población que se selecciona adecuadamente para obtener in-
formación acerca de la población de la cual proviene.
 Una muestra será representativa si es elegida de forma aleatoria

Unidad elemental
Es el objeto sobre el cual se hace la medición. También se le conoce como unidad de análisis, unidad
estadística o elemento
 Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemen-
tal es cada individuo.

•Es el conjunto de todas las unidades


Población elementales de interés en un determinado
estudio.
•Es una parte de la población que se selecciona
Muestra para obtener información acerca de la
población de la cual proviene.

Unidad elemental •Es el objeto sobre el cual se hace la medición.

Encuesta
Actividad que tiene por objetivo la recopilación de información.

•Es una encuesta de todos los elementos de la


Censo población.

Encuesta muestral •Es una encuesta de una parte de la población.

Ejercicio 1
De los universitarios que estudian en la ciudad de Lima, se quiere estimar el porcentaje de universita-
rios que trabajan. Determine:

Población

Muestra

Unidad elemental

Notas
EPE UPC 11

Ejercicio 2
En el presente año se realizarán los Censos Nacionales 2017: XII de Población, VII de Vivienda y III de
Comunidades Indígenas. Las unidades estadísticas de investigación y análisis del censo de población
serán las personas individuales y el hogar que conforman, mientras que para el censo de vivienda
será la vivienda y para el caso de comunidades indígenas será la comunidad.
Tomado de http://www.censos2017.pe

Notas
12 CE104 Estadística

Ejercicio 3
Se desea estimar la media del ingreso mensual de los taxistas de Lima. Determine:

Población

Muestra

Unidad elemental

Ejercicio 4
Se desea estimar el promedio diario de clientes que ingresan a un supermercado, para lo cual se eli-
gieron cinco días al azar del presente mes y se registró el número de clientes que ingresó cada día al
supermercado. Determine:

Población

Muestra

Unidad elemental

Dato
Es el resultado de medir una característica de una unidad elemental.

Observación
Es el conjunto de datos de una unidad elemental. La observación se obtiene para cada unidad ele-
mental.
Por ejemplo, para una vivienda se pueden registrar los siguientes datos, que conforman una obser-
vación.

Ejercicio 5
Se hace una encuesta a los alumnos de EPE, entre ellos a usted. Responda a las siguientes preguntas:
¿Cuál es su nombre? ……………………………………………………………………………………………………………………………
¿Cuál es su sexo? …………………………………………………………………………………………………………………………………
¿En qué distrito vive? …………………………………………………………………………………………………………….……………
¿Cuántos hermanos tiene? ……………………………………………………………………………………………………….…………

Indique:

Unidad elemental

Un dato

Una observación

Notas
EPE UPC 13

Variable
Se define así a una característica que presentan los elementos de una población y que puede asumir
diferentes valores cuando se realiza su medición.

Variables cualitativas
Son aquellas variables que al ser medidas quedan expresadas por etiquetas o nombres que se utilizan
para identificar una característica o atributo.

Variables cuantitativas
Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para identifi-
car una característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.
 Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito
numerable, es decir, que sólo puede tomar ciertos valores en un intervalo determinado.
 Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es
decir, que puede tomar cualquier valor en un intervalo determinado.

Cualitativa

Tipos de variables Cuantitativa discreta

Cuantitativa

Cuantitativa continua

Ejercicio 6
Las siguientes variables son de una encuesta aplicada a un postulante de una agencia publicitaria:
Variables cualitativas
 Lugar de nacimiento
 Grado de instrucción
Variables cuantitativas discretas
 Número de capacitaciones que llevó el año anterior
 Número de trabajos que ha tenido en los últimos dos años
Variables cuantitativas continuas
 Tiempo que demora para trasladarse de su casa al trabajo (en minutos)
 Salario actual (en soles)

Ejercicio 7
Los clientes que se suscriben a la revista Economía A llenan un formato con información personal.
Identifique el tipo de cada variable.
Variable Tipo de variable
Sexo
Profesión
Ingreso mensual familiar (en soles)
Grado de instrucción
Número de hijos

Notas
14 CE104 Estadística

Escalas de medición
Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición; nomi-
nal, ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel de
medición de las variables es un factor importante para determinar el procedimiento a usar.

Nominal Ordinal Intervalo Razón

Escala nominal
Los diferentes valores que toma una variable medida en escala nominal carecen de un orden o de un
significado numérico, no pueden utilizarse para realizar cálculos. A menudo se asignan números a las
diferentes categorías, pero no tienen significado computacional y cualquier promedio que se calcule
carece de sentido.

Escala ordinal
La escala de medición ordinal permite establecer un orden entre los diferentes valores que toma la
variable. En esta escala de medición no es posible determinar las diferencias entre los valores de la
variable o tales diferencias carecen de sentido.

Escala de intervalo
Los datos son numéricos. La escala de medición de intervalo tiene las propiedades de la escala ordi-
nal, pero con la característica adicional que la diferencia entre dos valores cualesquiera de la variable
tiene un significado. Sin embargo, los valores en esta escala no tienen un punto de partida natural o
cero.

Escala de razón
La escala de medición de razón tiene las propiedades de la escala de intervalo con la propiedad adi-
cional de tener un punto de partida natural o cero, que indica que nada de la variable se encuentra
presente. Para esta escala de medición además de las diferencias, las proporciones también tienen
significado.

•Sexo •El orden de mérito de •Temperatura en °C. •Sueldo de los


•Marca de celular los alumnos de la UPC •Ubicación en una trabajadores
•Nacionalidad •Grado de instrucción carretera respecto de •Peso de una persona
•Religión •Opinión (bueno, un punto de referencia •Velocidad de un auto
•Número de DNI regular, malo) •Año de nacimiento en la carretera

Nominal Ordinal Intervalo Razón

Notas
EPE UPC 15

Ejercicio 8
Complete la siguiente tabla:

Variable Escala de medición

Número de celular

Puntaje de una pregunta en un examen

Puesto en el ranking FIFA de la selección peruana de fútbol

Tiempo en responder esta pregunta, en minutos

Edad de una persona

Peso de una papa, en gramos

Grado en el ejército (general, coronel, comandante, etc.)

Ejercicio 9
En base a la siguiente lista de variables:
 Tamaño de bebida (pequeño, mediano, grande)
 Marca de celular
 Número de personas a favor de la pena de muerte
 Ventas anuales, en dólares
 Año de fabricación de auto
 Kilometraje de auto
 Marca de automóvil

Complete la siguiente tabla:

Variable Tipo de variable Escala de medición

Intervalo

Ordinal

Cuantitativa continua

Nominal

Cuantitativa discreta

Cualitativa

Notas
16 CE104 Estadística

Parámetro
Un parámetro es un valor que representa alguna característica de la población.

Estadístico
Un estadístico o estimador es un valor que representa alguna característica de la muestra.

Algunos parámetros y estadísticos que se pueden calcular son:

Ejercicio 10
En este ejemplo, el parámetro es <porcentaje poblacional de votantes que lo hicieron por PPK> y su
valor es 50,120%. Es parámetro pues este porcentaje fue calculado contando todos los votos válidos.

Distribución de votantes según organización política en la segunda vuelta electoral 2016


Organización política Total Porcentaje de votos válidos

8 596 937 50,120%


Peruanos por el Kambio

8 555 880 49,880%


Fuerza Popular
Fuente: ONPE. Resultado definitivo al 100% de actas

En este ejemplo, el estadístico es <porcentaje muestral de votantes que lo hicieron por PPK> y su
valor es 46,9%. Es estadístico pues este porcentaje fue calculado de una muestra obtenida antes de
la votación.

Tomado de la página web del diario El Comercio

Notas
EPE UPC 17

Ejercicio 11
Según los Censos Nacionales XI de Población y VI de Vivienda 2007 ejecutados por el INEI, el 50,30%
de los peruanos son mujeres, ¿este dato es un parámetro o un estimador?
Solución

Ejercicio 12
Según la Encuesta Demográfica y de Salud Familiar (Endes 2016), publicada en junio del 2017, el
68,2% de las mujeres en el Perú han sido víctimas de violencia psicológica, física o sexual alguna vez
por parte de sus respectivas parejas, ¿este dato es un parámetro o un estimador?
Solución

Ejercicio 13

El banco A estudió la información que dieron sus clientes en el presente mes al solicitar un préstamo
vehicular.
Al seleccionar una muestra de 180 clientes algunos resultados fueron:
• El 12% declaró tener un trabajo independiente.
• La media de la edad de los clientes al solicitar un préstamo fue de 41,3 años.
• El 50% declaró ser casado.
• La media del monto de las solicitudes fue de 3025 soles.
Identifique el estimador y el valor del estimador para cada una de las variables.
Solución

Variable Estimador Valor Notación

Notas
18 CE104 Estadística

Ejercicio 14
El hotel La Posada es nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en
publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Desea conocer qué
características del hotel es conveniente resaltar en la publicidad, para ello aplicó una encuesta a una
muestra aleatoria de 56 mujeres y 64 hombres extranjeros que se hospedaron entre enero y mayo
del presente año. A continuación, se presenta parte de la base de datos:

Precio dispuesto Número de


País de
N° Edad Género a pagar por habi- acompañantes Criterio de selección del hotel
procedencia
tación en dólares por viaje
1 25 Masculino Inglaterra 80 0 Limpieza del dormitorio
2 35 Femenino Argentina 60 2 Precio
3 45 Masculino Francia 115 3 Buena calidad de las toallas y sábanas
4 65 Masculino Francia 45 0 Precio
5 72 Femenino Francia 55 1 Amigable y cordial staff de empleados
6 28 Masculino Estados Unidos 65 2 Precio
7 45 Femenino Estados Unidos 60 1 Precio
      

Después de procesar la información se obtuvieron los siguientes resultados:


 El 34% de los huéspedes extranjeros procede de los Estados Unidos.
 La edad promedio de los huéspedes es de 35,2 años.
 El número de acompañantes por huésped extranjero más frecuente es de dos personas.
 El criterio de selección más frecuente es el precio.
Responda a las siguientes preguntas.
a. Determine la población, la muestra y la unidad elemental.
b. ¿Cuántas observaciones hay?
c. ¿Cuántos datos conforman una observación?
d. ¿Cuántos datos hay en total?
e. Proporcione un ejemplo de dato y uno de observación.
f. Indique la escala y el tipo de cada variable.
g. Identifique el estimador y el valor del estimador para cada variable de la base de datos.
Solución
a. Determine la población, la muestra y la unidad elemental.

Todos los huéspedes extranjeros que se hospedaron en el hotel La Posada


Población
entre enero y mayo del presente año.
(Algunos) 120 huéspedes extranjeros que se hospedaron en el hotel La Posa-
Muestra
da entre enero y mayo del presente año.
Un huésped extranjero que se hospedó en el hotel La Posada entre enero y
Unidad elemental
mayo del presente año.

b. ¿Cuántas observaciones hay? Hay 130 observaciones


c. ¿Cuántos datos conforman una observación? Seis datos, pues hay seis variables.
d. ¿Cuántos datos hay en total? Hay 780 datos (6 x 130)
e. Proporcione un ejemplo de dato y uno de observación.

Dato X4 = 65 años
Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio

Notas
EPE UPC 19

f. Indique la escala y el tipo de cada variable.

Variable Tipo de variable Escala de medición

Edad Cuantitativa continua Razón

Género Cualitativa Nominal

País de procedencia Cualitativa Nominal

Precio dispuesto a pagar por habitación Cuantitativa continua Razón

Número de acompañantes por viaje Cuantitativa discreta Razón

Criterio de selección del hotel Cualitativa Nominal

g. Identifique el estimador y el valor del estimador para cada una de las variables de la base de da-
tos.

Variable Estimador Valor del estimador


Proporción de huéspedes
Lugar de procedencia 0,34
que procede de EEUU
Edad de los huéspedes Promedio 35,2 años
Número de acompañantes Moda 2
Criterio de selección del hotel Moda Precio

Notas
20 CE104 Estadística

Organización y presentación de datos


Luego de aplicar una encuesta a una muestra de 30 empleados, una empresa obtiene la siguiente
base de datos. Se pide redactar un informe que resuma la información.

Base de datos sobre satisfacción laboral


Tiempo en
Ingreso Número de Promoción Número de Relación con
Género Función Edad la empre-
anual promociones posible capacitaciones la gerencia
sa
Femenino Obrero 19 1 11 400 0 Improbable 1 Buenas
Masculino Profesional 31 5 210 600 2 No está seguro 2 Buenas
Masculino Profesional 34 8 193 400 1 Probable 2 Buenas
Masculino Servicios 36 15 30 800 1 Improbable 0 Buenas
Masculino Obrero 44 4 9 850 0 Improbable 1 Regulares
Masculino Obrero 44 10 9 800 0 Improbable 1 Regulares
Masculino Técnico/ventas 31 5 40 840 0 Improbable 3 Buenas
Femenino Profesional 37 8 93 700 1 No está seguro 2 Buenas
Masculino Obrero 45 23 10 150 0 Improbable 1 Regulares
Masculino Obrero 54 18 9 050 0 Muy improbable 1 Regulares
Femenino Profesional 26 2 62 200 2 No está seguro 2 Buenas
Masculino Obrero 44 14 10 200 0 Probable 0 Regulares
Masculino Técnico/ventas 31 2 40 335 0 Muy improbable 2 Buenas
Femenino Producción 28 10 30 990 1 Muy improbable 1 Buenas
Femenino Obrero 23 5 9 360 1 Muy improbable 1 Buenas
Femenino Producción 38 20 33 800 0 Muy improbable 1 Buenas
Masculino Producción 38 9 35 500 1 Muy improbable 2 Buenas
Masculino Técnico/ventas 32 2 40 540 0 Improbable 2 Buenas
Masculino Servicios 36 18 27 500 1 Muy improbable 1 Buenas
Femenino Obrero 48 25 10 200 0 Muy improbable 1 Buenas
Masculino Obrero 45 20 9 650 0 Improbable 1 Regulares
Femenino Técnico/ventas 22 2 44 000 0 No está seguro 2 Buenas
Masculino Técnico/ventas 32 6 48 560 1 Improbable 2 Buenas
Masculino Obrero 46 20 10 300 0 Muy improbable 1 Regulares
Masculino Profesional 28 1 108 700 3 Improbable 5 Buenas
Femenino Producción 27 5 30 550 1 Muy improbable 2 Buenas
Masculino Producción 38 14 32 300 0 Muy improbable 1 Buenas
Masculino Obrero 40 20 9 130 0 No está seguro 0 Regulares
Masculino Profesional 24 1 70 000 1 Probable 3 Buenas
Masculino Obrero 56 30 9 740 0 Muy improbable 1 Regulares

Una vez recopilada la información, con las variables


¿Qué podemos
consideradas de mayor importancia, el siguiente paso
hacer para
es presentarla a través de una tabla de frecuencias o
resumir esta
un gráfico que describa adecuadamente las
información?
características más importantes.

Notas
EPE UPC 21

Distribución de frecuencias

Es el resumen de un conjunto
Esta tabla muestra las
de datos, presentado en una
frecuencias absolutas, las Las categorías o clases no se
tabla llamada la tabla de
frecuencias relativas y los traslapan.
distribución de frecuencias
porcentajes
(TDF)

Frecuencias absolutas, relativas y porcentuales


 La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que pertenecen a esa clase.
 La frecuencia relativa (hi ) de una clase es la proporción de elementos que pertenecen a esa cla-
se.
frecuencia absoluta fi
Frecuencia relativa hi   
número de datos n
 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por 100%.
Frecuencia porcentual pi   hi  100%

Distribución de frecuencias para variables cualitativas


Se deberá presentar en la tabla las diferentes categorías que asume la variable cualitativa y en la
columna de las frecuencias absolutas la cantidad de veces que se repite esta categoría de la variable.

 Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias absolutas y
relativas.
 Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas y relativas.

La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi Frecuencia porcentual pi
f
Categoría 1 f1 h1  1 p1  h1  100
n
f
Categoría 2 f2 h2  2 p2  h2  100
n
… … … …
fk
Categoría k fk hk  pi  hi  100
n
Fuente: ……………………………………..

Título de una tabla de distribución de frecuencias


De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:
Distribución de <unidades elementales> según <variable>

Notas
22 CE104 Estadística

Ejercicio 15
Perú: Distribución de víctimas de feminicidio, según región de ocurrencia. 2014
Región fi pi
Lima 29 31,87%
Arequipa 10 10,99%
Puno 7 7,69%
Cusco 6 6,59%
Junín 6 6,59%
La Libertad 5 5,49%
Ayacucho 4 4,40%
Huánuco 4 4,40%
Lambayeque 4 4,40%
Otros 16 17,60%
Fuente: Ministerio Público Perú - Observatorio de Criminalidad.2014

Un feminicidio es el asesinato de una mujer por razón de su sexo.

Interprete p1.

Interprete f3.

¿Se podría afirmar que los hombres son más violentos en Lima que en Arequipa?

Representación gráfica de variables cualitativas

Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de
ordenadas las frecuencias absolutas, relativas o porcentuales.

Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo
que es proporcional a la frecuencia que representan. También se denomina
diagrama de sector circular, gráfico tipo torta o pastel.

Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de


barras.

Notas
EPE UPC 23

Ejercicio 16
La universidad A realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad
de conocer sus preferencias profesionales.

Los datos obtenidos se presentan a continuación:

Derecho Periodismo Ingeniería Administración


Ingeniería Deporte Gastronomía Ingeniería
Periodismo Ingeniería Periodismo Gastronomía
Administración Gastronomía Deporte Administración
Derecho Gastronomía Ingeniería Derecho
Ingeniería Ingeniería Gastronomía Gastronomía
Administración Deporte Ingeniería Periodismo
Derecho Administración

a. Obtenga la tabla de distribución de frecuencias.


b. Interprete la frecuencia absoluta de la segunda categoría.
c. Interprete la frecuencia porcentual de la tercera categoría.
d. Presente el gráfico de barras de frecuencias porcentuales.
e. Presente el gráfico circular de frecuencias porcentuales.

Solución
a. Obtenga la tabla de distribución de frecuencias.

Distribución de estudiantes según su preferencia profesional


Preferencia profesional fi hi pi
Administración 5 0,1667 16,67%
Gastronomía 6 0,2000 20,00%
Derecho 4 0,1333 13,33%
Deporte 3 0,1000 10,00%
Ingeniería 8 0,2667 26,67%
Periodismo 4 0,1333 13,33%
Total 30 1,0000 100,00%
Fuente: Universidad A

b. Interprete la frecuencia absoluta de la segunda categoría.

f2 = 6. De un total de treinta jóvenes, seis de ellos prefieren la carrera de chef.

c. Interprete la frecuencia porcentual de la tercera categoría.

p3 = 13,33%. El 13,3% de los jóvenes prefieren el Derecho como carrera profesional.

Notas
24 CE104 Estadística

d. Presente el gráfico de barras de frecuencias porcentuales.

Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y
solo el 10% prefiere la carrera de Deporte.

e. Presente el gráfico circular de frecuencias porcentuales.

Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y
solo el 10% prefiere la carrera de Deporte.

Notas
EPE UPC 25

Ejercicio 17
Se aplicó una encuesta a una muestra de 30 empleados de la empresa Motores A. Se preguntó por la
función que desempeñaba. Los datos se presentan a continuación:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
a. Presente la tabla de distribución de frecuencias.
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
c. Realice e interprete el gráfico de barras de frecuencias absolutas.
Solución
a. Presente la tabla de distribución de frecuencias.
Título: ……………………………………………………………………………………………………………………………………….
Función fi hi pi
Obrero
Producción
Profesional
Servicios
Técnico
Total

Fuente: ……………………………………………………………………………

b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.


f1 = de un total de ……….………………... trabajadores, ………………..……. son ……………………..……………
p1 = el ………………….….……% de los trabajadores son ………………………………..………………………….……

d. Realice e interprete el gráfico de barras de frecuencias absolutas.

14
12
10
8
6
4
2
0
Obrero Producción Profesional Servicios Técnico/ventas
Función
Fuente: ..........................................................
Interpretación

Notas
26 CE104 Estadística

Distribución de frecuencias de variables discretas

Es un resumen de un conjunto de datos que Es un cuadro que presenta además de las


consiste en presentar para cada valor de la frecuencias absolutas y relativas las
variable el número de elementos (frecuencia) que frecuencias acumuladas absolutas y
la componen. acumuladas relativas.

Distribución de <unidades elementales> según <variable>


Valores de la variable Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa
discreta absoluta fi relativa hi acumulada Fi acumulada Hi
f
x1 f1 h1  1 F1  f1 H1  h1
n
f
x2 f2 h2  2 F2  f2  F1 H2  h2  H1
n
… … … … …
fk
xk fk hk  Fk  fk  Fk 1 Hk  hk  Hk 1
n
Fuente:……………………………………………………………………………………..

Representación gráfica de variables cuantitativas discretas

Gráfico de bastones o de varas


Por lo general, el gráfico de bastones es utilizado cuando la variable es discreta.
Su uso es adecuado cuando existen muchas observaciones, pero pocos valores de la variable.

Ejercicio 18

Distribución de alumnos de pregrado según número de veces que


postuló a la universidad donde estudia
700,000
576,215
600,000
Número de alumnos

500,000
400,000
300,000
200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Número de veces que postuló
Fuente: PERÚ, II Censo Nacional Universitario 2010. INEI

Calcule e interprete f2 y h1

Notas
EPE UPC 27

Ejercicio 19
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-
versidad A a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto
su película preferida? las respuestas fueron las siguientes:
1 2 3 4 3 3 2 3 6 3 3 4 6 3 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 6 2
Solución
a. Presente la tabla de distribución de frecuencias.
Título: …………………………………………………………………..……………………………………………………………………………
fi hi Fi Hi

Fuente: …………………………………………………………………………………

b. Interprete los siguientes valores.

f3 = …………...
F2 = ………..…
h1 = …………..
H4 = …………..

c. Presente el gráfico de bastones.

d. Interprete el gráfico de bastones.

Notas
28 CE104 Estadística

Ejercicio 20
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de la
empresa Creativa en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1 1 2 2 1 1 1 2 2 1 5 2 1 0 3 1
a. Presente la tabla de distribución de frecuencias.
b. Interprete f2, F2 , h3 y H2%
c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.
Solución
a. Presente la tabla de distribución de frecuencias.

Distribución de colaboradores según número de capacitaciones recibidas


Número de capacitaciones fi hi Fi Hi
0 3 0,100 3 0,1000
1 14 0,467 17 0,5667
2 10 0,333 27 0,9000
3 2 0,067 29 0,9667
5 1 0,033 30 1,0000
Total 30 1,000
Fuente: Empresa Creativa

b. Interprete f2 , F2 , h3 y H2%

f2 = 14 De 30 empleados, 14 han recibido solo una capacitación al año


F2 = 17 De 30 empleados, 17 han recibido de una a menos capacitaciones al año
h2 = 0,467 La proporción de trabajadores que han recibido solo una capacitación al año es 0,467
H2%= 56,7% El 56,7% de los trabajadores han recibido de una a menos capacitaciones al año

c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.

Interpretación
De un total de treinta empleados, catorce de ellos han recibido una capacitación y solo un colabora-
dor ha recibido cinco capacitaciones en lo que va del año

Notas
EPE UPC 29

Distribución de frecuencias de variables continuas


Los tres pasos para elaborar una tabla de
distribución de frecuencias para variables
Es un resumen de un conjunto de datos que cuantitativas continuas son:
consiste en presentar para cada categoría el
•Determinar la cantidad de clases
número de elementos (frecuencia) que la
componen. •Determinar el ancho de cada clase
•Determinar los límites de cada clase

Cantidad de clases o intervalos


 Se recomienda usar entre 5 y 20 clases, inclusive.
 La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas, por-
que puede ocurrir que varias contengan ningún o pocos elementos.
 Para determinar el número de clases se puede usar la regla de Sturges:
Regla de Sturges: k = 1 + 3,322 x log n
Si la estimación tiene decimales, se toma el entero más próximo (redondeo simple).

Amplitud o ancho de cada clase


 Usualmente se usa el mismo ancho para todas las clases.
 Se calcula de la siguiente manera:
rango r
Amplitud  w  
k k
 La amplitud del intervalo debe tener la misma cantidad de cifras decimales que tienen los datos
originales.
 El redondeo empleado es el redondeo a más (o por exceso).

Por ejemplo:
𝒓 w
Si los datos tienen 𝒘=
𝒌 (redondeo a más)
Cero decimales w = 50,2381 w = 51
Una cifra decimal w = 50,2381 w = 50,3
Dos cifras decimales w = 50,2381 w = 50,24
Tres cifras decimales w = 50,2381 w = 50,239
Marcas de clase
 Son los puntos medios de los límites de cada intervalo.
'
 Su notación es X i
 Se calcula de la siguiente manera:
Límiteinf erior  Límitesuperior LI  LS
Xi'  
2 2
Límites de cada clase
 Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y
sólo a una.
 El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase y el lími-
te superior de clase es el valor máximo posible de los datos que se asigna a la clase.

Notas
30 CE104 Estadística

Ejercicio 21

A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa A.


Usando la regla de Sturges construya la tabla de distribución de frecuencias.

10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65
Solución
Cálculo de los límites de los intervalos

Máximo =MAX(datos)
Mínimo =MIN(datos)
Rango =MAX(datos) – MIN(datos)
Cantidad de datos (n) =CONTAR(datos)
k (por regla de Sturges) =1+3,322*LOG10(n)
k (entero)
w (amplitud) =Rango/k (entero)
Número de decimales de los datos
w (redondeada por exceso)
Distribución de trabajadores según el tiempo de servicio
Tiempo de servicio Marca de clase fi hi Fi Hi
  
  
  
  
  
  
  

Fuente: Empresa A

Interprete.

f4 = …………..

F2 = ………….

h1 = …………..

H4 = ………….

Notas
EPE UPC 31

Ejercicio 22
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas
al azar en el 2015 son:
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el presente
año.

Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145,1 = 206

Siguiendo la regla de Sturges, el número de intervalos es:


k  1  3,322log10 n  1  3,322log10(48)  6,585  7 (Use redondeo simple)

La amplitud se calcula por:


r 206
w   29,429  29,5
k 7

Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un decimal.

A continuación, la tabla de distribución de frecuencias.

Distribución de viviendas según pago de impuesto municipal (en soles)


Pago de impuestos Marca de clase fi hi Fi Hi
[145,1 ; 174,6] 159,85 3 0,0625 3 0,0625
]174,6 ; 204,1] 189,35 3 0,0625 6 0,1250
]204,1 ; 233,6] 218,85 10 0,2084 16 0,3334
]233,6 ; 263,1] 248,35 12 0,2500 28 0,5834
]263,1 ; 292,6] 277,85 7 0,1458 35 0,7292
]292,6 ; 322,1] 307,35 7 0,1458 42 0,8750
]322,1 ; 351,6] 336,85 6 0,1250 48 1,0000
Total 48
Fuente: Oficina de Rentas de la Municipalidad

Interprete:
f2 = 3 En tres viviendas pagaron más de 174,60 soles y hasta de 204,10 soles

F2 = 6 En seis viviendas pagaron hasta 204,10 soles

h3 %= 20,84% El 20,84% de las viviendas pagaron más de 204,10 soles y hasta 233,6 soles

H3 %= 33,34% El 33,34% de las viviendas pagaron hasta 233,60 soles

Notas
32 CE104 Estadística

Representación gráfica de variables cuantitativas continuas


Histograma
Este gráfico se realiza a partir de una tabla de frecuencias absolutas, relativas o porcentuales.
 Se traza colocando la variable sobre el eje horizontal y las frecuencias
sobre el eje vertical.
 Cada frecuencia de clase se representa trazando un rectángulo, cuya base
es el intervalo de clase sobre el eje horizontal y cuya altura es proporcio-
nal a la frecuencia correspondiente.
 Los rectángulos adyacentes se tocan entre sí.

Ejercicio 23
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa A.
Título: …………….………………………………………………………………………………………………………………………………
Marca de clase fi hi Fi Hi
[10 , 20 6
20 , 30 15
30 , 40 45
40 , 50 63
50 , 60 80
Total
Fuente: Empresa A

Grafique el histograma de frecuencias relativas.


Solución

Título: ..................................................................................................

40%
Porcentaje de .........................

35%
30%
25%
20%
15%
10%
5%
0%
-5 5 15 25 35 45 55 65
..................................................

Fuente: …………………………………………………………………….
Interpretación

Notas
EPE UPC 33

Ejercicio 24
La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el
poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de ad-
ministración que eligiera, del mes de enero, una muestra de clientes de Lima y registró el monto que
costaron sus llamadas, en soles.

El encargado mostró los resultados en una tabla de distribución de frecuencias:

Distribución de clientes según monto de las llamadas (en soles)


Monto de llamadas Marca de clase fi hi Fi Hi
0  10  5 12 0,1000 12 0,1000
10 20  15 22 0,1833 34 0,2833
20 30  25 45 0,3750 79 0,6583
30 40  35 23 0,1917 102 0,8500
40 50  45 12 0,1000 114 0,9500
50 60  55 6 0,0500 120 1,0000
120 1
Fuente: Área de Administración

Grafique el histograma de frecuencias porcentuales.

Solución

Interpretación
A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores
a 20 y como máximo de 30 soles y que solo el 5% de estos clientes tienen montos superiores a 50 y
como máximo de 60 soles.

Notas
34 CE104 Estadística

Tablas cruzadas

Cuando hay dos variables, se suele estar


Se usan para resumir También son
interesado en observar si existe algún tipo de
de manera llamadas tablas de
dependencia entra las variables, de forma que
simultánea los datos contingencia o de
una de ellas pudiera explicar el
para dos variables. doble entrada.
comportamiento de la otra.

Título de un gráfico de una tabla cruzada


Si el gráfico presenta las frecuencias absolutas o las frecuencias porcentuales con respecto al total, el
título será:
Distribución de <elementos> según <variable 1> y <variable 2>

Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:
Distribución de <elementos> según <variable 1> por <variable 2>

Ejercicio 25
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos la religión que profesa, obteniéndose los siguientes resultados:

Título: …………………………………………………………………………………………………………………………………………..
Religión que profesa
Sexo
Católica Cristiana - Evangélica Otra Ninguna Total
Hombre 8 379 120 1 200 953 324 445 374 024 10 278 542
Mujer 8 577 602 1 405 102 354 846 234 410 10 571 960
Total 16 956 722 2 606 055 679 291 608 434 20 850 502
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda

Complete los espacios en blanco.

Solución
a. El número de cristianos evangélicos en el Perú es …………………..……
b. Del total de peruanos, ………………………………………. son católicos.
c. De …………………………………….. de católicos, ………………………..……………….. son mujeres.
d. El ………….…….% de los hombres peruanos profesa la religión católica.
e. El ………………..% de las mujeres peruanas profesa una religión diferente a la católica.
f. El ………………..% de los hombres peruanos no profesa religión alguna.

Notas
EPE UPC 35

Ejercicio 26
La tabla que se presenta a continuación fue publicada el mes pasado por el diario A. La encuesta se
aplicó a una muestra de 805 hogares según nivel socioeconómico (NSE) y área de residencia. Los
resultados se presentan a continuación:

Tabla 1. Distribución de hogares según área de residencia y nivel socioeconómico


Área de residencia
Total
Nivel socioeconómico Área urbana Área rural
Nivel socioeconómico A 15 2 17
Nivel socioeconómico B 48 3 51
Nivel socioeconómico C 105
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 300 805
Fuente: Diario A

a. Obtenga la tabla cruzada de porcentajes con respecto al total general.


b. Obtenga la tabla cruzada de porcentajes con respecto al total de fila.
c. Obtenga la tabla cruzada de porcentajes con respecto al total de columna.
d. Interprete el valor de la celda sombreada en cada una de las tablas.
e. Tomando como referencia alguna de las tablas anteriores, complete los espacios en blanco.
Solución
a. Obtenga la tabla cruzada de porcentajes con respecto al total general.

Tabla 2. Distribución de hogares …….……………. área de residencia ……..………. nivel socioeconómico


Área de residencia
Total
Nivel socioeconómico Área urbana Área rural
Nivel socioeconómico A 1,86% 0,25% 2,11%
Nivel socioeconómico B 5,96% 0,37% 6,34%
Nivel socioeconómico C 13,04%
Nivel socioeconómico D 11,68% 21,74% 33,42%
Nivel socioeconómico E 4,72% 22,36% 27,08%
Total 37,27% 100,00%
Fuente: Diario A

b. Obtenga la tabla cruzada de porcentajes con respecto al total de fila.

Tabla 3. Distribución de hogares …….……………. área de residencia ……..………. nivel socioeconómico


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 88,24% 11,76% 100,00%
Nivel socioeconómico B 94,12% 5,88% 100,00%
Nivel socioeconómico C 42,00%
Nivel socioeconómico D 34,94% 65,06% 100,00%
Nivel socioeconómico E 17,43% 82,57% 100,00%
Total 37,27% 100,00%
Fuente: Diario A

Notas
36 CE104 Estadística

c. Obtenga la tabla cruzada de porcentajes con respecto al total de columna.

Tabla 4. Distribución de hogares …….……………. área de residencia ……..………. nivel socioeconómico


Área de residencia
Nivel socioeconómico Total
Área urbana Área rural
Nivel socioeconómico A 5,00% 0,40% 2,11%
Nivel socioeconómico B 16,00% 0,59% 6,34%
Nivel socioeconómico C 35,00%
Nivel socioeconómico D 31,33% 34,65% 33,42%
Nivel socioeconómico E 12,67% 35,64% 27,08%
Total 100,00% 100,00%
Fuente: Diario A

d. Interprete el valor de la celda sombreada en cada una de las tablas:

Tabla Valor Interpretación

e. Tomando como referencia alguna de las tablas anteriores, complete los espacios en blanco:

 El número de hogares que pertenecen al nivel socioeconómico C o D es de …………………………


 ………………..…………………. hogares pertenecen al nivel socioeconómico C y son del área urbana.
 Del total de hogares del área rural, el ……………………….……….% son del nivel socioeconómico E.
 Del total de hogares del nivel socioeconómico D, el …………….……………..% son del área urbana.

Notas
EPE UPC 37

Ejercicio 27
La siguiente tabla muestra el lugar de residencia y el giro de negocio que posee una muestra de clien-
tes del banco A que solicitaron préstamo durante el primer trimestre año.

Distribución de clientes según lugar de residencia y giro del negocio


Lugar de residencia
Giro del negocio Total
Lima Callao
Bodega 18 14 32
Frutería 15 8 23
Ferretería 7 6 13
Boutique 35 22 57
Otros 13 15 28
Total 88 65 153
Fuente: Banco A. Primer trimestre

Complete adecuadamente los espacios en blanco:


a. El número de clientes que tienen bodega es ………….
b. El número de clientes que tienen bodega y son de El Callao
c. El ………...….. % de los clientes del banco A en la muestra tienen ferretería.
d. El …………….. % de los clientes de banco A o en la muestra que tienen bodega, son del Callao.
e. El ……..……… % de los clientes de banco A en la muestra tienen boutique y son de Lima.
Solución
a. El número de clientes que tienen bodega es 32
b. El número de clientes que tienen bodega y son de El Callao es 14
c. El 8,5% de los clientes del banco A en la muestra tienen ferretería. Dividimos 13/153 = 0,08497.
d. El 43,75% de los clientes de banco A o en la muestra que tienen bodega, son del Callao. Dividi-
mos 14/32 = 0,4375.
e. El 22,9% de los clientes de banco A en la muestra tienen boutique y son de Lima. Dividimos
35/153 = 0,2288.
Ejercicio 28
El área de Recursos Humanos de una empresa de servicios desea analizar la relación de los trabaja-
dores con la gerencia. Después de aplicar una encuesta se obtuvieron los siguientes resultados:
Distribución de trabajadores según su función y relación con la gerencia
Relación con la gerencia
Función
Buena Regular Mala Total
Apoyo/adm. 18 2 0 20
Obrero 10 29 20 59
Profesional 11 6 0 17
Técnico/ventas 19 7 0 26
Total 58 44 20 122
Fuente: Área de Recursos Humanos.

Interprete los valores seleccionados.


Solución
 29 son obreros y manifestaron tener una buena relación con la gerencia.
 59 son obreros
 58 tienen manifiestan tener buenas relaciones con la gerencia

Notas
38 CE104 Estadística

Distribución de trabajadores según su función y relación con la gerencia

Relación con la gerencia


Función
Buena Regular Mala Total
Apoyo/administrativo 14,8% 1,6% 0,0% 16,4%
Obrero 8,2% 23,8% 16,4% 48,4%
Profesional 9,0% 4,9% 0,0% 13,9%
Técnico/ventas 15,6% 5,7% 0,0% 21,3%
Total 47,5% 36,1% 16,4% 100,0%
Fuente: Área de Recursos Humanos

Interpretación
Del total de trabajadores,
- el 48,4% son obreros
- el 47,5% manifestaron tener una buena relación con la gerencia.
- el 23,8% son obreros y manifestaron tener una regular relación con la gerencia.

Distribución de trabajadores según relación con la gerencia por función

Relación con la gerencia


Total
Función Buena Regular Mala
Apoyo/administrativo 90,0% 10,0% 0,0% 100,0%
Obrero 16,9% 49,2% 33,9% 100,0%
Profesional 64,7% 35,3% 0,0% 100,0%
Técnico/ventas 73,1% 26,9% 0,0% 100,0%
Total 47,5% 36,1% 16,4% 100,0%
Fuente: Área de Recursos Humanos

Interpretación
Del total de obreros, el 49,2% tiene una regular relación con la gerencia.

Distribución de trabajadores según función por tipo de relación con la gerencia

Relación con la gerencia


Función Total
Buena Regular Mala
Apoyo/administrativo 31,0% 4,6% 0,0% 16,4%
Obrero 17,2% 65,9% 100,0% 48,4%
Profesional 19,0% 13,6% 0,0% 13,9%
Técnico/ventas 32,8% 15,9% 0,0% 21,3%
Total 100,0% 100,0% 100,0% 100,0%
Fuente: Área de Recursos Humanos

Interpretación
Del total de trabajadores que tienen una relación regular con la gerencia, el 65,9% son obreros.

Notas
EPE UPC 39

Gráficos comparativos

Todas frecuencias Todas frecuencias En cada columna, las


suman n o 100% suman n o 100% frecuencias suman 100%
Gráfico de barras Gráfico de barras Gráfico de barras
agrupadas apiladas apiladas al 100%

 Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El
alto de cada barra es proporcional a la frecuencia de cada categoría.
 Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada cate-
goría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

 Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es el mismo para cada categoría.

 La tabla de doble entrada y su gráfico deben tener el mismo título.


 Una manera ordenada de presentarlo es teniendo en cuenta si la tabla de doble entrada corres-
ponde al total general o si ella corresponde al total de fila o al total de columna.

Ejercicio 29
Distribución de los trabajadores según su función y relación con la gerencia

25% 23.8%
Porcentaje de trabajadores

20%
16.4% 15.6%
14.8%
15%

8.2% 9.0%
10%
5.7%
4.9%
5%
1.6%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Función
Buenas Regulares Malas

Interprete el valor <23,8%>

Notas
40 CE104 Estadística

Ejercicio 30
Cierto S.A., una empresa investigadora de mercados, realizó durante el último trimestre un estudio
acerca de los principales problemas que enfrenta la capital. La información está en la siguiente tabla.
Distribución de encuestados según principales problemas de Lima y estatus social
Principales problemas de Lima
Total
Sector social Tráfico Delincuencia Basura
Alto 70 38 12 120
Medio 52 80 14 146
Bajo 48 88 10 146
Total 170 206 36 412
Fuente: Cierto S.A.

Solución
a. Según lo mostrado, complete los siguientes espacios en blanco:
 De 412 ciudadanos, 14 ...……………………………………………….…………………………………………....……..…
 Del total de ciudadanos de sector bajo, 88 ………………………………………………………….……………...…..
 Del total de ciudadanos que opinan que el principal problema en Lima es la delincuencia, el
………………....…… % de ellos son de sector medio.
 Del total de ciudadanos, el …………………..…….% de ellos son de sector alto y opinan que el prin-
cipal problema en Lima es la delincuencia.

b. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-
pal problema de Lima y sector social”
Principales problemas de Lima
Total
Sector social Tráfico Delincuencia Basura
Alto 16,99% 2,91% 29,13%
Medio 12,62% 19,42% 3,40%
Bajo 11,65% 21,36% 2,43% 35,44%
Total 41,26% 8,74% 100,00%
Fuente: Cierto S.A.

c. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-
nos según principal problema de Lima y sector social”.

Notas
EPE UPC 41

Ejercicio 31
La tabla que se presenta a continuación fue publicada el mes pasado por el diario A. La encuesta se
aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residencia. Los
resultados se presentan a continuación:

Distribución de los encuestados según nivel socioeconómico y área de residencia


Área de residencia
Total
Nivel socioeconómico Área urbana Área rural
Nivel socioeconómico C 105 145 250
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 237 500 737
Fuente: Diario A

Elabore el gráfico de barras comparativas para el título: “Distribución de los encuestados según nivel
socioeconómico por área de residencia.

Solución

Distribución de los encuestados según nivel socioeconómico por área de residencia


Área de residencia
Total
Nivel socioeconómico Área urbana Área rural
Nivel socioeconómico C 44,30% 29,00% 33,92%
Nivel socioeconómico D 35,00%
Nivel socioeconómico E 16,03% 36,00% 29,58%
Total
Fuente: Diario A

Notas
42 CE104 Estadística

Ejercicio 32
Un productor musical de la empresa Creativa ha entrevistado a 200 personas haciéndolos oír una
canción y pidiéndoles que la identifiquen.

Distribución de individuos según identificación de la canción por género musical


Género musical Plenamente Medianamente No identifica Total
Reggaetón 84% 7% 9% 100%
Vals 63% 19% 18% 100%
Cumbia 59% 37% 4% 100%
Fuente: Empresa Creativa

Presente e interprete el gráfico de barras apiladas al 100% para la tabla anterior.

Solución
Presente el gráfico de barras apiladas al 100%.

...................................................................................................
100%
………………………………………………………….

90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0 0 0
.........................................................................................................

Fuente: …………………………………………………………………….

Interpretación

Notas
EPE UPC 43

Ejercicio 33
La tabla que se presenta a continuación fue publicada el mes pasado por el diario A. La encuesta se
aplicó a una muestra de 737 hogares según nivel socioeconómico y área de residencia. Los resultados
se presentan a continuación:

Distribución de los encuestados según nivel socioeconómico y área de residencia


Área de residencia
Nivel socioeconómico Área urbana Área rural Total
Nivel socioeconómico C 105 145 250
Nivel socioeconómico D 94 175 269
Nivel socioeconómico E 38 180 218
Total 237 500 737
Fuente: Diario A

a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.
b. A partir de la tabla anterior elabore e interprete un gráfico de barras apiladas al 100%.
Solución
a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.

Distribución de encuestados según nivel socioeconómico por área de residencia


Área de residencia
Nivel socioeconómico Área urbana Área rural
Nivel socioeconómico C 35,00% 28,71%
Nivel socioeconómico D 31,33% 34,65%
Nivel socioeconómico E 12,67% 35,64%
Total 100,0% 100,0%
Fuente: Diario A

b. A partir del cuadro anterior elabore e interprete un gráfico de barras apiladas al 100%.
Distribución de encuestados según nivel socioeconómico por área de
residencia
100%
Porcentaje de encuestados

90% 12.67%
80% 35.64%
70%
60% 31.33%
50% NSE E
34.65%
40% NSE D
30%
35.00% NSE C
20%
10% 28.71%
0%
Área Urbana Área Rural
Fuente: Diario A Área de residencia

 Del total de encuestados que viven en el área urbana, el 35% pertenece al nivel socioeconómico
C, mientras que, en el área rural, el 28,71% pertenece al nivel socioeconómico C.
 Del total de encuestados que viven en el área urbana, el 12,67% pertenece al nivel socioeconó-
mico E, mientras que, en el área rural, el 35,64% pertenece al nivel socioeconómico E.

Notas
44 CE104 Estadística

Ejercicios propuestos

1. De los enunciados siguientes, identifique la población, la muestra, unidad elemental y variable.


a. Estimar la edad media de los alumnos de educación secundaria de los colegios de Surco.
b. Estimar el porcentaje de compradores del Mega Plaza con instrucción superior.
c. Estimar el porcentaje de alumnos que no terminan el quinto año de secundaria en los cole-
gios del Callao.
d. Estimar el ingreso mensual de los niños y adolescentes que trabajan y viven en Iquitos.

2. El gerente de una red de librerías, con sucursales en Surco, San Borja y San Luis ha observado
que en los últimos meses las ventas han disminuido, y desea conocer qué origina este proble-
ma. Por ello, realizó una encuesta a 210 clientes seleccionados al azar de todas las sucursales.
Algunas de las variables recolectadas mediante la encuesta son las siguientes:
 Ingreso mensual familiar (en soles)
 Distrito de residencia
 Número de hijos en edad escolar
 Nivel de satisfacción con la atención recibida (muy buena, buena, mala, muy mala)
Del enunciado anterior identifique la población en estudio, la muestra y la unidad elemental.

3. La Oficina de Turismo de Cusco recopiló datos sobre los turistas que llegaron a la ciudad. Entre
las 16 preguntas de un cuestionario que se entregó a los pasajeros que llegaron en el mes de
enero del presente año, figuraban, entre otras, las siguientes preguntas:
 Esta visita a Cusco es la: ………………… vez (primera, segunda, tercera, etc.).
 El motivo principal de este viaje es: …………… (16 categorías incluyendo vacaciones, trabajo).
 Voy a estar alojado en: ………… (10 categorías incluyendo hotel, apartamento, parientes).
 Mi estadía en Cusco va a durar: …………………. días.
Identifique la población, la muestra y unidad elemental. Además, indique el tipo y la escala de
medición de cada una de las variables.

4. Para cada una de las variables mencionadas, indique la escala de medición y tipo:
a. Número de DNI
b. Estado civil de una persona
c. Escala de sueldos de una empresa
d. Calificación obtenida en un examen
e. Religión practicada por cada individuo
f. Preferencia política
g. Temperatura en grados centígrados Celsius
h. Temperatura en grados centígrados Kelvin
i. Cantidad de acciones vendidas diariamente en la Bolsa de Valores de Lima
j. Tiempo de servicio de los empleados de una empresa
k. Número de cheques girados diariamente en un mes
l. Lugar de nacimiento de una persona que vive en Lima.
m. Número de cigarrillos vendidos en una actividad.
n. Coeficiente de inteligencia de una persona.
o. Número de fallecidos en el hospital durante la última noche.
p. Cantidad de errores por página en una guía de ejercicios.
q. Distrito de procedencia de un alumno de EPE UPC.
r. Grado de satisfacción laboral del personal de una empresa.
s. Opinión de los empleados de una empresa sobre la realización o no de cursos de capacita-
ción (De acuerdo, ni en acuerdo ni en desacuerdo, En desacuerdo).
t. Tiempo de vida útil de un USB.

Notas
EPE UPC 45

5. Identifique las variables en estudio con su respectivo tipo.

Variable Tipo de variable


Ingreso mensual familiar (en soles)
Distrito de residencia
Número de hijos en edad escolar
Nivel de satisfacción con la atención recibida

6. Se encuestó a 245 estudiantes de la universidad A. Se sabe que en esta universidad el 72% del
alumnado pertenece al área de Humanidades y el resto al área de Ciencias.
Después de procesar la información muestral se obtuvo que:
 56% eran mujeres,
 el 33,2% prefiere el rock como género musical,
 el 45,7% gusta de la emisora 104,7 VIVA F.M.
 la media del número de veces que un oyente llamó a la radio en el último mes fue de
2,86 llamadas y la moda de esa misma variable fue igual a uno.
Identifique el estimador o parámetro y su valor para cada una de las variables.

7. El tiempo requerido para cancelar sus facturas de todos los clientes que tiene crédito en tien-
das A debe estimarse utilizando el promedio de días que necesitaron para pagar 50 clientes
elegidos al azar. Relacione las siguientes expresiones con los conceptos dados:

1 El proceso utilizado para seleccionar a los 50 clientes y medir sus tiempos


2 25 días, el tiempo que empleó para pagar un cliente
3 30 días, el tiempo promedio de pago de los 50 clientes
4 Todos los clientes que tienen crédito en Ripley
5 Todos los 50 tiempos expresados en días
6 El tiempo, en días, de un cliente
7 Los 50 clientes
8 El promedio de días para el pago de los clientes

a. Dato
b. Datos (conjunto)
c. Muestreo
d. Parámetro
e. Población
f. Muestra
g. Estadígrafo
h. Variable

8. La agencia de viajes Turismo A realizó un estudio a sus 15 000 turistas extranjeros que llegaron
al Cusco el año pasado. Se encontró que todos hablaban más de un idioma, el 35% eran de
EEUU y el gasto medio durante su viaje en la ciudad fue de 2 300 soles.
De acuerdo con el enunciado anterior:
a. Identifique la población, la muestra y la unidad elemental.
b. Para cada una de las variables identifique su tipo y escala de medida.
c. Mencione los parámetros y estadísticos detallados en texto.

Notas
46 CE104 Estadística

9. El banco A tiene sucursales en Lima y Callao. Cuenta 9784 clientes. Su gerente general desea
determinar la situación de la entidad y la de sus clientes. Para ello, seleccionó una muestra de
1200 clientes que solicitaron préstamo durante el último semestre. Parte de la base de datos
correspondiente a la muestra se presenta a continuación:

Número de Edad del Tipo de Monto del Número de cuo- Moneda del Giro del
tarjetas cliente préstamo préstamo tas del préstamo préstamo negocio
Capital
1 53 años $5000 6 meses Soles Bodega
trabajo
3 36 años Cuota fija $1500 12 meses Soles Restaurante
5 54 años Cuota fija $4500 18 meses Soles Abarrotes
      
4 43 años Mi local $6000 36 meses Dólares Mueblería

a. De acuerdo con el enunciado identifique la población, la muestra y la unidad elemental.


b. Identifique un ejemplo de dato y uno de observación.
c. Para cada una de las variables identifique su tipo y escala de medida.
d. ¿Qué estadístico puede calcularse para la variable <monto del préstamo> y cuál para la va-
riable <tipo de préstamo>?

10. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos
de los inmigrantes peruanos en Estados Unidos. Se encuestó a 400 inmigrantes peruanos. Al-
gunas de las preguntas del cuestionario fueron las siguientes:
 Nivel educativo alcanzado en el Perú.
 Monto enviado (en dólares) el último mes a sus familiares en el Perú.
 Problema principal: Ninguno, indocumentado, vivienda no adecuada, salud, etc.
 Número de veces que ha visitado el Perú desde que viajó por primera vez a EEUU.

a. De acuerdo con el enunciado anterior identifique la población y la muestra.


b. Indique tipo y escala de medición de las variables y proponga un estadístico para cada una.

11. El departamento de logística de una aerolínea registró el día 12 de marzo del presente año, en
cada uno de sus 20 vuelos, el número de asientos sobrantes (con negativos), esto es cuando se
presentaron menos pasajeros que la capacidad total del avión y el número de asientos faltan-
tes (con positivos), cuando se presentaron más pasajeros que la capacidad total del avión.

-2 0 0 1 1 0 -1 -2 -1 1 0 -1 0 2 -1 -1 2 1 -3 0

a. Construya la tabla de distribución de frecuencias para la variable en estudio.


b. Elabore un gráfico para representar la información anterior.

12. Se presenta la información de una muestra de clientes elegidos al azar del banco América so-
bre el destino de dichos préstamos: V (vivienda), N (negocio), E (estudio) y D (viaje).
Destino del préstamo
V V E E E E E E D D D D D V V V D E E E V V V V N
N N N E E D D D E E D N N N V V V V V E E E E E D
Presente la tabla de distribución de frecuencias que resuma la información de la variable cuali-
tativa. Interprete f2.

Notas
EPE UPC 47

13. Edificar es una empresa dedicada al rubro de la construcción. La gerenta de Recursos Humanos
ha recibido quejas de los trabajadores y ha decidido estudiar la situación laboral de los traba-
jadores. Al seleccionar una muestra de 115 trabajadores obtuvo la siguiente información:

Trabajador Sexo Edad Número de hijos Cargo Ingreso mensual Motivo de la queja
1 M 32 años 1 Maestro de obra 2862 soles Mal remunerado
2 M 32 años 2 Peón 742 soles Sin bonificación
3 M 25 años 0 Oficial 2256 soles Sin horas extras
      
115 M 37 años 3 Oficial 1438 soles Mal remunerado

a. Identifique la población, la muestra y la unidad elemental.


b. Para cada variable, proponga el estadístico más adecuado que ayude a la gerenta.
c. Complete la siguiente tabla:

Variable en estudio Tipo de variable Escala de medida


Ingreso mensual (en soles)
Razón
Nominal
Cuantitativa discreta

14. Se realizó un estudio a establecimientos de venta de alimentos en San Miguel, se encuestó a


una muestra aleatoria de 20 establecimientos. Se registró variables como: número de emplea-
dos, condición del establecimiento e ingreso mensual, en miles de dólares.

Estable- Número de Condición del Ingreso Estable- Número de Condición del Ingreso
cimiento empleados establecimiento cimiento empleados establecimiento
1 6 Buena 20,0 11 5 Regular 35,1
2 4 Buena 20,4 12 5 Mala 40,0
3 3 Regular 20,5 13 4 Buena 40,4
4 5 Regular 25,9 14 3 Buena 45,1
5 7 Mala 28,8 15 3 Mala 45,3
6 8 Buena 29,1 16 8 Muy buena 46,0
7 5 Regular 30,0 17 4 Buena 50,4
8 5 Regular 30,1 18 3 Muy buena 50,5
9 3 Muy buena 30,5 19 9 Buena 50,8
10 4 Buena 30,9 20 7 Muy buena 60,6

Elabore una tabla que represente la información de la variable cualitativa.

15. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto.
Los resultados obtenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde Blanco Azul
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde Blanco Negro
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco Azul Blanco
a. Presente la tabla de distribución de frecuencias que resuma la información de la variable.
b. Realice un gráfico circular. ¿Qué puede observar acerca del color de auto?

Notas
48 CE104 Estadística

16. La empresa auditora A está organizando la información relacionada a las empresas con las que
trabaja. El siguiente cuadro corresponde al sector al que pertenecen estás empresas:

Sector fi hi hi %
Agricultura 100
Minas 0,375
Pesca 12,5%
Servicios 80
Otros 20
Total 400 1
a. ¿Cuál es la variable estudiada y de qué tipo es?
b. Complete la tabla de distribución de frecuencias.
c. Interprete los valores más importantes.

17. Complete la siguiente tabla de distribución de frecuencias que representa el número de fallas
en libros contables encontrados en una muestra de 200 libros de los archivos de un contador.

Número de fallas fi Fi hi % Hi %
1 5%
2 14% 37%
3 16
4 124
5 20
6 82%
7 97%
8
Total

a. Identificar la unidad de análisis, variable y su tipo.


b. Interprete los valores f3, h2%, F6, H5%

18. A continuación, se presenta la información del número de veces que una muestra de clientes
elegidos al azar del banco América presentaron solicitudes de préstamo.

Número de solicitudes de préstamo


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2
2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

Presente la tabla de distribución de frecuencias que resuma la información de la variable cuan-


titativa y represente gráficamente. Interprete f3.

19. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas
de ahorros cerradas por día. La información disponible para este fin se muestra a continuación:

0 3 1 2 1 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 2 5 4 0 1

a. Construya la tabla de distribución de frecuencias para la variable en estudio.


b. Construya el gráfico de bastones para representar la variable en estudio.

Notas
EPE UPC 49

20. Los directivos de la empresa A solicitaron a los gerentes de cada una de sus dos locales de ven-
tas, A y B, que informen sobre los sueldos de todos sus trabajadores correspondientes al mes
de marzo del año en curso. La información proporcionada (en soles) por el gerente del local A
se muestra a continuación.

i Sueldos fi
1 [ 1 000 – 2 000 2
2  2 000 – 3 000 3
3  3 000 – 4 000 14
4  4 000 – 5 000 15
5  5 000 – 6 000 5
6  6 000 – 7 000] 1

a. Complete la tabla anterior con la frecuencia relativa y las frecuencias acumuladas, absolu-
tas y relativas. Ponga títulos y fuente.
b. Interprete los valores de f3, h4 y H2.
c. Los siguientes datos corresponden a los sueldos (en soles) del local B. Construya la tabla de
distribución de frecuencias usando la regla de Sturges.
58,7 99,3 118,1 173,3 177,5 205,3 206,2 206,3 222,9 224,4 602,7 505,7
242,9 245,7 260,9 262,0 265,9 272,9 273,2 274,0 275,9 295,0 544,8 503,3
299,8 319,7 319,9 324,5 328,1 330,0 332,3 338,9 342,1 364,1 522,2 501,2
372,3 373,0 381,3 393,8 394,5 419,2 432,4 435,0 436,1 441,6 518,8 463,3

21. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del
banco A.
5,25 7,22 8,53 9,27 9,54 10,21 10,32 10,45 10,52 10,76
10,85 11,25 11,56 12,42 13,27 14,65 15,72 16,85 17,22 18,56
19,32 20,56 21,72 22,85 23,12 24,32 25,65 26,72 28,72 29,65
31,42 32,71 33,55 34,28 35,21 37,45 38,32 39,65 41,22 43,28
45,72 47,32 49,45 51,27 52,38 54,75 55,81 56,27 57,45 58,22
59,32 61,45 63,75 65,72 66,85 69,32 69,54 72,30 75,81 77,42
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges.
b. Interprete los valores de f2, h3 y H4.

22. Sean las siguientes cantidades, las calificaciones en un curso de Estadística en el que se han
evaluado a 56 personas, siendo la escala de evaluación de 0 a 100.
58 89 73 59 87 63 43 59 64 74 63 63 82 95
73 81 44 69 30 38 75 66 76 84 72 82 59 75
63 72 52 55 75 43 48 52 77 68 47 53 36 65
67 61 87 39 62 75 69 53 79 95 50 38 70 84
Representar esta información en forma tabular. Elabore un informe ejecutivo
23. En una tabla de distribución de frecuencias simétrica con siete intervalos de clases de igual
longitud, se conocen los datos siguientes:
w = 10 f1 = 8 f2 + f5 = 62 h3 = 0,21 H6 = 0,96
Reconstruya la tabla de distribución de frecuencias, sabiendo además que el primer intervalo
es [5 - 15

Notas
50 CE104 Estadística

24. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del
último mes de los empleados de la empresa A. Complete la tabla:

Distribución de trabajadores según salarios, en soles, del último mes


Salario Marca de clase fi hi Fi Hi
1200 1600  120
   1800 300 0,42
   780
   150
   1000
Fuente: Empresa A

25. La tabla muestra la distribución del ingreso familiar diario correspondiente a 80 familias.

Ingreso familiar diario fi Fi hi


[160 – 170
170 – 180 48 60
180 – 190 0,125
190 – 200 0,075
200 – 210
Fuente: Ciudad A

a. Ponga título y fuente a la tabla.


b. Determine el número de familias que ganan hasta 190 soles.
c. Determine el porcentaje de familias que ganan más de 180 soles y hasta 190 soles.
d. Determine el porcentaje de familias que ganan más de 170 soles y hasta 200 soles.
e. Determine el porcentaje de familias que ganan más de 190 soles.

26. En los X Censos Nacionales de Población y V de Vivienda de año 2007 se preguntó por el tipo
de alumbrado de la vivienda según área (urbana o rural).

Tipo de alumbrado del hogar Área urbana Área rural Total


Electricidad 3 875 390 353 544 4 228 934
Kerosene (mechero / lamparín) 148 084 817 581 965 665
Petróleo / gas (lámpara) 6 219 11 479 17 698
Vela 201 220 312 327 513 547
Generador 6 562 6 819 13 381
Otro 70 647 20 608 91 255
No tiene 17 949 9 720 27 669
Total 4 326 071 1 532 078 5 858 149

a. Ponga título y fuente a la tabla.


b. Elabore una gráfica de barras apiladas al 100% que permita ver la composición del tipo de
alumbrado dentro de cada área.
c. Determine el porcentaje de hogares que son rurales.
d. Del total de hogares urbanos, determine el porcentaje que se alumbra con electricidad.
e. Del total de hogares rurales, determine el porcentaje que no se alumbra con electricidad.
f. Del total de hogares que se alumbran con electricidad, determine el porcentaje que son ru-
rales.

Notas
EPE UPC 51

27. La siguiente tabla muestra el total de productos con quiebre de stock por sección y por motivo
del quiebre en el supermercado A.
Artículo Problema Problema Quiebre
Sección Total
descontinuado comercial stock teórico logístico
Bebidas 2 12 16 88 118
Comestibles 4 25 56 220 305
Cuidado personal 2 14 15 84 115
Total 8 51 87 392 538
a. Ponga título y fuente a la tabla.
b. Construya un gráfico de barras apiladas al 100% por motivo del quiebre según sección.

Notas
52 CE104 Estadística

Unidad 2. Medidas de resumen


Las medidas de resumen sirven para describir en forma resumida un conjunto de datos que constitu-
yen una muestra tomada de alguna población.

Podemos distinguir cuatro grupos de medidas de resumen: las medidas de tendencia central, las
medidas de posición, las medidas de dispersión y las medidas de forma (asimetría).

Medidas Medidas de tendencia Media


central
de Mediana
resumen
Moda

Medidas de posición o Percentil


cuantiles
Cuartil

Decil

Medidas de dispersión Rango


Rango intercuartil
Varianza
Desviación estándar
Coeficiente de variación

Medidas de asimetría Coeficiente de asimetría de


Fisher

Notas
EPE UPC 53

Medidas de tendencia central


Son aquellas medidas que localizan el centro de una distribución, indicando el valor alrededor del
cual tienden a concentrarse o distribuirse las demás observaciones. El objetivo es conseguir un valor
que sea representativo del conjunto total de datos que se está analizando.

Medidas Media Es la suma de dichos valores dividida entre


de el número de valores.
tendencia
Mediana Es el valor que ocupa la posición central
central una vez ordenados de menor a mayor.

Moda Es el valor que se presenta con mayor frecuencia.

Por ejemplo, según el V Monitor Anual Adecco sobre Salarios, elaborado por la empresa de recursos
humanos y los investigadores de Barceló y Asociados, que analiza el salario en España.

Tomado de http://cincodias.elpais.com/cincodias/2016/10/28/economia/1477647044_581527.html

La Superintendencia Nacional de Servicios de Sanea-


miento (Sunass) publicó el consumo medio de agua de
una persona al día por distrito.

Según la Organización Mundial de la Salud (OMS), una


persona debe consumir al día alrededor de 100 litros de
agua para atender todas sus necesidades.

Los vecinos de San Isidro son los que más consumen


agua, una persona gasta, en promedio, 447 litros al día;
en Miraflores, 395 litros y en La Molina, 258 litros. Mien-
tras que, en Lurigancho Chosica, son los que menos gas-
tan, una persona gasta, en promedio, 15 litros al día.

Tomado de https://www.facebook.com/Sunass.Regulador

Notas
54 CE104 Estadística

Media
La media de un conjunto de valores de una variable es la suma de dichos valores dividida entre el
número de valores. También se le denomina media aritmética o promedio.

La fórmula para calcular la media es:


N

x i
 Media poblacional  i 1
N
n

x i
 Media muestral x i 1
n

En Excel, use la función =PROMEDIO(DATOS)

Ejercicio 34
Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes
realizó a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1

Calcule e interprete la media de la variable en estudio.


Solución
La media del número de visitas de los 30 estudiantes es de 2,6 visitas al mes.

Esto significa que el número de visitas al mes a la cafetería de la universidad está alrededor de 2,6
veces al mes.

Ejercicio 35
Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años.

1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63
1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69

Calcule e interprete el promedio de la variable en estudio.

Solución
El promedio de la estatura de una muestra de hombres peruanos de 18 años es ………………………..….

Notas
EPE UPC 55

Mediana
La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición
central una vez puestos los datos en orden de magnitud, es decir, ordenados de menor a mayor.
La mediana es el valor tal que aproximadamente el 50% de las observaciones son menores o iguales
a su valor. Se denota por Me.

En Excel, use la función =MEDIANA(DATOS)

Ejercicio 36
Interprete las siguientes afirmaciones.

La mediana de la edad de las peruanas que viven en Lima es 28 años.

La mediana de la edad de las peruanas que viven en Iquitos es 19 años.

19029 euros es el sueldo mediano de un español.

Características de la mediana
 Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
 La mediana es una medida robusta, es decir, no se ve afectada por valores extremos. Por eso se
le utiliza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.

Ejercicio 37
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de
estudiantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8

Calcule e interprete la mediana de la variable en estudio.


Solución
La mediana del número de visitas es igual a …………………. veces al mes, esto significa que …………………
de los estudiantes visitaron la cafetería de la universidad ………………………………………………………………….

Notas
56 CE104 Estadística

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia. Se denota por Mo.

Características de la moda
 La moda se puede calcular para cualquier escala de medición.
 El valor de la moda no se ve afectada por valores extremos.
 La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o
más de dos modas (multimodal).
 Un conjunto de datos pudiera incluso no tener moda.
 La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.

En Excel, use la función =MODA(DATOS) o =MODA.VARIOS(DATOS)

Ejercicio 38
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de
estudiantes a la cafetería de la universidad.

4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8

Calcule e interprete la moda de la variable en estudio.


Solución
En este caso, el resultado es igual a ………………………… vez al mes.

Esto significa que los estudiantes visitan con mayor frecuencia la cafetería de la universidad
…………………………….. vez al mes.

Ejercicio 39
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados
de la carrera de Administración.

Edad (años) 15 19 21 31 21 24 30 26 22 31 31 28 31 31 24

Estatura (cm) 154 154 154 184 173 170 176 188 168 161 171 175 187 161 161

Calcule e interprete la moda de la edad y la moda de la estatura.


Solución

Notas
EPE UPC 57

Propiedades de la media aritmética


 El valor de la media es sensible a los valores extremos, por lo que varía mucho con valores muy
grandes o muy pequeños con respecto a los demás.
 Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes, entonces,
la media de los n valores yi es: y  ax  b
 Si n1 datos tienen media x1 y n2 datos tienen media x2 , luego la media de los n1+ n2 datos es:

n1 x1  n2 x2
x
n1  n2

Ejercicio 40
En una negociación por aumento de salarios, la gerencia de la empresa A ofrece a sus empleados dos
alternativas.
 La primera consiste en un aumento general del 5%.
 La segunda consiste en un aumento general del 2% más un bono de 150 soles.
Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los suel-
dos es actualmente de 3700 soles.
Solución
Alternativa 1

Alternativa 2

Decisión

Ejercicio 41
Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un prome-
dio de 2800 soles, determine el nuevo ingreso promedio que se obtendría luego de realizar los si-
guientes aumentos:
a. los ingresos de los trabajadores se incrementan en 250 soles.
b. los ingresos se incrementan en un 7,5%.
c. los ingresos se incrementan en un 12,5% más una bonificación de 125 soles.
Solución
Definamos las variables:
X := antiguo ingreso de un trabajador
Y = nuevo ingreso de un trabajador
a. Y = X + 250, entonces y  x  250  2800 250  3050soles
b. Y = X + 0,075X = 1,075X, entonces y  (1  0,075)x  1,075 2800  3010 soles
c. Y = X + 0,125X + 125. Entonces, y  (1  0,125)x  125  1,125 2800 125  3275soles

Notas
58 CE104 Estadística

Medidas de posición o cuantiles

Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto a
todos los demás datos de una serie y que previamente ha sido ordenada de menor a mayor.

Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 canti-
dades iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.

Percentiles Dividen el conjunto de datos en 100 partes porcentualmente iguales.


(en 100) El percentil k, Pk, es el valor tal que aproximadamente el k% de los datos
ordenados es menor o igual a ese valor y el (100 – k)% de los datos es mayor
a ese valor.

Cuartiles Dividen el conjunto de datos en cuatro partes porcentualmente iguales


(en 4) Se les denota como Q1, Q2 y Q3 respectivamente.
Su equivalente en percentiles es, respectivamente, P25, P50, P75.

Deciles Dividen el conjunto de datos en 10 partes porcentualmente iguales.


(en 10) Se les denota como D1 , D2, D3, …, D9 respectivamente.
Su equivalente en percentiles es, respectivamente, P10, P20, ..., P90.

Notas
EPE UPC 59

Percentil
Los percentiles dividen el conjunto de datos en 100 partes porcentualmente iguales.

El percentil k, Pk, es el valor tal que aproximadamente el k% de los datos ordenados es menor o igual
a ese valor y el (100 – k)% de los datos es mayor a ese valor.

En Excel, use la función =PERCENTIL.EXC(datos; k/100)

Ejercicio 42
Interprete las siguientes afirmaciones.
Según el II Censo Nacional Universitario 2010, el percentil 57 de la edad de los estudiantes de pre-
grado es 22 años.

De acuerdo con un informe publicado en agosto del 2016 por la Oficina de Presupuesto del Congreso
de EEUU, el percentil 90 del ingreso anual de las familias en ese país es 942 000 dólares.

De acuerdo con la Organización Mundial de la Salud (OMS), el percentil 15 del peso de una niña de
un año en el mundo es ocho kilos.

Ejercicio 43
Indique, en los siguientes casos, el percentil adecuado:
50% de las observaciones 50% de las observaciones
P…..

30% de las observaciones 70% de las observaciones


P…..

60% de las observaciones 40% de las observaciones


P…..

22% de las observaciones 33% de las observaciones 45% de las observaciones


P…… P……..

Notas
60 CE104 Estadística

Ejercicio 44
Exprese los siguientes valores como percentiles.

 Q1 = P......
 Q2 = P......
 Q3 = P......
 Me = P......
 D3 = P......
 D6 = P......

Ejercicio 45
A continuación, se presentan los ingresos mensuales, en soles, de un grupo de trabajadores de la
empresa A.

2548 3120 1870 2458 3000 2890 1500 4005 1900 2410 2300 2870
2710 2955 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

a. Calcule e interprete el valor del percentil 25.


b. Calcule e interprete el valor del percentil 85.
c. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.
d. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más
ganan.

Solución
a. Calcule e interprete el valor del percentil 25.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

b. Calcule e interprete el valor del percentil 85.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

c. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

d. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más
ganan.

En Excel, use la función =PERCENTIL.EXC(………………..; ………….)

Notas
EPE UPC 61

Medidas de dispersión o variabilidad

Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.

Las medidas de dispersión o variabilidad indican cuán alejados están los valores de una variable del
valor que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.

Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de
la medida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los datos
no están concentrados alrededor de la medida de tendencia central.

Rango El rango es la diferencia entre el dato mayor y el dato menor.

Rango Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central
intercuartil de los datos.

Varianza Es el promedio de los cuadrados de las desviaciones de los datos respecto


de su media aritmética.

Desviación Es la raíz cuadrada positiva de la varianza.


estándar

Coeficiente de •Indica el porcentaje que es la desviación estándar en comparación con la


variación media.

Notas
62 CE104 Estadística

Rango
El rango (r) de un conjunto de datos observados es la diferencia entre el dato mayor y el dato menor.
También se le denomina amplitud o recorrido.

En Excel, use la función =MAX(datos) - MIN(datos)


Características del rango
 Se puede calcular en variables medidas en escala de intervalo o razón
 Se ve muy afectado por valores extremos.

Rango intercuartil
El rango intercuartil (RIC) es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central
de los datos. El rango intercuartil elimina la influencia de los valores extremos.

Rango intercuartil = RIC = Q3 – Q1= P75 – P25


donde:
Q1 es el primer cuartil o percentil 25
Q3 es el tercer cuartil o percentil 75

En Excel, use la función =PERCENTIL.EXC(datos; 0.75)- PERCENTIL.EXC(datos; 0.25)

Características del rango intercuartil


 Se puede calcular en variables medidas en escala de intervalo o razón
 No se ve afectado por valores extremos.

Ejercicio 46
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respues-
tas mostradas en la siguiente tabla:

2 1 2 4 1 3 2 3 2 0 5 1

Calcule e interprete los valores del rango y rango intercuartil.

Solución
 El rango R = máximo – mínimo = 5 - 0 = 5. Esto significa, que el rango o amplitud para el número
de hijos por familia en la muestra de 12 hogares es 5 hijos.
 El rango intercuartil RIC = 3 – 1= 2. Esto significa que la dispersión en el 50% de los datos centra-
les del número de hijos en las familias es igual a dos hijos.

Notas
EPE UPC 63

Ejercicio 47
La empresa A produce manzanas de la variedad A y de la variedad B. Se ha tomado una muestra de
manzanas. Los datos muestran el peso de las manzanas, en gramos.

Variedad A
203 160 157 181 201 216 183 174 180 204 185 190 184 161 183 184 179 178 210
184 176 189 209 169 181 184 184 203 172 181 186 209 177 184 209 188 174 198
201 165 172 200 162 217 187 176 184 195 194 196 186 199 165 201 179 196 186

Variedad B
212 122 194 185 217 137 198 200 181 184 179 190 218 215 177 180 214 149 196
169 216 168 171 199 175 142 191 192 185 184 168 178 190 168 178 235 186 194
193 157 177 175 177 171 210 181 180 179 193 190 185 198 174 163 200 144 174
191 166 186 162 153 179 185 206 123 183 183 198 181 173 210 162 207 201 211

a. Calcule e interprete el rango y el rango intercuartil de cada variedad.


b. Indique la variedad de manzana que tiene mayor homogeneidad de sus pesos en el 50% central.

Solución
a. Calcule e interprete el rango y el rango intercuartil de cada variedad.

Para la variedad A, el dato mayor es ……………………… y el dato menor es ……………………………….,


luego el valor del rango es igual a …………………………….… gramos, esto significa que ……………………..
………………………………………………………………………………………………….………………………………………….……….

Para la variedad A, el percentil 75 es igual a ……………………… gramos y el percentil 25 es igual a


…………………… gramos, luego el valor del rango intercuartil es …………………………gramos, esto signi-
fica que …………………………………………………………………………………………………………………..…………………….
…………………………………………………………………………………………………….………………………………………..………

Para la variedad B, el dato mayor es ……………………… y el dato menor es ……………………………….,


luego el valor del rango es igual a …………………………….… gramos, esto significa que ……………………..
………………………………………………………………………………………………….………………………………………….……….

Para la variedad B, el percentil 75 es igual a ……………………… gramos y el percentil 25 es igual a


…………………… gramos, luego el valor del rango intercuartil es …………………………gramos, esto signi-
fica que …………………………………………………………………………………………………………………..…………………….
…………………………………………………………………………………………………….………………………………………..………

b. Indique la variedad de manzana que tiene mayor homogeneidad de sus pesos en el 50% central.

La variedad ……………… es la variedad que tiene mayor homogeneidad de sus pesos en el 50%
central, pues …………………………………………………………………………………..…………………………………………….
…………………………………………………………………………………………………….………………………………………..………

Notas
64 CE104 Estadística

Varianza
La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.

Se calcula usando la siguiente fórmula:


N

 x    i
2

Varianza poblacional 2  i 1
N
n

 x  x 
i
2

Varianza muestral s2  i 1
n 1

En Excel, use la función =VAR.S(datos)

Desviación estándar
Se define como la raíz cuadrada positiva de la varianza.

En Excel, use la función =DESVEST.M(datos)

Características de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos, mientras que la
desviación estándar es expresada en las mismas unidades de los datos.

Ejercicio 48
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respues-
tas mostradas en la siguiente tabla:

2 1 2 4 1 3 2 3 2 0 5 1

Calcule la varianza y la desviación estándar de la variable en estudio.


Solución
En Excel, use la función:
 =VAR.S para calcular la varianza muestral, s2 = 1,9697 hijos2.
 =DESVEST.M para calcular la desviación estándar muestral, s = 1,4035 hijos.

Notas
EPE UPC 65

Ejercicio 49
FibraTex S.A. es una empresa exportadora de prendas de vestir. Los datos que se presentan a conti-
nuación corresponden a la edad, en años, de todos los trabajadores de esta empresa.

41 45 49 46 52 42 39 49 44 39 47 49 40 43 51 41 58 59 49 44 41 48 50 44 51
40 37 38 40 41 50 54 41 40 45 37 40 36 36 42 39 55 45 44 38 40 37 47 33 48
44 50 51 41 47 56 44 41 59 38 41 44 49 45 37 40 28 49 45 39 59 51 40 43 44
40 38 44 43 39 45 43 44 43 40 42 29 37 48 49 51 46 39 43 56 44 60 57 47 49

Calcule la varianza y la desviación estándar de la variable en estudio.


Solución
En Excel, use la función:
 =VAR.P para calcular la varianza poblacional, σ2 = ………….…………………………………….(unidades)
 =DESVEST.P para calcular la desviación estándar poblacional, σ = ……..………. ....... (unidades)

Notas
66 CE104 Estadística

Coeficiente de variación
Las medidas de dispersión estudiadas son medidas de variación absolutas, pues se expresan en las
mismas unidades que la variable, excepto la varianza que se expresa en unidades al cuadrado.

Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-
tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.

El coeficiente de variación es una medida de dispersión libre de unidades,


por lo que es útil para comparar la variabilidad de dos o más grupos de datos,
aunque estén expresados en distintas unidades de medida.

El coeficiente de variación es una medida de dispersión relativa

El coeficiente de variación (CV) de un conjunto de datos indica el porcentaje que es la desviación


estándar en comparación con la media.
Se calcula en variables medidas en escala de razón.

Cálculo del coeficiente de variación


La fórmula para su cálculo es:

Coeficiente de variación poblacional CV   100%

s
Coeficiente de variación muestral CV   100%
x
En Excel, use la función =DESVEST.M(datos)/PROMEDIO(datos)

Ejercicio 50
Observe las dos imágenes siguientes.

Tomado de http://gastronomiaycia.republica.com/

Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas.

 En el grupo de la izquierda hay mayor ……………………………...……………. en el peso de las manzanas.


 En el grupo de la izquierda hay menor ……………………………...……………. en el peso de las manzanas.
 En el grupo de la derecha hay mayor ………………………………...……………. en el peso de las manzanas.
 En el grupo de la derecha hay menor ………………………………...……………. en el peso de las manzanas.
 Seguramente en el grupo de manzanas a la izquierda, el coeficiente de variación del peso de las
manzanas es ……………...……….…….. al coeficiente de variación del grupo a la derecha.

Notas
EPE UPC 67

Ejercicio 51
Usando la opción <Análisis de datos> y la función =PERCENTIL.EXC(datos; k/100) de Excel se ha obte-
nido la siguiente tabla de las respuestas obtenidas del tiempo de servicio en una encuesta realizada a
una muestra de 400 empleados de la empresa A realizada el presente año.

Estadísticos Casado Soltero Divorciado


Media 141,823 143,285 135,75
Mediana 132 112 128
Moda 94 #N/A 124
Desviación estándar 46,042 65,288 45,921
Varianza de la muestra 2119,904 4262,571 2108,733
Coeficiente de asimetría 1,612 1,958 0,059
Rango 180 181 139
Mínimo 94 99 61
Máximo 274 280 200
Cuenta 170 70 160
Percentil 25 120,2 110,6 128,6
Percentil 75 186,7 198,6 187,4

a. ¿En qué estado civil el tiempo de servicio presenta mayor dispersión?


b. ¿En qué estado civil el tiempo de servicio es más disperso en el 50% central?

Solución
a. ¿En qué estado civil, el tiempo de servicio presenta mayor dispersión?

Estado civil Media Desviación estándar Coeficiente de variación


Casado
Conviviente
Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el estado civil …………………………….….............


porque …………………………………………………………………………………………………………………………………………..

b. ¿En qué estado civil el tiempo de servicio es más dispersión en el 50% central?

Estado civil Q1 Q3 RIC


Casado
Soltero
Divorciado

Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado
civil …………………………….. porque ………………………………………………………………………………………….…………

Notas
68 CE104 Estadística

Ejercicio 52
Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por
una muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pidie-
ron tomar la muestra para conocer el comportamiento de los pagos de los clientes.
Cheque
5,00 17,87 18,77 21,11 22,67 25,96 30,60 31,07 31,74 34,67
35,38 36,09 36,48 37,20 37,60 37,94 38,58 39,55 40,51 41,10
41,58 42,69 42,83 43,14 48,95 49,21 50,58 51,66 52,04 52,87
54,84 55,40 57,59 58,11 58,64 58,75 59,78 69,22 72,46 78,16
Efectivo
1,09 1,27 1,85 2,44 2,87 2,96 3,31 3,65 4,34 4,75
5,08 5,15 5,91 5,98 6,93 7,02 7,17 7,22 7,40 7,41
7,88 8,81 8,85 9,00 11,17 11,54 11,77 12,07 13,09 14,28
15,07 15,10 15,57 16,28 16,38 16,69 18,09 20,48
Tarjeta
14,44 19,78 22,59 25,57 26,57 26,91 27,66 27,89 33,76 44,53
46,13 46,24 48,11 50,30 52,35 52,63 53,32 54,19 55,21 57,55
69,77 94,36
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?
Solución
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
Para calcular el coeficiente de variación use las funciones:
 =PROMEDIO(datos) para calcular la media
 =DESVEST.M(datos) para calcular la desviación estándar.
Luego, divida cada desviación estándar entre su respectiva media.
Forma de pago Media Desviación estándar Coeficiente de variación
Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea es…………………………………………………………….. porque


……………………………………………………………………………………………………………………………………………………..

b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?

Forma de pago
Cheque
Efectivo
Tarjeta

Por lo tanto, la forma de pago más homogénea en el 50% central es ……………………………….. porque
……………………………………………………………………………………………………………………………………………..

Notas
EPE UPC 69

Ejercicio 53
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto ar-
tículo que realizaron dos grupos de técnicos.

Grupo 1: Media = 3 y desviación estándar = 1,10


Grupo 2: Media = 5 y desviación estándar = 1,66

¿En cuál de los grupos el número de mediciones es más disperso?

Solución
Se usa como indicador el coeficiente de variación:

s1  1,10 
CV1   100%     100%  36,67%
x2  3 
s  1,66 
CV2  2  100%     100%  33,207%
x2  5 

El número de mediciones es más disperso en el grupo 1, puesto que su coeficiente de variación es


mayor.

Notas
70 CE104 Estadística

Medidas de asimetría
Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la
forma que presenta un conjunto unimodal de datos.

 Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la me-
dia, se dice que la distribución es simétrica.
 Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media
o viceversa, se dice que la distribución es asimétrica.

Coeficiente de asimetría de Fisher

El coeficiente de asimetría de Fisher se define como:


3
 xi  x 
n
n
As   
n  1n  2 i 1  s 

Se tiene que:

Asimetría negativa Asimetría positiva


Simetría As = 0
As < 0 (cola izquierda) As > 0 (cola derecha)

En Excel, use la función =COEFICIENTE.ASIMETRIA(datos).

Relación entre media, mediana y moda


Para una distribución unimodal, es decir, que tenga una sola moda, se cumplen de manera general
las siguientes relaciones.
 Para una distribución asimétrica negativa: x < mediana < moda
 Para una distribución simétrica: x = mediana = moda
 Para una distribución asimétrica positiva: x > mediana > moda

Ejercicio 54
Complete los siguientes textos:
 Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una con-
centración de datos en los valores …………………………………………
 Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una con-
centración de datos en los valores …………………………………………
 En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asi-
metría …………………..…….., porque ………………………………..…………………………………………
 En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente
tienen un coeficiente de asimetría ……………………………………….………….., porque
………………………………..…………………………………………………………………………………………………

Notas
EPE UPC 71

Ejercicio 55
La empresa A desea saber si la capacitación en una tarea ha reducido el tiempo en que se fabrica un
cierto producto. Para lo cual ha tomado una muestra de productos realizados por personas capacita-
das y no capacitadas, encontrando el mismo tiempo medio de fabricación del producto para ambos
grupos, sin embargo, el coeficiente de asimetría de los tiempos de las personas capacitadas es positi-
vo, mientras que, el coeficiente de asimetría de los tiempos de las personas no capacitadas es nega-
tivo. ¿Parecen indicar los datos que la capacitación sirve para reducir el tiempo de fabricación?
Solución

Ejercicio 56
Los datos presentados corresponden a la cantidad de dinero gastado, en soles, para comprar regalos
navideños entre un grupo de hombres y de mujeres durante el mes de diciembre pasado en Lima
Metropolitana. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.

Mujeres
460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503
470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405
450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406
407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847

Hombres
498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603
626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610
767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475
271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610

Solución
Usando la función =COEFICIENTE.ASIMETRIA(datos), tendremos los siguientes resultados.

Sexo Coeficiente de asimetría de Fisher


Femenino

Masculino

Por lo tanto,
 el gasto de las mujeres presenta asimetría ……………………………………, sus valores están concentra-
dos en los valores ………………………….…………………..…
 el gasto de los hombres presenta asimetría ……………………………………, sus valores están concentra-
dos en los valores ………………………….…………………..…

Notas
72 CE104 Estadística

Ejercicio 57 Caso: Natural Power Nutrition


Natural Power Nutrition es una empresa peruana líder en el mercado de vitaminas y complementos
nutricionales para la salud y el deporte. Son representantes de marcas mundialmente reconocidas. El
gerente de la empresa, preocupado por la baja demanda a inicios del año, desea identificar los prin-
cipales problemas que ocasionaron la migración de sus clientes a la competencia, realizó un estudio.
En dicho estudio se encuestó a 200 clientes, a los cuales se midió las siguientes variables:
 Edad: Edad del cliente, en años.
 Tipo de suplemento: Proteína, quemador de grasa, ganador de masa, preentreno y aminoácidos.
 Sexo: Sexo del cliente (Femenino, masculino).
 Nivel de satisfacción: Nivel de satisfacción del cliente respecto a la atención (Totalmente satisfe-
cho, satisfecho, insatisfecho, totalmente insatisfecho).
 Problemas reportados: Los productos no llegan a tiempo, error de envío de tipo de producto,
consultor desconoce los productos del catálogo, no responden a tiempo los reclamos presenta-
dos por Facebook, muy pocos puntos de ventas, otros
 Tipo de compra: Compra por internet, compra directa de tienda, compra directo a consultor
 Monto de compra: Monto de compra del cliente durante al mes (en soles).
 Tipo de pago: Tipo de pago que el cliente realiza en su compra (Efectivo, tarjeta de débito, tarje-
ta de crédito)
 Número de productos: Número de productos que compra el cliente al mes.
 Tiempo de demora: Es el tiempo que demora en llegar el producto a su casa (minutos)
Parte de la base de datos obtenida con la información de los clientes se muestra a continuación:
Monto de Tiempo
Tipo de su- Nivel de Problema Tipo de Tipo de Número de
ID Edad Sexo compra de demo-
plemento satisfacción reportado compra pago productos
unitario ra
1 23 Aminoácidos Femenino Satisfecho Ninguno Internet 153 Crédito 1 100
Pocos puntos
2 21 Preentreno Femenino Insatisfecho Consultor 153 Crédito 1 50
de venta
. . . . . . . . . . .
Totalmente
200 31 Ganador masa Masculino Ninguno Internet 150 Crédito 3 55
satisfecho

Definiciones básicas
1. Complete la información solicitada, indique:
Población
Muestra
Unidad elemental
2. Complete los espacios en la tabla considerando la información del estudio:

Nombre de la variable Tipo de variable Escala Dato


Tipo de suplemento
Ordinal
149 soles
Cuantitativa discreta
3. Algunos resultados del estudio mostraron:
 El 37,5% de los clientes encuestados realizan su compra por Internet.
 El tiempo promedio de demora de productos al mes es de 1,2 horas.
 El 20% de los clientes realiza su pago con tarjeta de crédito.
 La edad promedio de los clientes es 22 años.
 El problema más común que los clientes manifiestan es que hay muy pocos puntos de ventas

Notas
EPE UPC 73

Complete los espacios en blanco considerando los resultados del estudio.

Nombre de la variable Tipo de variable Estadístico Valor del estadístico

4. De la base de datos complete los siguientes espacios en blanco.


Cantidad total de datos
Cantidad total de observaciones
Cantidad de datos que conforman una observación
Un ejemplo de observación

Objetivo 1: Determinar el producto comprado con más preferencia por los clientes al mes.
Complete los datos faltantes en el gráfico y responda a los enunciados solicitados.

a. Responda al objetivo. ……………………………………………………………………………………………………………………


b. El número de clientes que han comprado quemador de grasa es:
………………………………….……………….
c. Interprete h2%...................................................................……………………………………………..……………...
d. Construya la tabla de frecuencia usando el gráfico de columnas.
Título: ……………………………………………………………………………………….

Tipo de suplemento Número de clientes hi

Fuente: …………………………………………

Notas
74 CE104 Estadística

Objetivo 2: Identificar el tipo de pago de mayor preferencia entre los clientes para evaluar una estra-
tegia promocional por tipo de producto.
A continuación, se muestra la siguiente información obtenidas de los 200 clientes al momento de
analizar el tipo de suplemento y el turno de pago.

Tipo de pago
Total
Tipo de suplemento Efectivo Tarjeta de crédito Tarjeta de débito
Proteína 3,75% 12,50% 7,50% 23,75%
Quemador de grasa 6,25% 10,00% 3,75% 20,00%
Ganador de masa 5,00% 8,75% 11,25% 25,00%
Preentreno 7,50% 5,63% 3,12% 16,25%
Aminoácidos 2,50% 7,50% 5,00% 15,00%
Total 25,00% 44,38% 30,62% 100,00%
Fuente: Natural Power Nutrition

a. Complete los elementos faltantes de la tabla y el gráfico mostrado.


 Título de la tabla
 Valor faltante del gráfico
 Valor faltante de la tabla
 El tipo de gráfico mostrado se denomina: ………………………..
b. Según lo observado en la tabla y el grafico llene los siguientes espacios en blanco:
 Del total de clientes, el …………% compran proteínas y realizan el pago de la compra con tarje-
ta de crédito.
 Del total de clientes que compran proteínas, el ………….% realizan el pago de la compra con
tarjeta de crédito.
 De total de clientes, el número de clientes que compró el tipo de suplemento quemador de
grasa es: …………. clientes.
 Del total de clientes que pagan en efectivo, son ……….. clientes compran complemento gana-
dor de grasa.
 Los gráficos posibles para elaborar con la tabla 2 son: ……………………….. y …………………
c. Responda al objetivo.

Notas
EPE UPC 75

Objetivo 3: Determinar el número de productos comprados menos frecuente por los clientes al mes
Complete el valor faltante en el gráfico y responda los enunciados solicitados.

a. Responda al objetivo.
b. El número de productos mínimo comprados por la mitad de sus clientes es: …………….
c. Interpretar h3%.
d. El porcentaje de clientes que compran más de tres productos es: ………………………………
e. Interprete F2.

Objetivo 4: Determinar la distribución de los clientes respecto al tiempo de demora que llega el pro-
ducto a su casa.
El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto se extrajo una muestra al azar y se registró los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
a. Construya la tabla de distribución de frecuencias, use la regla de Sturges.
b. Interprete h2%.
c. Interprete F4.

Objetivo 5: Clasificar los montos de compras al mes de sus clientes.


a. Complete los elementos faltantes del histograma de frecuencias del monto de compra al mes.

Teniendo en cuenta el gráfico de frecuencia construye la tabla de frecuencias.

Notas
76 CE104 Estadística

Objetivo 6: Identificar la concentración de los clientes respecto al tiempo de demora que llega el
producto a su casa.

El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:

68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168

a. A partir de los datos, calcule el indicador pertinente que permita responder al objetivo.
b. Responda al objetivo.
c. La empresa contratará más motorizados si se tardan mucho en enviar sus productos, ¿deben
contratar más motorizados?

Objetivo 7: Comparar el monto de compra entre los clientes de sexo femenino y los de sexo mascu-
lino.

Los datos representan el monto de compra de los clientes por sexo.

Femenino Masculino
Media Media 153,606
Mediana 154,000 Mediana 168,000
Moda 153,000 Moda 149,000
Desviación estándar 37,527 Desviación estándar
Varianza de la muestra Varianza de la muestra 1921,955
Coeficiente de asimetría -0,609 Coeficiente de asimetría -0,612
Rango 139 Rango 165
Suma 15436 Suma
Cuenta 101 Cuenta 99

a. Encuentre los valores faltantes de los clientes de sexo femenino.


b. Encuentre los valores faltantes de los clientes de sexo masculino.
c. Encuentre el valor del coeficiente de variación para el sexo masculino.
d. Encuentre el valor del coeficiente de variación para el sexo femenino.
e. Indique el sexo con los montos de compra más homogéneos.
f. La empresa emprenderá una campaña promocional al sexo que presente mayor dispersión, ¿cuál
es el sexo que debe emprender la campaña?

Notas
EPE UPC 77

Ejercicios propuestos

28.Todos los vehículos que circulan en Lima Metropolitana deben pasar las revisiones técnicas. Ini-
cialmente la empresa encargada de dichas revisiones contaba con dos plantas: Cono Norte y Cono
Sur. Se desea investigar si se necesitaba abrir más plantas, analizando el tiempo de atención por
vehículo. Los tiempos, en minutos, en ser atendidos a una muestra aleatoria de vehículos particu-
lares que asistieron a cada una de las plantas se presenta a continuación:

Cono Norte
12,6 12,6 12,6 12,8 12,9 12,9 13,1 13,1 13,5 13,5 13,7 13,8 13,8 14,1 14,1 14,3 15,1
Cono Sur
10,9 10,9 10,9 11,2 11,6 11,8 11,8 11,8 12,2 12,2 12,3 13,3 13,3 13,4 13,4 13,4 21,3

a. ¿En cuál de las plantas el tiempo medio de atención es mayor?


b. ¿En cuál de las plantas se tiene una mayor mediana? Interprete.
c. ¿Cuál es el tiempo de atención más frecuente en ambas plantas? Interprete.
d. ¿Cuál debe ser el tiempo de atención mínimo en la planta del Cono Norte para pertenecer al
25% de los clientes que esperan más?
e. ¿Cuál debe ser el tiempo de atención máximo en la planta del Cono Sur para pertenecer al 25%
de los clientes que esperan menos?
f. ¿Se puede afirmar que el tiempo de atención es más homogéneo en el Cono Norte que en el
Cono Sur?
g. ¿Es posible afirmar que en el Cono Sur el tiempo de atención es más homogéneo en el 50%
central que en el Cono Norte?
h. Compare la simetría del tiempo que demoran en ser atendidos los vehículos particulares que
asistieron a las plantas del Cono Norte y Cono Sur usando el coeficiente de Fisher.

29.Los gastos semanales en transporte urbano (soles) que efectúan los habitantes de las ciudades en
A y B han sido estudiados mediante muestras aleatorias independientes. Los datos fueron:

Gastos semanales en movilidad en A Gastos semanales en movilidad en B


22,0 22,0 22,1 23,2 23,2 23,2 23,6 23,6 18,1 18,5 18,7 19,9 20,4 20,5 21,1
24,0 24,1 24,1 24,2 24,2 24,5 24,7 25,5 21,3 21,3 21,5 22,0 22,0 22,2 22,4
a. Estime e interprete las siguientes medidas de tendencia central: media, mediana y moda para
los gastos semanales en movilidad en la ciudad A.
b. Calcule e interprete Q3, P10 y P36 para los gastos semanales en movilidad en la ciudad B.
c. ¿En qué ciudad los gastos semanales en movilidad son más homogéneos?
d. Evalúe la asimetría de los gastos semanales en movilidad en las dos ciudades usando el coefi-
ciente de asimetría de Fisher.

30.Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de
un fabricante. Cada batería se probó en una calculadora programada para llevar a cabo un ciclo de
cálculos ordinarios. El tiempo de vida, en horas, de las baterías se muestra a continuación:

11,9 11,9 12,0 12,0 12,0 12,4 12,3 12,1 12,5 12,0 12,0 12,0 12,1 12,1 12,1 12,2 12,2 12,2 12,2 12,2
Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que du-
ran menos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de
vida? Justifique numéricamente su respuesta.

Notas
78 CE104 Estadística

31.Un fabricante desea adquirir una máquina para el llenado de bolsas de 150 gramos. Se realizan 20
ensayos con la máquina obteniéndose los siguientes pesos, en gramos:

143 145 146 148 149 150 150 150 150 150 150 150 150 150 150 151 152 154 155 155

a. Calcule e interprete la media, mediana y moda del peso de las bolsas empaquetadas.
b. Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por la
máquina estaba descalibrada y los verdaderos pesos serían 10% menores a los pesos medidos
y, además, con una constante de menos dos gramos, ¿cuál es el peso promedio verdadero de
bolsas de la máquina?

32.Un profesor de matemáticas tuvo a su cargo dos secciones el ciclo pasado. En la primera sección,
donde tuvo 40 alumnos, la media de las notas del examen parcial fue 13 y en la segunda sección,
con 35 alumnos, la media de dicho examen fue 12,5. Hallar la media de las notas de todos los es-
tudiantes que tuvo a su cargo.

33.Según una encuesta realizada por el INEI, se determinó que:


 de 80 pymes del sector maderas, la media del número de trabajadores era de 6 personas
 de 50 pymes del sector metales, la media del número de trabajadores era de 8 personas
 de 30 pymes del sector calzados, la media del número de trabajadores era de 7 personas.
¿Cuál es la media del número de trabajadores de los tres sectores?

34.El sueldo promedio de la empresa A es 4000 soles. Se proponen dos alternativas de aumento:
a. 275 soles a cada uno
b. 5% de su sueldo más 80 soles a cada uno.
Si los empleados quieren obtener el sueldo medio mayor, ¿cuál alternativa es más conveniente?

35.La empresa A tiene sucursales en dos países. En el primer país, el sueldo medio mensual es de
2500 dólares, con una desviación estándar de 500 dólares, mientras que, en el otro país, el sueldo
medio es de 2500 soles y una varianza de 10500 soles2. ¿En qué país los sueldos presentan mayor
variabilidad?

36.En la Bolsa de Valores de Lima se analiza la cotización de las acciones de dos empresas. Las accio-
nes de la empresa A se cotizan en promedio a 4,50 soles con una desviación estándar de 0,50 so-
les, mientras que las acciones de la empresa B se cotizan en promedio a 15 soles con una varianza
de 0,85 soles2. ¿Qué empresa tiene las acciones más riesgosas, es decir, con mayor variabilidad?

37.La siguiente información corresponde al tiempo de servicio, en meses, de una muestra de publi-
cistas que laboran en dos conocidas agencias de la capital.
Agencia A Agencia B
Media 18,93 Media 19,64
Mediana 14,00 Mediana 15,00
Moda 6,00 Moda 11,00
Desviación estándar 15,78 Varianza 94,2841
Muestra 15 Muestra 25
a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia A?
b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?

38.De la variable X, sabemos que CV = 50% y que Sx = 3; ¿cuál es el valor de la media de X?

Notas
EPE UPC 79

39.Un conjunto de 20 valores tiene una media igual a 50; otro conjunto de 20 valores tiene una me-
dia igual a 30, la desviación estándar de los 40 valores considerados conjuntamente es igual a 10.
Calcular el coeficiente de variación de los 40 números.

40. La constructora A está evaluando la posibilidad de expandir sus servicios de construcción de blo-
ques de departamentos en el norte (Piura, Tumbes). Para tal fin, realizó un estudio de las cons-
trucciones realizadas por otras constructoras respecto a la ganancia obtenida en 300 departa-
mentos construidos en cada lugar. Asimismo, se detalló la ganancia según nivel socioeconómico
del lugar. Los datos se encuentran en miles de soles.

Cuadro 1: Resumen estadístico global


Ganancia (en miles soles) - Piura Ganancia (en miles soles) - Tumbes
Media 453,96 Media 256,22
Mediana 454,7 Mediana 233,57
Moda 459,1 Moda 140,4
Desviación estándar 90,01 Desviación estándar 112,45
Percentil 10 336,2 Percentil 10 100,24
Percentil 25 380,7 Percentil 25 140,96
Percentil 75 529 Percentil 75 335,74
Percentil 90 575,1 Percentil 90 480,01

Cuadro 2: Resumen estadístico por nivel socioeconómico del lugar en construcción


Nivel Ganancia - Piura Ganancia – Tumbes
socio-
económico Departamentos Media Desviación estándar Departamentos Media Varianza
A 100 556,12 30,34 60 430,25 658,95
B 120 447,54 24,52 90 315,64 927,2
C 80 335,91 50,98 150 150,96 1628,12

a. Tomando en cuenta la información presentada en el cuadro 2, ¿cuál es la ganancia media para


los niveles socioeconómicos de Piura?
b. ¿Cuál es la ganancia mínima (en miles de soles) que se obtiene para estar comprendido entre
el 10% de las obras con mayores ganancias en Tumbes? Interprete.
c. ¿Cuál es la ganancia máxima (en miles de soles) que se obtiene para estar comprendido entre
el 90% de las obras con menores ganancias en Piura? Interprete.
d. El jefe de finanzas, desea conocer en qué lugar deberá darle mayor prioridad en la ejecución
de obras. Ya que se busca mayor homogeneidad en el nivel de ganancias. Considerando la in-
formación del cuadro 1, indique el estadístico que deberá utilizar el jefe de finanzas: varianza,
media, rango intercuartil, coeficiente de variación o mediana. ¿Cuál sería su valor?
e. ¿Cuál de los siguientes gráficos representa mejor la distribución de la ganancia en Tumbes?

f. Si se compara la información de clientes de los tres niveles socioeconómicos de Tumbes, ¿en


cuál nivel socioeconómico se observa que la ganancia es más heterogénea? Interprete.

Notas
80 CE104 Estadística

41. La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una
muestra de 40 empleados de una empresa de servicios.

Edad Categoría Tiempo de servicio Número Ingreso mensual


ID Género Estado civil
(años) laboral (meses) de hijos (en soles)
1 Masculino 35 Técnico/ventas 94 1 Divorciado 4658
2 Masculino 74 Gerencial 274 2 Casado 5678
3 Femenino 36 Profesional 99 0 Divorciado 4818
4 Masculino 42 Obrero 109 1 Conviviente 2550
5 Masculino 46 Producción 127 1 Casado 3220
6 Femenino 54 Obrero 142 1 Casado 2918
7 Femenino 45 Servicios 124 1 Divorciado 2855
8 Masculino 38 Obrero 94 1 Casado 2500
9 Femenino 25 Servicios 62 2 Divorciado 1405
10 Femenino 29 Producción 61 3 Divorciado 2699
11 Masculino 49 Apoyo/adm. 132 3 Divorciado 3053
12 Masculino 48 Gerencial 132 1 Casado 5711
13 Masculino 41 Obrero 108 1 Casado 4957
14 Masculino 59 Gerencial 160 0 Divorciado 5784
15 Masculino 63 Gerencial 200 3 Casado 6316
16 Masculino 73 Profesional 200 2 Divorciado 4670
17 Masculino 35 Gerencial 94 1 Casado 5940
18 Masculino 43 Obrero 120 4 Casado 4860
19 Masculino 43 Gerencial 121 4 Casado 5315
20 Masculino 72 Obrero 280 2 Conviviente 5071
21 Masculino 45 Gerencial 124 3 Divorciado 5612
22 Masculino 35 Técnico/ventas 94 3 Casado 4956
23 Masculino 74 Obrero 192 4 Casado 4831
24 Masculino 57 Gerencial 146 3 Casado 6512
25 Masculino 72 Obrero 186 4 Divorciado 4892
26 Masculino 42 Gerencial 112 1 Casado 5599
27 Masculino 48 Gerencial 132 1 Conviviente 4978
28 Masculino 42 Obrero 111 2 Divorciado 4602
29 Masculino 36 Gerencial 100 1 Conviviente 5678
30 Masculino 57 Gerencial 145 1 Casado 5475
31 Masculino 59 Profesional 150 1 Casado 4313
32 Masculino 59 Profesional 160 3 Casado 4818
33 Masculino 63 Obrero 200 2 Divorciado 4892
34 Masculino 38 Profesional 99 1 Conviviente 4978
35 Masculino 42 Gerencial 112 4 Divorciado 6036
36 Femenino 65 Producción 171 2 Conviviente 4032
37 Masculino 52 Producción 139 4 Divorciado 3904
38 Masculino 42 Gerencial 112 1 Conviviente 5599
39 Masculino 72 Profesional 186 2 Divorciado 4670
40 Masculino 69 Profesional 182 2 Divorciado 3482

a. Calcule e interprete el valor de la mediana del tiempo de servicio para el grupo de hombres y
para el grupo de mujeres.
b. Calcule e interprete el valor de la moda del número de hijos para el grupo de hombres y para
el grupo de mujeres.
c. Calcule e interprete el valor de las medidas de tendencia central para el tiempo de servicio
por categoría laboral.

Notas
EPE UPC 81

Estadística descriptiva en Excel


Tabla de distribución de frecuencias para variables cualitativas
Hay varias formas en Excel de hacer una tabla de distribución de frecuencias para variables cualitati-
vas, dos de ellas son:

Usar la función =CONTAR.SI() Usar tablas dinámicas

Distribución de frecuencias de variables cualitativas usando la función =CONTAR.SI(rango;criterios)

1. Para hacer una tabla de distribución de frecuencias para variables cualitativas, copie los nombres
de las categorías que desee contar. Tenga mucho cuidado al escribir los nombres de las catego-
rías; si no están bien escritos, la función no contará adecuadamente y aparecerá un cero.
2. Escriba en la celda al costado de la primera categoría la función =CONTAR.SI(rango;criterios).
o En Rango indique las celdas donde están los datos.
o En Criterio indique la celda que contiene el nombre de la categoría que desee contar.

El rango debe ponerlo


como una celda absolu-
ta. Oprima F4

3. Luego, copie la celda con la función =CONTAR.SI() a las demás celdas correspondientes.
4. Calcule las frecuencias relativas (hi) o porcentuales (pi).

Divida cada frecuencia


absoluta entre el total.
Para el total apriete F4.

Notas
82 CE104 Estadística

Distribución de frecuencias de variables cualitativas usando tablas dinámicas

1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.

En Excel 2010 aparecerá este menú

En Excel 2013 aparecerá este menú

En Excel 2016 aparecerá este menú

4. Seleccione Tabla dinámica.


5. Seleccione el rango de datos en la opción Tabla o rango.
6. Elija la celda donde desea colocar la tabla dinámica.
Tiene dos opciones:
o Nueva hoja de cálculo. Excel creará una nueva hoja de datos para presentar la tabla dinámi-
ca.
o Hoja de cálculo existente. Excel pondrá la tabla dinámica en la celda que usted le indique.

Notas
EPE UPC 83

7. Arrastre la variable de la cual desea el cuadro al área Etiquetas de fila (Filas) y también al área ∑
Valores.

En Excel 2010 En Excel 2013 y 2016

Etiquetas de fila Cuenta de Preferencia profesional


Administración 5
Chef 6
Derecho 4
Futbolista 3
Ingeniería 8
Periodismo 4
Total general 30

8. Copie la tabla, como valores, en otras celdas.

9. Calcule las frecuencias relativas (hi) o porcentuales (pi).

Divida cada frecuencia


absoluta entre el total.
Para el total apriete F4.

Notas
84 CE104 Estadística

Gráfico de barras

En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuen-
cias absolutas, relativas o porcentuales.

Para hacer gráficos de barras o columnas en Excel, usted tiene dos posibilidades:

Hacer el gráfico a partir de la distribución de


Usar gráficos dinámicos
frecuencias

Gráfico de barras a partir de la distribución de frecuencias

1. Lo primero es hacer la tabla de distribución de frecuencias.

2. Seleccione las celdas de la variable y las celdas de las frecuencias absoluta o relativa. Seleccione
también el título. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
3. Haga clic en la opción Insertar de la barra de menú y active el icono Columna. Seleccione la op-
ción Columna 2-D y haga clic sobre Columna agrupada.

En Excel 2010 aparecerá este menú.

En Excel 2013 aparecerá este menú.

En Excel 2016 aparecerá este menú.

Notas
EPE UPC 85

4. Elimine la leyenda que aparece en el lado derecho del gráfico.

5. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.

En Excel 2010, seleccione Presentación, luego escoja los botones Título de gráfico, Rótulo del eje
o Etiquetas de datos para darle el formato deseado a su gráfico. Además, registre la fuente me-
diante un cuadro de texto.

En Excel 2013 y 2016, seleccione Diseño, luego escoja la opción Agregar elementos de gráfico o
la opción + para darle el formato deseado a su gráfico.

Notas
86 CE104 Estadística

Luego, debería quedarle un gráfico parecido a este.

6. Para mostrar las frecuencias porcentuales, use las frecuencias relativas para hacer el gráfico y
haga doble clic en el eje vertical. Luego, seleccione la opción Número y haga clic en Porcentaje.

En Excel 2010 En Excel 2013 y 2016

Luego, debería quedarle un gráfico parecido a este.

Notas
EPE UPC 87

Gráfico de barras usando gráficos dinámicos

1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.

En Excel 2010 aparecerá este menú

4. Seleccione Gráfico dinámico.


5. Seleccione el rango de datos en la opción Tabla o rango.
6. Elija la celda donde desea colocar la tabla dinámica.
Tiene dos opciones:
o Nueva hoja de cálculo. Excel creará una nueva hoja de datos para presentar la tabla dinámi-
ca.
o Hoja de cálculo existente. Excel pondrá la tabla dinámica en la celda que usted le indique.

7. Arrastre la variable de la cual desea el cuadro al área Campos de eje y también al área ∑ Valores.

8. Para mostrar las frecuencias porcentuales, haga clic derecho en Cuenta. Luego elija Mostrar valo-
res como del menú desplegable. A continuación, elija % del total general.

Notas
88 CE104 Estadística

En Excel 2013 y 2016 aparecerá este menú

4. Ubique el cursor en cualquier celda de los datos.


5. Seleccione Gráficos recomendados. Si la base de datos tiene varias variables, elija el gráfico de la
variable elegida.

6. Para mostrar las frecuencias porcentuales, haga clic derecho en Cuenta. Luego elija Mostrar va-
lores como del menú desplegable. A continuación, elija % del total general.

7. En todas las versiones de Excel, usted puede poner título, rótulos de ejes, etiquetas de datos,
fuente de la misma manera. Debe quedar un gráfico parecido a este o de frecuencias porcentua-
les.

Notas
EPE UPC 89

Gráfico circular en Excel


En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo que es propor-
cional a la frecuencia que representan. También se denomina diagrama de sector circular, gráfico
tipo torta o pastel.
Si la variable cualitativa es de escala ordinal se recomienda usar el gráfico de barras

Para hacer gráficos circulares en Excel, usted tiene dos posibilidades:

Hacer el gráfico a partir de la distribución de


Usar gráficos dinámicos
frecuencias

Gráfico circular a partir de la distribución de frecuencias

1. Lo primero es hacer la tabla de distribución de frecuencias.

2. Seleccione las celdas de la variable y las celdas de la de frecuencia absoluta o relativa. Seleccione
también el título. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
3. Haga clic en la opción Insertar de la barra de menú y active el icono Columna. Seleccione la op-
ción Columna 2-D y haga clic sobre Columna agrupada.

En Excel 2010 aparecerá este menú.

En Excel 2013 aparecerá este menú.

En Excel 2016 aparecerá este menú.

Notas
90 CE104 Estadística

4. Elimine la leyenda que aparece en el lado derecho del gráfico.

5. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.

En Excel 2010
Seleccione Presentación, luego escoja los botones Título de gráfico, Etiquetas de datos para dar-
le el formato deseado a su gráfico. Además, registre la fuente mediante un cuadro de texto.

Seleccione Etiquetas de datos y la opción Más opciones de la etiqueta de datos...

En Formato de etiquetas de datos, elija las opciones Nombre de categoría, Porcentaje y Extre-
mo externo.

Notas
EPE UPC 91

En Excel 2013 y 2016


Seleccione Diseño, luego escoja la opción Agregar elementos de gráfico o la opción + para darle
el formato deseado a su gráfico.

En Formato de etiquetas de datos, elija las opciones Nombre de categoría, Porcentaje y Extre-
mo externo.

6. Luego, debería quedarle un gráfico parecido a este.

Notas
92 CE104 Estadística

Gráfico circular usando gráficos dinámicos

1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.

En Excel 2010 aparecerá este menú

4. Seleccione Gráfico dinámico.


5. Seleccione el rango de datos en la opción Tabla o rango.
6. Elija la celda donde desea colocar la tabla dinámica.
Tiene dos opciones:
o Nueva hoja de cálculo. Excel creará una nueva hoja de datos para presentar la tabla dinámi-
ca.
o Hoja de cálculo existente. Excel pondrá la tabla dinámica en la celda que usted le indique.

7. Arrastre la variable de la cual desea el cuadro al área Campos de eje y también al área ∑ Valores.

Notas
EPE UPC 93

8. Para mostrar el gráfico circular seleccione la opción Cambiar tipo de gráfico.

En Excel 2013 y 2016 aparecerá este menú

1. Ubique el cursor en cualquier celda de los datos.


2. Seleccione Gráficos recomendados. Si la base de datos tiene varias variables, elija el gráfico de la
variable elegida.

Notas
94 CE104 Estadística

3. Para mostrar el gráfico circular seleccione en el menú Diseño y luego la opción Cambiar tipo de
gráfico.

4. Luego, debería quedarle un gráfico parecido a este.

Notas
EPE UPC 95

Distribución de frecuencias de variables discretas

Hay varias formas en Excel de hacer una tabla de frecuencias para variables discretas, dos de ellas
son:

Usar la función =CONTAR.SI() Usar tablas dinámicas

Distribución de frecuencias de variables discretas usando la función =CONTAR.SI(rango;criterios)

1. Para hacer una tabla de distribución de frecuencias para variables cualitativas, copie los valores
de la variable que desee contar. Tenga mucho cuidado al escribir los valores; si no están bien es-
critos, la función no contará adecuadamente y aparecerá un cero.
2. Escriba en la celda al costado de la primera categoría la función =CONTAR.SI(rango;criterios).
o En Rango indique las celdas donde están los datos.
o En Criterio indique la celda que contiene el valor de la variable que desee contar.

El rango debe ponerlo


como una celda absolu-
ta. Oprima F4

3. Luego, copie la celda con la función =CONTAR.SI() a las demás celdas correspondientes.
4. Calcule las frecuencias relativas (hi) o porcentuales (pi).

Divida cada frecuencia


absoluta entre el total.
Para el total apriete F4.

 Un inconveniente de este método es que se debe saber previamente todos los valores del rango
de la variable.

Notas
96 CE104 Estadística

Distribución de frecuencias de variables discretas usando tablas dinámicas

1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.

En Excel 2010 aparecerá este menú

En Excel 2013 aparecerá este menú

En Excel 2016 aparecerá este menú

4. Seleccione Tabla dinámica.


5. Seleccione el rango de datos en la opción Tabla o rango.
6. Elija la celda donde desea colocar la tabla dinámica.
Tiene dos opciones:
o Nueva hoja de cálculo. Excel creará una nueva hoja de datos para presentar la tabla dinámi-
ca.
o Hoja de cálculo existente. Excel pondrá la tabla dinámica en la celda que usted le indique.

Notas
EPE UPC 97

7. Arrastre la variable de la cual desea hacer el cuadro al área Etiquetas de fila (Filas) y también al
área ∑ Valores.

En Excel 2010 En Excel 2013 y 2016

Etiquetas de fila Suma de Número de capacitaciones


0 0
1 14
2 20
3 6
5 5
Total general 45

8. Coloque el cursor en la opción Suma de la variable y haga clic derecho, haga clic en Resumir va-
lor por cambie Recuento en vez de Suma.

9. Copie la tabla, como valores, en otras celdas.


Etiquetas de fila Cuenta de Número de capacitaciones
0 3
1 14
2 10
3 2
5 1
Total general 30

Notas
98 CE104 Estadística

10. Calcule las frecuencias relativas (hi) o porcentuales (pi).

Divida cada frecuencia


absoluta entre el total.
Para el total apriete F4.

Notas
EPE UPC 99

Gráfico de bastones en Excel

Hay dos formas en Excel de hacer un gráfico de bastones.

Usar el gráfico de dispersión Usar el gráfico de líneas

Gráfico de bastones en Excel usando el gráfico de dispersión

1. Lo primero es hacer la tabla de distribución de frecuencias.

2. Seleccione las columnas Número de capacitaciones y frecuencia absoluta (fi) o relativa (hi).
3. En la barra de menú, elija la opción Insertar, seleccione el tipo Dispersión.
En Excel 2010 aparecerá este menú.

En Excel 2013 aparecerá este menú.

En Excel 2016 aparecerá este menú.

Si la hubiera, elimine la leyenda.

Notas
100 CE104 Estadística

4. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.

En Excel 2010

5. Seleccione el gráfico, elija la opción Presentación y elija la opción Barras de error. En esa opción
seleccione Más opciones de las barras de error…

6. En Barras de error verticales seleccione la opción Menos. Luego en Cuantía de error, elija Por-
centaje y coloque el valor 100%. Borre las barras de error horizontales que aparecen automáti-
camente.

4. Si lo desea puede cambiar algunas características al gráfico. De ser necesario, coloque los valores
del eje Y en formato Porcentaje.

Notas
EPE UPC 101

En Excel 2013 y 2016


5. Seleccione el gráfico, elija la opción Diseño y elija la opción Agregar elementos de gráfico o la
opción +. Haga clic en Barras de error. En esa opción seleccione Más opciones…

6. En Formato de barras de error, seleccione en Dirección, la opción Menos. Luego en Cuantía de


error, elija Porcentaje y coloque el valor 100%. Borre las barras de error horizontales que apare-
cen automáticamente.

7. Si lo desea puede cambiar algunas características al gráfico. De ser necesario, coloque los valores
del eje Y en formato Porcentaje.

Notas
102 CE104 Estadística

Gráfico de bastones en Excel usando el gráfico de líneas

1. Lo primero es hacer la tabla de distribución de frecuencias.

2. Seleccione la columna frecuencia absoluta (fi) o relativa (hi).


3. En la barra de menú, elija la opción Insertar, seleccione el tipo Línea con marcadores.

En Excel 2010 aparecerá este menú.

En Excel 2013 aparecerá este menú.

En Excel 2016 aparecerá este menú.

Si la hubiera, elimine la leyenda.

4. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.

Notas
EPE UPC 103

5. Seleccione el gráfico, elija la opción Diseño y elija la opción Diseño rápido. Haga clic en Diseño 7.
En Excel 2010 aparecerá el siguiente menú, haciendo clic en Diseños de gráficos.

En Excel 2013 y 2016 aparecerá el siguiente menú, haciendo clic en Diseño rápido.

Obtendrá el siguiente gráfico.

8. Para quitar la línea, haga clic sobre ella, seleccione Formato de punto de datos... Luego, presione
el botón derecho del mouse. Elija Color de línea y marque Sin línea.

En Excel 2010 En Excel 2013 y 2016

Obtendrá el siguiente gráfico.

Notas
104 CE104 Estadística

9. Luego, haga clic derecho en cualquier parte del gráfico y elija Seleccionar datos.

10. Haga clic en Editar y escoja como Rango de rótulos del eje: a las celdas que tienen los valores de
la variable discreta.

Obtendrá el siguiente gráfico. Si es necesario debe poner frecuencia cero a los valores sin datos.

11. Si lo desea puede cambiar algunas características al gráfico. De ser necesario, coloque los valores
del eje Y en formato Porcentaje.

Notas
EPE UPC 105

Distribución de frecuencias para variables por intervalos en Excel

Hay varias formas en Excel de hacer una tabla de frecuencias para variables por intervalos, dos de
ellas son:

Usar funciones de Excel Usar Anális de datos

Distribución de frecuencias para variables por intervalos usando funciones de Excel

1. Use las funciones del Excel para realizar los siguientes cálculos.

A B
Máximo 351.1 =MAX(datos)
Mínimo 145.1 =MIN(datos)
Rango 206 =B6-B7
Cantidad de datos (n) 48 =CONTAR(datos)
k (por regla de Sturges) 6.58508 =1+3.322*LOG(n)
k (entero) 7 =REDONDEAR(k; 0)
w (Amplitud) 29.4286 =B8/B11
Número de decimales de los datos 1
w (redondeada) 29.5 =REDONDEAR.MAS(w; decimales)

2. Ahora, calcule los límites de los intervalos. Comience con el mínimo y aumente una amplitud
cada vez. Además, calcule las marcas de clase, como la semisuma de los límites.

3. Para calcular las frecuencias absolutas, seleccione el rango en el cual aparecerán las frecuencias
absolutas. Haga clic en el icono de Insertar función, seleccione Frecuencia y de Aceptar.

Notas
106 CE104 Estadística

4. En la ventana de Frecuencia, ingrese en:


o Datos, el rango de los datos que se desea contar.
o Grupos, el rango de celdas de los límites superiores de los intervalos.
Mantenga presionados Ctrl y Shift, luego, presione Enter, con lo cual aparecerán las frecuencias
absolutas.

Divida cada frecuencia


5. Calcule las demás frecuencias para completar la tabla.
absoluta entre el total.
Para el total apriete F4.

Sume cada frecuencia


con la frecuencia acu-
mulada anterior.

Divida cada frecuencia


absoluta entre el total.
Para el total apriete F4.

Fuente: Oficina de Rentas de la Municipalidad

Notas
EPE UPC 107

Distribución de frecuencias para variables por intervalos usando Análisis de datos

 Copie los datos en la columna A del Excel y en la fila 1 agregue el nombre de la variable.
 En el menú principal elija la opción Datos. Luego seleccione Análisis de datos.

 En el cuadro de diálogo Análisis de datos seleccione Estadística descriptiva.

 En Rango de entrada seleccione la variable a contar.


En Rótulos en la primera fila haga clic, dado que los datos tienen el nombre de la variable en la fila 1
En Opciones de salida elija la celda, a partir de la cual, desea que aparezca los cálculos.
En Resumen de estadísticas haga clic y marque la casilla. Finalmente, seleccione Aceptar

La salida obtenida será:


Impuestos
Media 257,25625
Error típico 7,6183196
Mediana 251
Moda 208
Desviación estándar 52,7812664
Varianza de la muestra 2785,86209
Curtosis -0,68012624
Coeficiente de asimetría -0,07342341
Rango 206
Mínimo 145,1
Máximo 351,1
Suma 12348,3
Cuenta 48

Notas
108 CE104 Estadística
Completamos los siguientes cálculos:

k (por regla de Sturges) 6,5851


k (entero) 7
w (Amplitud) 29,4286
Número de decimales de los datos 1
w (redondeada) 29,5

6. Ahora, calcule los límites de los intervalos. Comience con el mínimo y aumente una amplitud
cada vez. Además, calcule las marcas de clase, como la semisuma de los límites.

7. Para calcular las frecuencias absolutas, seleccione en el menú principal la opción Datos. Luego,
haga clic en Análisis de datos. Luego haga clic en Histograma.
En Rango de entrada seleccione las celdas que contenga los datos a contar.
En Rango de clases seleccione los límites superiores de los intervalos.
Tener cuidado con la opción Rótulos. Si la elige debe elegir los encabezados tanto en Rango de
entrada como en Rango de clases.

Obtendrá las frecuencias correspondientes, con las cuales puede completar la tabla de distribución.

Clase Frecuencia
174.6 3
204.1 3
233.6 10
263.1 12
292.6 7
322.1 7
351.6 6
y mayor... 0

Notas
EPE UPC 109

8. Calcule las demás frecuencias para completar la tabla.


Divida cada frecuencia
absoluta entre el total.
Para el total apriete F4.

Sume cada frecuencia


con la frecuencia acu-
mulada anterior.

Divida cada frecuencia


absoluta entre el total.
Para el total apriete F4.

Fuente: Oficina de Rentas de la Municipalidad

Notas
110 CE104 Estadística

Histograma de frecuencias

Hay varias formas en Excel de hacer una tabla de frecuencias para variables por intervalos, dos de
ellas son:

Usar gráficos estadísticos en Excel 2016 Usar Anális de datos

Histograma usando gráficos estadísticos de Excel 2016

1. Lo primero es poner los datos en una columna. Es conveniente poner el nombre de la variable en
la primera fila.
2. Luego, en el menú principal haga clic en Insertar, luego haga clic en Histograma.

Obtendrá el siguiente gráfico. Observe que Excel decide automáticamente la cantidad de interva-
los y no usa la regla de Sturges (k = 1 + 3,322 log(n)). Excel usa la regla de Scott, en la que el an-
3,5×𝜎
cho del intervalo se calcula como 𝑤 = 3 , donde  es la desviación estándar de los datos y n
√𝑛
es el tamaño de muestra.

3. Si desea cambiar el ancho de los intervalos, haga clic derecho sobre el eje. Elija Dar formato al
eje… Seleccione Ancho del rango y escriba el ancho del intervalo que desee.

Notas
EPE UPC 111

Obtendrá el siguiente gráfico.

4. Si lo desea puede cambiar algunas características al gráfico.

Con este método solo se puede hacer histogramas de frecuencias absolutas.

Notas
112 CE104 Estadística

Histograma usando gráficos de columna

1. Lo primero es hacer la tabla de distribución de frecuencias.

Fuente: Oficina de Rentas de la Municipalidad

2. Seleccione la columna de frecuencia absoluta o relativa, luego seleccione Insertar en la barra de


menú, elija Columna, y luego Columna agrupada.

Obtendrá el siguiente gráfico.

3. Si la hubiera, elimine la leyenda y el título.


4. Para que se junten los rectángulos, haga clic en cualquiera de las barras y elija Opciones de serie,
luego seleccione Ancho del intervalo igual a 0%.

Notas
EPE UPC 113

5. Para cambiar los valores del eje X debe crear un grupo de celdas donde estén los intervalos. Puede usar la
función =CONCATENAR()

6. Luego, seleccione el gráfico, haga clic en Diseño y seleccione Seleccionar datos. Haga clic en Editar.

7. Si lo desea puede cambiar algunas características al gráfico. Con este método solo se puede hacer histo-
gramas de frecuencias absolutas y porcentuales.

Notas
114 CE104 Estadística

Tabulación cruzada

1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.
En Excel 2010 aparecerá este menú

En Excel 2013 aparecerá este menú

En Excel 2016 aparecerá este menú

4. Seleccione Tabla dinámica.


5. Seleccione el rango de datos en la opción Tabla o rango.
6. Elija la celda donde desea colocar la tabla dinámica.
Tiene dos opciones:
o Nueva hoja de cálculo. Excel creará una nueva hoja de da-
tos para presentar la tabla dinámica.
o Hoja de cálculo existente. Excel pondrá la tabla dinámica
en la celda que usted le indique.

7. Arrastre una de las variables de la cual desea el cuadro al área


Etiquetas de fila (Filas) y la otra variable a Etiquetas de co-
lumna (Columnas). También arrastre cualquiera de las dos va-
riables al área ∑ Valores.

En Excel 2010 En Excel 2013 y 2016

Notas
EPE UPC 115

Cuenta de Giro del negocio Etiquetas de columna


Etiquetas de fila Callao Lima Total general
Bodega 14 18 32
Boutique 22 35 57
Ferretería 6 7 13
Frutería 8 15 23
Otros 15 13 28
Total general 65 88 153
8. Si desea calcular porcentajes del total general, por total de columna por total de filas, haga clic
derecho en la celda Cuenta y seleccione Mostrar valores como…

9. Copie la tabla, como valores, en otras celdas y dele el formato que desee.

Distribución de clientes según lugar de residencia y giro del negocio


Lugar de residencia
Giro del negocio Callao Lima Total
Bodega 9.15% 11.76% 20.92%
Boutique 14.38% 22.88% 37.25%
Ferretería 3.92% 4.58% 8.50%
Frutería 5.23% 9.80% 15.03%
Otros 9.80% 8.50% 18.30%
Total 42.48% 57.52% 100.00%
Fuente: Entidad bancaria Tubanco. Primer trimestre
Distribución de clientes según giro del negocio por lugar de residencia
Lugar de residencia
Giro del negocio Callao Lima Total
Bodega 21.54% 20.45% 20.92%
Boutique 33.85% 39.77% 37.25%
Ferretería 9.23% 7.95% 8.50%
Frutería 12.31% 17.05% 15.03%
Otros 23.08% 14.77% 18.30%
Total 100.00% 100.00% 100.00%
Fuente: Entidad bancaria Tubanco. Primer trimestre
Distribución de clientes según lugar de residencia por giro del negocio
Lugar de residencia
Giro del negocio Callao Lima Total
Bodega 43.75% 56.25% 100.00%
Boutique 38.60% 61.40% 100.00%
Ferretería 46.15% 53.85% 100.00%
Frutería 34.78% 65.22% 100.00%
Otros 53.57% 46.43% 100.00%
Total 42.48% 57.52% 100.00%
Fuente: Entidad bancaria Tubanco. Primer trimestre

Notas
116 CE104 Estadística

Gráfico de barras comparativas

1. Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los
totales.
2. Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna agrupada.

3. Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se
seleccionan. Presione la tecla Supr de su teclado para eliminarlas.
4. Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opciones:
Diseño, Presentación y Formato.
5. Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26
(segunda columna fila 4) es el que se presenta como modelo en este material.

6. Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo
del eje y Etiqueta de datos para darle el formato deseado.

7. Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje…
/Número/Porcentaje/Posiciones decimales: 0/Cerrar.

8. Elimine los valores porcentuales iguales a cero para una mejor presentación.

Notas
EPE UPC 117

Gráfico de barras apiladas al 100%

1. Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los
totales.
2. Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna 100% apilada.

3. Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opciones:
Diseño, Presentación y Formato.
4. Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26
(segunda columna fila 4) es el que se presenta como modelo en este material.

5. Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo
del eje y Etiqueta de datos para darle el formato deseado.

6. Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje…
/Número/Porcentaje/Posiciones decimales: 0/Cerrar.
7. Elimine los valores porcentuales iguales a cero para una mejor presentación.

Notas
118 CE104 Estadística

Medidas de resumen

Hay dos formas para calcular medidas de resumen usando Excel.

Usar funciones Usar Análisis de datos

Cálculo de las medidas de resumen usando funciones de Excel

Media aritmética =PROMEDIO(datos)

Mediana =MEDIANA(datos)

Moda Existen dos funciones para calcular la moda:


=MODA.UNO(datos) solo si los datos tuvieran una moda.
=MODA.VARIOS(datos) si los datos tuvieran más de una moda.

Recomendamos usar =MODA.VARIOS(datos), pues de antemano no sabe-


mos si el conjunto de datos con los cuales estamos trabajando tienen más
de una moda.
Percentil En Excel, hay dos funciones para calcular un percentil:
Para calcular el percentil k, use la función =PERCENTIL.EXC(datos,k/100)
Para calcular el percentil k, use la función =PERCENTIL.INC(datos,k/100)

Rango intercuartil Excel no calcula directamente el rango intercuartil, por lo que use las fun-
ciones:
=PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,
=PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,
Luego el valor del rango intercuartil es P75 – P25.
Desviación estándar =DESVEST.M para calcular la desviación estándar muestral.
=DESVEST.P para calcular la desviación estándar poblacional.

Varianza =VAR.S para calcular la varianza muestral.


=VAR.P para calcular la varianza poblacional.

Coeficiente de varia- Excel no calcula el coeficiente de variación, por lo que use las funciones:
ción =PROMEDIO(datos) para calcular la media
=DESVEST.M(datos) para calcular la desviación estándar
Para luego, dividir la desviación estándar entre su respectiva media.

Coeficiente de asime- =COEFICIENTE.ASIMETRIA(datos)


tría de Fisher

Notas
EPE UPC 119

Unidad 3. Probabilidades

Experimento Es un proceso que al ser realizado repetidas veces, bajo las mismas
aleatorio condiciones, da un resultado que no es previsible con certeza.

Espacio muestral Es el conjunto de todos los posibles resultados que genera un


experimento aleatorio.

Evento Es todo subconjunto de un espacio muestral.

Probabilidad Es una medida de la posibilidad de ocurrencia de un evento.

En muchas situaciones es necesario medir la incertidumbre, como, por ejemplo:

Notas
120 CE104 Estadística

Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera
más de un posible resultado que no puede ser determinado de antemano. Se denota por ε.

Espacio muestral
Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. Se denota por
Ω o S.
Cada elemento del espacio muestral se denomina punto muestral.

Evento
Es todo subconjunto de un espacio muestral. Se denota mediante letras mayúsculas, por ejemplo, A,
B, C, … o X1, X2, X3.

Probabilidad
Es una medida de la posibilidad de ocurrencia de un evento.

Ejercicio 58
Marque con un aspa, asignando una opción a la situación descrita de acuerdo con su posibilidad de
ocurrencia.
Muy poco Poco Igualmente proba- Bastante Muy
Situación
probable probable ble que ocurra o no probable probable
Aprobaré este curso
Lanzo un dado y sale un número par
El PBI del Perú crecerá 4% este año
Perú se clasificará al Mundial 2018

Probabilidad
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto, la pro-
babilidad es una medida del grado de incertidumbre asociado con un evento.
Los valores de la probabilidad siempre se asignan en una escala de 0 a 1.
Una probabilidad cercana a 0 indica que es difícil que el evento ocurra, mientras que, una probabili-
dad cercana a 1 indica que es casi seguro que el evento ocurra.

Ejercicio 59
Complete el siguiente cuadro asignando probabilidades según su parecer.
Experimento aleatorio Un evento Probabilidad
Michelle Obama postula a la presidencia de EEUU A = Gana P(A) = ……………….
El expresidente Toledo es juzgado B = Va a la cárcel P(B) = ……………….
Alianza Lima juega el campeonato descentralizado C = Sale campeón P(C) = ……………….
Se lanzan dos dados y se suman las caras D = La suma es 7 P(D) = ……………….

Notas
EPE UPC 121

Definición clásica de probabilidad


La definición clásica propone que, si el espacio muestral es numerable y cada punto muestral tiene la
misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento A definido
sobre  es:
nA número de casos favorablesal evento A
P  A  
n número de casos totales

Ejercicio 60
Experimento aleatorio Lanzar un dado y registrar lo que sale en la cara superior
Espacio muestral Ω = {1, 2, 3, 4, 5, 6}
Eventos A = {1}
B = {1, 2, 3}
nA
Probabilidad P A   =………………………..……
n 
nB
P B   =………………………..……
n 

Experimento aleatorio Lanzar dos monedas y registrar lo que sale en la cara superior
Espacio muestral Ω = {(……. , …….), (……. , …….), (……. , …….), (……. , …….)}
Evento A = {que salgan dos caras} = {(……., …….)}
nA
Probabilidad P A   =………………………..……
n 

Experimento aleatorio Sacar una bola y anotar su color de una urna que contiene tres bolas
rojas y cuatro negras
Evento: A = {que salga una bola roja}
nA
Probabilidad P A   =………………………..……
n 

Ejercicio 61
Sea el experimento aleatorio ε: lanzar dos dados simultáneamente y anotar el número de la cara
superior de cada dado. ¿Por qué se considera es aleatorio?

Escriba el espacio muestral

Calcule la probabilidad de que los dados sumen más de siete.

Notas
122 CE104 Estadística

Álgebra de eventos
Sea  un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos definidos
en Ω, se define:

Complemento de un evento

Para un evento A cualquiera se define su complemento AC como el


evento consistente en todos los puntos de S que no están en A.
Se tiene que P(AC) = 1 - P(A)

AC se expresa como: “El evento A no ocurre”

Unión de eventos
Para dos eventos A y B, la unión del evento A con el evento B (A  B) es
el evento que contienen todos los puntos de S que pertenecen a A o a B
o a ambos.

AB se expresa como: “Al menos uno de los eventos A o B ocurre”.

Intersección de eventos
Para dos eventos A y B, la intersección de los eventos A y B (A  B) es el
evento que contienen todos los puntos de S que pertenecen tanto a A
como a B.

AB se expresa como: “Ambos eventos, A y B ocurren a la vez”.

Diferencia de eventos
Para dos eventos A y B, la diferencia de los eventos A y B (A - B) es el
evento que contienen todos los puntos de S que pertenecen a A y no
pertenecen a B.

A - B se expresa como: “Ocurre el evento A pero no el evento B”

Diferencia simétrica de eventos


Para dos eventos A y B, la diferencia simétrica de los eventos A y B (A ∆
B) es el evento que contienen todos los puntos de S que pertenecen
solo a A o aquellos que solo pertenecen a B.

A B se expresa como: “Ocurre solamente uno de los eventos A o B”

Notas
EPE UPC 123

Ejercicio 62
Una inversionista compra acciones de la empresa A y de la empresa B.

Se definen los eventos:


A:= que la inversionista obtenga ganancias con las acciones de la empresa A
B:= que la inversionista obtenga ganancias con las acciones de la empresa B

Escriba los siguientes eventos en función de los eventos A y B. Además, grafique dicho evento en un
diagrama de Venn.
Solución

Evento Notación Diagrama de Venn

que la inversionista obtenga ganancias con los


A ………... B
dos tipos de acciones.

que la inversionista no obtenga ganancias.

que la inversionista no obtenga ganancias con las


acciones de la empresa B.

que la inversionista obtenga ganancias con las


acciones de la empresa B, pero no con las de A.

que la inversionista obtenga ganancia solamente


con una de las acciones

que la inversionista obtenga ganancias con las


acciones de la empresa A, pero no con las de B.

que la inversionista obtenga ganancias.

que la inversionista obtenga ganancias con las


dos acciones o que no tenga ganancias.

Notas
124 CE104 Estadística

Axiomas de la probabilidad
Un axioma es una proposición o enunciado tan evidente
que se considera que no requiere demostración.

Sea un experimento aleatorio, Ω el espacio muestral asociado a dicho experimento aleatorio y A un


evento definido en Ω, entonces la probabilidad del evento A, denotada por P(A), es aquel número
que cumple los siguientes axiomas:
 Axioma 1: 0  P(A)
 Axioma 2: P(Ω) = 1
 Axioma 3: Si A y B son dos eventos mutuamente excluyentes entonces:
P(A  B) = P(A) + P(B)

Teoremas de probabilidad
 P() = 0, donde  es el evento imposible.
 P(AC) = 1 – P(A)
 Si A y B son eventos cualesquiera, entonces:
P(A  B) = P(A) + P(B) – P(A  B)

Ejercicio 63
Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es de
0,7 y que sea aceptado en el segundo es de 0,4. La probabilidad de que no sea aceptado en ninguno
de los trabajos es de 0,2.
Solución
Sean los eventos:
A: …………………………………………………………………………………………………………………………………………………………
B: …………………………………………………………………………………………………………………………………………………………
Pregunta Notación Diagrama de Venn
P(A ………... B)
Calcule la probabilidad de que sea aceptado en al
menos uno de los trabajos.

Calcule la probabilidad de que solamente sea


aceptado en uno solo de los trabajos.

Calcule la probabilidad de que no sea aceptado


en alguno de los trabajos.

Notas
EPE UPC 125

Probabilidad condicional
Sea  un experimento aleatorio y  el espacio muestral asociado. Sean A, B dos eventos definidos
en . La probabilidad de ocurrencia del evento A sabiendo que el evento B ha ocurrido se denota por
P(A/B) y se llama probabilidad condicional de A dado B:

P A  B
 
P AB 
PB
PB  0

Ejercicio 64
Se seleccionó una muestra aleatoria de trabajadores de la empresa A para determinar sus planes de
jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en:
ejecutivos, empleados y obreros. Los resultados obtenidos fueron:

Título: ………………………………………………………………………………………………………………………………………
Planes después de los 65 años
Trabajador Total
Se jubile (D) No se jubile (E) No ha decidido su jubilación (F)
Ejecutivo (A) 8 3 1
Empleado (B) 20 10 5
Obrero (C) 50 22 11
Total 78 35 130
Fuente: Empresa A

Se selecciona a un trabajador al azar.


a. Si se sabe que no ha decidido sobre su jubilación, calcule la probabilidad que sea obrero.

b. Si se sabe que no es ejecutivo, calcule la probabilidad que se jubile.

Notas
126 CE104 Estadística

Ejercicio 65
En la ciudad A se realizó una encuesta a personas adultas para conocer la opinión que tienen respec-
to a una nueva ley del gobierno local. La siguiente tabla muestra los resultados de la encuesta. Los
entrevistados fueron clasificados según su sexo.
Título: …………………………………………………………………………………………………………………………………………………
Opinión
Total
Sexo A favor En contra Ni a favor no en contra
Masculino 110 290 90 490
Femenino 140 170 150 460
Total 250 460 240 950
Fuente: Municipalidad de la ciudad A

Se selecciona a una persona al azar.


a. Si se eligió a un hombre, calcule la probabilidad que esté en contra de la nueva ley.
b. Si se eligió a una persona a favor de la nueva ley, calcule la probabilidad que sea hombre.
c. Si se eligió a una mujer, calcule la probabilidad que no esté en contra de la nueva ley.
d. Calcule la probabilidad de que esté a favor o en contra de la nueva ley.
Solución
a. Si se eligió a un hombre, calcule la probabilidad que esté en contra de la nueva ley.

b. Si se eligió a una persona a favor de la nueva ley, calcule la probabilidad que sea hombre.

c. Si se eligió a una mujer, calcule la probabilidad que no esté en contra de la nueva ley.

d. Calcule la probabilidad de que esté a favor o en contra de la nueva ley.

Notas
EPE UPC 127

Ejercicio 66
Tarjeta A, es el sistema de lealtad que implementó la cadena de supermercados A, que cuenta con
sucursales en Arequipa, Ica y Trujillo. Gracias al uso de la tarjeta A, la cadena de supermercados A
recibe la información detallada de las compras de sus clientes, creando de esta manera una base de
datos con sus perfiles.

Se desea mejorar el sistema de lealtad, para lo cual se entrevistó a 170 clientes de la cadena de su-
permercados A que poseen la tarjeta A. Se obtuvo la siguiente información.

Sucursal
Total
Nivel de educación Arequipa Ica Trujillo
Escolar 33 26 23 82
Superior 35 20 12 67
Posgrado 12 4 5 21
Total 80 50 40 170
Se elige un cliente al azar.
a. ¿Cuál es la probabilidad de que tenga nivel educativo superior y sea de Trujillo?

b. ¿Cuál es la probabilidad de que sea de Arequipa o tenga posgrado?

c. ¿Cuál es la probabilidad de que tenga un nivel educativo mínimo superior?

d. Calcule la probabilidad de que tenga un nivel educativo superior, si se sabe que es de Trujillo.

Notas
128 CE104 Estadística

Ejercicio 67
Un instituto de investigaciones académicas desea determinar si existe relación entre el interés de un
estudiante en finanzas, su habilidad en matemáticas y su género. Se selecciona una muestra de 200
estudiantes y mediante una prueba se mide su habilidad matemática y su interés en finanzas. Los
resultados fueron los siguientes:

Género
Interés Femenino (A1) Masculino (A2)
Total
en finanzas Habilidad en matemáticas Habilidad en matemáticas
Baja (C1) Media (C2) Alta (C3) Baja (C1) Media (C2) Alta (C3)
Bajo (B1) 25 9 6 35 6 10 91
Medio (B2) 4 22 7 11 21 3 68
Alto (B3) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200

Se selecciona un estudiante al azar.

a. ¿Cuál es la probabilidad de seleccionar un estudiante con un interés alto en finanzas?


b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés
medio en finanzas?
c. ¿Cuál es la probabilidad de que sea hombre o tenga un bajo interés en finanzas?

Solución

a. ¿Cuál es la probabilidad de seleccionar un estudiante con un interés alto en finanzas?


Sea el evento B3: Interés alto en finanzas.
41
PB3    0,205
200

b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés
medio en finanzas?

Sean los eventos:


C3: Habilidad alta en matemáticas
B2: Interés medio en finanzas

P C 3C  B2  4  22  11  21
200
 0,29

c. ¿Cuál es la probabilidad de que sea hombre o tenga un bajo interés en finanzas?

Sean los eventos:


A2: Masculino
B1: Interés bajo en finanzas
P A2  B1   P A2   P B1   P A2  B1 
49  34  22 91 51
P A2  B1      0,725
200 200 200

Notas
EPE UPC 129

Eventos independientes
Dos eventos cualesquiera A y B son independientes si y solo si

P(A  B) = P(A) × P(B)

Ejercicio 68
Si dos eventos A y B son independientes, indique el diagrama de Venn correspondiente.

Ejercicio 69
Una empresa desea establecer dos negocios adicionales, una juguería y una heladería, en dos locales
diferentes. Por experiencias pasadas, se sabe que la probabilidad de que tenga éxito en la juguería es
del 60%, mientras que tenga éxito en la heladería es del 70%. Si podemos considerar a los dos nego-
cios como independientes.
a. Calcule la probabilidad de que tenga éxito solo en un negocio adicional.
b. Calcule la probabilidad de que tenga éxito solo en la juguería.
c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.
d. Calcule la probabilidad de que tenga éxito en al menos uno de los negocios.
Solución
Sean los eventos:
……. : ...……………………………………………………………………….. luego, P(……………) = …………………..
……. : ...……………………………………………………………...……….. luego, P(……………) = …………………..

Se pide:
a. Calcule la probabilidad de que tenga éxito solo en un negocio adicional.
P(……………………) = ……………………………………………………………………………………………………………..
b. Calcule la probabilidad de que tenga éxito solo en la juguería.
P(……………………) = ……………………………………………………………………………………………………………..

c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.


P(……………………) = ……………………………………………………………………………………………………………..

d. Calcule la probabilidad de que tenga éxito en al menos uno de los negocios.


P(……………………) = ……………………………………………………………………………………………………………..

Notas
130 CE104 Estadística

Ejercicio 70
Un tipo de celular falla por tres causas: humedad, caídas y por software. Antes del primer año, la
probabilidad de que falle por humedad es del 8%, por caídas del 13% y por software 5%. Considere
que cada fallo ocurre de manera independiente uno del otro.
a. Calcule la probabilidad de que un celular falle por las tres causas.
b. Calcule la probabilidad de que falle por, como máximo, dos causas
Solución
Sean los eventos:
H: ………………………………………………………………………………………………………………………………………………….
C: ………………………………………………………………………………………………………………………………………………….
S: ………………………………………………………………………………………………………………………………………………….

a. Calcule la probabilidad de que un celular falle por las tres causas.

b. Calcule la probabilidad de que falle por, como máximo, dos causas

Ejercicio 71
Se seleccionó una muestra de 500 personas para determinar información respecto al comportamien-
to de los consumidores. Entre las preguntas formuladas estaba “¿Disfruta comprar ropa?” De 240
hombres, 136 respondieron que sí, mientras que, de las 260 mujeres, 244 respondieron que sí.
Se definen los eventos:
A = El consumidor disfruta comprar ropa
B = El consumidor es hombre
¿Son los eventos A y B independientes?
Solución
Para que los eventos A y B sean independientes se debe cumplir que:
PA B   PA PB
De acuerdo con los datos, se tiene que:
Sexo Sí No Total
Hombre 136 104 240
Mujer 244 16 260
Total 380 120 500
Calculamos:
136 380 240
P A  B    0,272 PA PB    0,3648
500 500 500
Por lo tanto, como PA B   PA PB entonces A y B no son eventos independientes.

Notas
EPE UPC 131

Ejercicio 72
Se quiere lanzar un nuevo producto para la limpieza del hogar, el departamento de marketing tiene
una propuesta de tres productos A, B y C; las compañías fabricantes de estos tres productos indican
que las probabilidades de que los productos presenten algún defecto en su envase es:
 para el producto A de 2%,
 para el producto B de 4%,
 para el producto C es de 3%.
La presencia de defectos es independiente para cada uno de los productos.

Si una persona compra los tres productos.


a. Calcule la probabilidad de que dos de los tres productos tengan defectos.
b. Calcule la probabilidad de que al menos un producto tenga defectos.
c. Calcule la probabilidad de que los tres productos tengan defectos.
Solución
a. Calcule la probabilidad de que dos de los tres productos tengan defectos.

Se define los eventos:


A:= El producto A tiene defecto P(A) = 0,02 ; P(AC) = 0,98
B:= El producto B tiene defecto P(B) = 0,04 ; P(BC) = 0,96
C:= El producto C tiene defecto P(C) = 0,03 ; P(CC) = 0,97

Nos piden calcular la probabilidad de:


P[(A ∩ B ∩ CC) ∪ (A ∩ BC ∩ C) ∪ (AC ∩ B ∩ C)]
Como los eventos son mutuamente excluyentes, se tiene que:
P(A ∩ B ∩ CC) + P(A ∩BC ∩ C) + P(AC∩B ∩ C)]
Como la presencia de los defectos son eventos independientes.
P(A) x P(B) x P(CC) + P(A) x P(BC) x P(C) + P(AC) x P(B) x P(C)
= (0,02 x 0,04 x 0,97) + (0,02 x 0,96 x 0,03) + (0,98 x 0,04 x 0,03) = 0,002528

b. Calcule la probabilidad de que al menos un producto tenga defecto.

Nos piden calcular la probabilidad de:


1 - P[(A ∪ B ∪ C)C]
= 1 - P(AC∩ BC∩ CC)

Como la presencia de los defectos son eventos independientes.


= 1 – P(AC) x P(BC ) x P(CC) = 1 – (0,98 x 0,96 x 0,97) = 0,0874

c. Calcule la probabilidad de que los tres productos tengan defectos.

Nos piden calcular la probabilidad de:


P(A ∩ B ∩ C) = 0,02 x 0,04 x 0,03 = 0,000024

Notas
132 CE104 Estadística

Partición de un espacio muestral


Sean E1, E2, ... , Ek eventos definidos en Ω, tales que:
Ei  Ej = , para todo i  j Todos los eventos disjuntos dos a dos.
E1  E2  ... Ek   La unión de todos los eventos es el espacio muestral.
Entonces, se dice que los eventos E1, E2, ... , Ek definen una partición del espacio muestral Ω.

Diagrama de árbol
Es la representación gráfica de los resultados posibles de la realización de un experimento aleatorio.
Cada parte terminal representa un resultado posible del experimento aleatorio y las probabilidades
se indican en las ramas.

Teorema de la probabilidad total


Sea A un evento cualquiera definido sobre Ω y sea E1, E2,..., Ek una partición del espacio muestral
k
entonces: P A  PA E PE 
i 1
i i

Teorema de Bayes
Sea  un experimento aleatorio, A un evento cualquiera definido sobre Ω y E1, E2, ... , Ek una parti-
ción del espacio muestral Ω, entonces:

P A / E j P E j 
P E j /A   k
para j = 1, 2,…, k
 PA / E PE 
i 1
i i

Notas
EPE UPC 133

Ejercicio 73
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0,35; 0,25 y 0,4. La probabilidad
de que una venta sea por más de 50 dólares, es igual a 0,2 si ésta es en efectivo, es igual a 0,9 si ésta
es con cheque y es igual a 0,6 si ésta es al crédito.
a. Calcule la probabilidad de que una persona compre por más de 50 dólares.
b. Si compra por más de 50 dólares, calcule la probabilidad que la compra se realizó en efectivo.
Solución
Sean los eventos:
E: La compra se realiza con dinero en efectivo
CH: La compra se realiza con cheque
C: La compra se realiza al crédito
M: La compra es por más de 50 dólares

Completamos el diagrama del árbol.

a. ¿Cuál es la probabilidad de que una persona compre por más de 50 dólares?


P...............  ...........................................................................................................

b. Si compra por más de 50 dólares, ¿cuál es la probabilidad de que la compra se haya realizado en
efectivo?
P......./ ......  ............................................................ ............................................

Ejercicio 74
El banco A ha estimado por experiencias anteriores, que el 15% de clientes a los que se les hizo prés-
tamo resultaron morosos. Además, se sabe que:
 el 27% de los clientes morosos utilizaron el préstamo para financiar ampliaciones en la vivienda
 el 68% de los préstamos pagados a tiempo se hicieron para realizar ampliaciones en la vivienda.
Si el día de hoy se hizo préstamo a un cliente, determine:
a. La probabilidad de que dicho préstamo no se utilice para realizar ampliar la vivienda.
b. Si el préstamo se usó para ampliar la vivienda, calcule la probabilidad que el cliente sea moroso.
c. Si el préstamo no se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente no
sea moroso?
Solución
Sean los eventos:
……….... : ………………………………………………………………………………………………………….………..
……….... : …………………………………………………………………………………………………………….……..
……….... : …………………………………………………………………………………………………….……………..
……….... : ………………………………………………………………………………………………….………………..

Notas
134 CE104 Estadística

Elabore el diagrama del árbol.

Se pide calcular:
a. P...............  ...........................................................................................................
b. P......./ ......  ............................................................ ............................................
c. P......./ ......  ............................................................ ............................................

Ejercicio 75
En un estudio, se afirma que el seguro vehicular es el más importante en términos de facturación
anual en el mercado asegurador de riesgos generales. Las participaciones de las empresas del mer-
cado asegurador de vehículos son: Seguros A con 40%, Seguros B con 35%; y otros seguros con 25%.
Se sabe que el porcentaje de siniestros vehiculares (S) registrados el año pasado de cada aseguradora
es: Seguros A es 5%, Seguros B es 8% y otros es 10%.
a. Calcule la probabilidad de que el seguro vehicular registre siniestro el año pasado.
b. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.
Solución

a. Calcule la probabilidad de que el seguro vehicular registre siniestro el año pasado.

b. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.

Notas
EPE UPC 135

Ejercicio 76
Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores. Ac-
tualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% restante
del proveedor 2. La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los
datos históricos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuosa es 0,02 y
la probabilidad de que una pieza del proveedor 2 sea defectuosa es 0,05.
Si seleccionamos al azar una de las piezas adquiridas por la empresa, ¿cuál es la probabilidad de que
sea defectuosa?
Solución
Sean los eventos:
E1 = La pieza proviene del proveedor 1, luego se tiene que P(E1) = 0,65
E2 = La pieza proviene del proveedor 2, luego se tiene que P(E2) = 0,35
A = Pieza defectuosa.
Ac = Pieza no defectuosa.
P(A/E1) = 0,02 y consecuentemente P(Ac/E1) = 0,98.
P(A/E2) = 0,05 y consecuentemente P(Ac/E2) = 0,95.

Luego, el diagrama de árbol correspondiente es:

Entonces, P(A) = P(A/E1) P(E1) + P(A/E2) P(E2) = 0,02 × 0,65 + 0,05 × 0,35 = 0,0305

Ejercicio 77
La empresa de tejidos A se dedica a la fabricación de tejidos de lana de primera calidad. Para la pró-
xima temporada de invierno está elaborando un producto exclusivo que se espera sea todo un éxito.
La empresa A cuenta con tres tipos de máquinas tejedoras A, B y C:
 el tipo A produce el 40% de la producción y un 3% de piezas defectuosas,
 el tipo B produce el 35% de la producción y un 1% de piezas defectuosas,
 el tipo C produce el 25% de la producción y un 2% de piezas defectuosas.
El departamento de control de calidad selecciona un artículo de toda la producción y lo analiza.
a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?
b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido pro-
ducido por las máquinas tipo B o C?
Solución
Se definen los siguientes eventos.
A: un artículo es producido por la máquina tipo A
B: un artículo es producido por la máquina tipo B
C: un artículo es producido por la máquina tipo C
D: Un artículo es defectuoso.
Se tiene que:
P(A) = 0,40; P(B) = 0,35; P(C) = 0,25; P(D/A) = 0,03; P(D/B) = 0,01; P(D/C) = 0,02

Notas
136 CE104 Estadística

a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?


Por el teorema de la probabilidad total.
P(D) = P(A) P(D/A) + P(B) P(D/B) + P(C) P(D/C)
P(D) = (0,4)(0,03) + (0,35)(0,01) + (0,25) (0,02) = 0,0205
Luego, la probabilidad de que un artículo seleccionado al azar sea defectuoso es 0,0205.
b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido pro-
ducido por las máquinas tipo B o C?

P(B ∪ C /D ) = P(A/D ) = 

P A  DC


0 ,4  0 ,97
 0 ,39612
 
C C C C
PD C
1  0 ,0205
Ejercicio 78
Para la empresa tecnológica A, se estima que la probabilidad de hacer un servicio en Lima es de 0,60
y en el interior del país es de 0,40.
Si el servicio es en Lima, la probabilidad de que sea:
 para instalación de equipos es 0,3
 para help desk es 0,6
 para reparación de equipos es 0,1.
Si el servicio es en el interior del país, la probabilidad de que sea:
 para instalación de equipos es 0,5
 para help desk es 0,15
 para reparación de equipos es 0,35.
a. Calcule la probabilidad de que el próximo servicio de la empresa A sea de help desk.
b. Si el servicio contratado no fue de help desk, calcule la probabilidad de que haya sido para Lima.
Solución
Se define los eventos:
L:= Contratan a la empresa para un servicio en Lima
Lc:= Contratan a la empresa para un servicio en el interior del país
I:= Contratan a la empresa para un servicio de instalación de equipo
H:= Contratan a la empresa para un servicio de help desk
R:= Contratan a la empresa para un servicio de reparación de equipo
a. Calcule la probabilidad de que el próximo servicio de la empresa A sea de help desk.

P(I / L) = 0.30 P(I  L) = 0.18

P(L) = 0.60 P(H / L) = 0.60 P(H  L) = 0.36

P(R / L) = 0.10 P(R  L) = 0.06

P(I / L c) = 0.50 P(I  L c) = 0.20

P(L c) = 0.40 P(H / L c) = 0.15 P(H  L c) = 0.06

P(R / L c) = 0.35 P(R  L c) = 0.14


P(H) = 0,36 + 0,06 = 0,42
b. Si el servicio contratado no fue de help desk, calcule la probabilidad de que haya sido para Lima.
P(L / Hc) = (0,18 + 0,06) / (0,18 + 0,06 + 0,20 + 0,14) = 0,24 / 0,58 = 0,4138

Notas
EPE UPC 137

Ejercicio 79
Los clientes acostumbran evaluar en forma preliminar el diseño de sus productos. En el pasado, 95%
de sus productos de gran éxito recibieron críticas favorables, 60% de los productos con éxito mode-
rado recibieron críticas favorables y 10% de los productos sin mucho éxito recibieron críticas favora-
bles. Además, 40% de los productos han sido de gran éxito, 35% han sido de éxito moderado y 25%
han sido productos sin mucho éxito.
a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?
b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño
de gran éxito?
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto
de gran éxito?
Solución
Se define los eventos:
G: El producto ha tenido gran éxito
M: El producto ha tenido éxito moderado
P: El producto ha tenido poco éxito
F: El producto tuvo crítica favorable

P(F  G)=0.40 x 0.95 = 0.380

P(FC  G)=0.40 x 0.05 = 0.02

P(F  M)=0.35 x 0.60 = 0.210


P(M)=0.35

P(FC  M)=0.35 x 0.4 = 0.140

P(F  P)=0.25 x 0.10 = 0.025

P(Fc  P)=0.25 x 0.90 = 0.25

a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?

Usando el teorema de la probabilidad total, se tiene:

P(F) = 0,380 + 0,210 + 0,025 = 0,615

b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño
de gran éxito?
PG  F  0 ,380
PG F     0 ,618
PF  0 ,615
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto
de gran éxito?


P G FC    
P G FC
PF C

0 ,02
1  0 ,615
 0 ,052

Notas
138 CE104 Estadística

Ejercicios propuestos

42. Una importante empresa constructora está financiando la venta de departamentos en una zona
exclusiva de Asia, el 46% de los futuros propietarios solicitaron los servicios de gimnasio y el 54%
los servicios de sauna y el 30% ambos servicios. Con la finalidad de realizar una planificación pa-
ra la provisión de los servicios demandados por los clientes.
a. ¿Cuál es la probabilidad de que un propietario haya solicitado los servicios de gimnasio o
sauna? Rpta: 0,7
b. ¿Cuál es la probabilidad de que un propietario no haya solicitado ni servicio de gimnasio ni
servicio de sauna? Rpta: 0,3
c. ¿Cuál es la probabilidad de que un propietario haya solicitado solo el servicio de gimnasio?
Rpta: 0,16

43. Una empresa de insumos informáticos recibe semanalmente pedidos de uno de sus clientes más
importantes. Se dispone de la siguiente información acerca del tipo de productos que solicita: el
55% de las veces incluye en su pedido el producto A, el 40% de las veces el producto B y en el
30% de los pedidos se solicitan los dos productos. Calcular la probabilidad de que la semana
próxima este cliente solicite:
a. El producto A o el producto B. Rpta: 0,65
b. El producto A y no el B. Rpta: 0,25

44. Debido a la llegada del mundial de futbol, las ventas de televisor plasma han aumentado. Por
ejemplo, en el Cono Norte de Lima, la probabilidad que una familia seleccionada al azar tenga
televisor plasma es 0,8, la probabilidad que tenga televisor LCD es 0,35 y la probabilidad que
tenga ambos tipos de televisores es 0,26.
a. Calcule la probabilidad que tenga televisor plasma o LCD. Rpta: 0,89
b. Calcule la probabilidad de que solo tenga televisor plasma. Rpta: 0,54
c. Calcule la probabilidad que no tenga ni televisor plasma ni LCD. Rpta: 0,11

45. La probabilidad de que la compra de un cliente esté influenciada por alguna red social es de
0,68, la probabilidad de que la compra esté influenciada por la publicidad en televisión es de
0,50 y la probabilidad de su compra esté influenciada por ambos factores es de 0,27.
a. ¿Cuál es la probabilidad de que alguna red social o por la publicidad en televisión?
Rpta: 0,34
b. ¿Qué probabilidad hay de que la próxima compra no esté influenciada por ambos factores?
Rpta: 0,66

46. El jefe de personal de un banco realiza un registro de los accidentes de trabajo en la sucursal
donde se reporta la mayor afluencia de clientes, por lo que los accidentes ocasionados en el
centro de trabajo se presentan en la siguiente tabla:

Sexo Caídas Golpes Lesiones


Hombre 12 28 8
Mujer 10 15 12

Si se elige un trabajador al azar.


a. ¿Cuál es la probabilidad de que sea hombre y que haya sufrido una lesión? Rpta: 0,24
b. ¿Cuál es la probabilidad de que no sea mujer y no haya sufrido una caída? Rpta: 0,42

Notas
EPE UPC 139

47. En una muestra de 2000 hogares de Lima Metropolitana se registró el nivel educativo alcanzado
por el jefe de hogar y el nivel socioeconómico al cual pertenece.
Nivel educativo del jefe Nivel socioeconómico (NSE)
Total
de hogar A B C D E
Ningún nivel alcanzado 0 1 5 120 180 306
Primaria 2 5 200 220 120 547
Secundaria 20 150 300 280 95 845
Superior 78 44 95 80 5 302
Total 100 200 600 700 400 2000
Si se selecciona un hogar al azar, determine la probabilidad de que el jefe de hogar:
a. pertenezca al NSE A o D Rpta: 800/2000
b. tenga como mínimo un nivel educativo primario. Rpta: 1694/2000
c. tenga un nivel educativo secundario y no sea de NSE C. Rpta: 545/2000
d. tenga un nivel educativo primario o pertenezca al NSE D. Rpta: 1027/2000

48. En una encuesta de hogares realizada en la ciudad de Lima se entrevistó 248 hogares. La si-
guiente tabla muestra los hogares clasificados según sus ingresos familiares, tenencia de auto y
tenencia de casa propia.

Hogares con ingresos de $1000 o menos Hogares con ingresos de más de $1000
Con casa propia Sin casa propia Con casa propia Sin casa propia
Con auto 37 14 37 8
Sin auto 48 40 49 15

Si elegimos un hogar encuestado al azar de esta ciudad, calcule la probabilidad de que:


a. tenga casa propia. Rpta: 171/248
b. tenga un ingreso mayor a $1000. Rpta: 109/248
c. tenga un ingreso máximo de $1000 y tenga auto. Rpta: 51/248
d. tenga casa propia o no tenga auto. Rpta: 226/248
e. tenga un ingreso máximo de $1000 y que no tenga casa propia. Rpta: 54/248

49. Una encuesta realizada en universidades privadas entre alumnos de maestría presenta los resul-
tados que se muestran en la siguiente tabla:

Modalidad de Principal motivo para solicitar ingreso a universidad


Total
estudio Calidad de la universidad Costo o comodidad Otros
Tiempo completo 421 393 76 890
Tiempo parcial 400 593 46 1039
Total 821 986 122 1929
Se elige al azar un alumno de maestría en una universidad privada, determine:
a. ¿Cuál es la probabilidad de que sea de tiempo parcial y haya solicitado su ingreso conside-
rando la calidad de la universidad?
b. Si el alumno es de tiempo completo, ¿cuál es la probabilidad de que la calidad de la institu-
ción no sea el motivo principal para elegirla?
c. Sean los eventos: A = Alumno es de tiempo completo, B = El costo o comodidad es el princi-
pal motivo de elección. ¿Son independientes los eventos A y B?

Notas
140 CE104 Estadística

50. Se han llevado a cabo estudios de la planeación de los consumidores para la compra de bienes
duraderos como televisores, refrigeradores, lavadoras, estufas, y automóviles. En uno de los es-
tudios se le preguntó a 1000 individuos elegidos al azar si planeaban comprar una nueva televi-
sión en los siguientes 12 meses. Un año después, se entrevistó a las mismas personas para ver si
realmente hicieron la compra. La respuesta a ambas entrevistas se muestra en la siguiente tabla.

¿Planea comprar TV en los Finalmente compró Finalmente, no compró


siguientes 12 meses? una nueva TV una nueva TV
Sí 200 50
No 100 650

Si de la muestra anterior se selecciona un individuo aleatoriamente:


a. ¿Cuál es la probabilidad de que en el último año haya planeado comprar o finalmente haya
comprado una nueva televisión?
b. Si el encuestado planeó comprar una nueva televisión, ¿cuál es la probabilidad de que final-
mente haya comprado una?
51. Debido al auge de la comunicación en línea, las empresas colocan cada vez más órdenes elec-
trónicas. Una empresa de estudios socioeconómicos ha recopilado información acerca de las ór-
denes llenadas correctamente por cuatro tipos de empresas. Los resultados obtenidos se mues-
tran en la siguiente tabla:
Industria
Orden llenada Farmacéutica Consumo Computadoras Telecomunicaciones
Correctamente 207 136 151 178
Incorrectamente 3 4 9 12

Si elegimos al azar una empresa de los rubros mencionados.


a. ¿Cuál es la probabilidad de que se elija una empresa de consumo y haya solicitado su orden
de manera incorrecta? Rpta: 4/700
b. Si la empresa elegida es de telecomunicaciones, ¿cuál es la probabilidad de que la orden ha-
ya sido llenada de manera correcta? Rpta: 178/190
52. La compañía de investigación de mercado A, realiza un estudio para evaluar la aceptación de un
nuevo producto que se desea lanzar al mercado. Por estudios previos en productos similares, se
pronostica una probabilidad del 78% de que el producto resulte exitoso. Sin embargo, se ha
comprobado que sólo el 65% de los productos que se pronosticaban como exitosos lo fueron
efectivamente, y que de los productos pronosticados como no exitosos por las encuestas, el 13%
resultaron siendo exitosos.
a. ¿Cuál es la probabilidad de que el producto resulte realmente exitoso en el mercado?
Rpta: 0,5356
b. Si el producto no ha resultado exitoso. ¿cuál es la probabilidad de que se haya pronosticado
como tal? Rpta: 0,4121

53. En una empresa el 25% son mujeres y el 75% son hombres. Un día ha llegado tarde a trabajar el
3% de las mujeres y el 5% de los hombres. Si se elige, al azar, a un trabajador que ha llegado tar-
de, calcule la probabilidad de que sea elegida una mujer. Rpta: 0,1667

54. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una
chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma indepen-
dencia entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos
con una de ellas. Rpta: 0,8046

Notas
EPE UPC 141

55. La investigación de mercados es el proceso de recopilación, procesamiento y análisis de infor-


mación, respecto a temas relacionados con el marketing, como: clientes, competidores y mer-
cado. En una compañía hay dos bases de datos sobre clientes, en la primera el 4,1% de los datos
están equivocados, mientras que en la segunda el 3,4% de los datos están equivocados. De la
primera base de datos, se saca el 75% de los datos de los clientes y el 25% restante viene de la
segunda. Si se elige un cliente al azar y sus datos están equivocados, calcule la probabilidad de
que provengan de la segunda base de datos. Rpta: 0,2166
56. Una empresa necesita aportaciones de sus socios para dos proyectos. La probabilidad de que
sus socios aporten para el proyecto de pago anticipado de deuda es 0,3 y que aporten para el
proyecto de expansión de la capacidad productiva es de 0,6; la probabilidad de que aporten pa-
ra ambos proyectos es de 0,08.
a. ¿Cuál es la probabilidad de que los socios solamente aporten para uno de los proyectos?
Rpta: 0,74
b. ¿Cuál es la probabilidad de que los socios aporten para la expansión, si no aportaron para el
pago anticipado de deuda? Rpta: 0,7429
57. Una estudiante debe rendir tres exámenes de cursos diferentes. La probabilidad que apruebe el
examen del curso 1 es 0,67; que apruebe el examen del curso 2 es 0,8 y que apruebe el examen
del curso 3 es 0,75. Asuma, que, lo obtenido en un examen no afecta la nota de otro curso.
a. ¿Cuál es la probabilidad de que apruebe los tres exámenes?
b. ¿Cuál es la probabilidad de que desapruebe todos los exámenes?
c. ¿Cuál es la probabilidad de que apruebe por lo menos un examen?

58. Una institución extranjera no gubernamental está pensando invertir en un proyecto en nuestro
país, las opciones son tres, invertir en un proyecto de agricultura en un 40%, invertir en un pro-
yecto minero en un 35% y el resto de probabilidad se desea invertir en un proyecto de ganade-
ría. Se obtendría apoyo del estado peruano en las probabilidades siguientes: 20%, 25% y 15% en
los proyectos respectivos mencionados anteriormente
a. Si se elige un proyecto al azar ¿cuál es la probabilidad de recibir apoyo del estado?
b. Si no se recibió apoyo del estado, ¿cuál es la probabilidad que la institución no gubernamen-
tal invirtió en un proyecto minero?

59. Un estudio indica que el 35% de consumidores de bebidas rehidratantes son mujeres. Además,
el 12% de mujeres no consume Deporade y el 85% de hombres consume Deporade. Si entre las
consumidoras Deporade se elige a una persona al azar, calcule la probabilidad que sea mujer.

60. El administrador de una tienda de ropa de vestir para caballeros ha recopilado la siguiente in-
formación sobre el número de boletas de pago entregadas a sus clientes por la compra de cami-
sas de manga corta, manga larga y manga tres cuartos durante el primer trimestre del año.
Mes evaluado Manga corta Manga larga Manga tres cuartos
Enero 25 45 43
Febrero 35 25 35
Marzo 29 29 12
Si se elige una boleta al azar, ¿cuál es la probabilidad que haya sido entregada por la venta de una
camisa de manga corta?
a. Si se elige una boleta al azar y ésta fue del mes de febrero, ¿cuál es la probabilidad de que
haya sido por la compra de una camisa de manga corta?
b. Si se elige una boleta al azar y ésta fue por la compra de una camisa de manga larga, ¿cuál es
la probabilidad de que haya sido entregada en el mes de enero?

Notas
142 CE104 Estadística

61. A lo largo de los últimos cuatro años, se ha determinado que el 20% de las compras se han reali-
zado en Econo A, el 30% en Plaza B y el 25% en Tienda C. Se sabe además que el porcentaje de
clientes femeninos es del 90% si son de Econo A, 95% si son de Plaza B, 100% si son de Tienda C
y 90% si son de Todo D. Si se elige un cliente al azar y se determina que es de sexo masculino,
¿cuál es la probabilidad que haya comprado en Plaza B?

62. Una aerolínea desea analizar el comportamiento de los clientes considerando el destino de via-
je, el tipo de cliente y el modo de compra. Dentro de su proceso de creación de reportes, para
ello, ha obtenido la siguiente tabla:

Destino de viaje nacional Destino de viaje internacional


Tipo de Compra Compra por Compra Compra por Total
cliente presencial Internet presencial Internet
Premiun 12 28 38 13 91
Frecuente 8 25 12 23 68
Ocasional 7 15 9 10 41
Total 27 68 59 46 200

a. Calcule la probabilidad de que una persona elegida al azar no compre pasajes por Internet y
tenga un destino de viaje nacional.
b. Si se elige al azar a un cliente ocasional, calcule la probabilidad de que compre pasajes por In-
ternet.

63. La probabilidad que Jorge dispare y de en el blanco es 0,25 y para Luis la probabilidad corres-
pondiente es 0,40. Suponga que Jorge y Luis disparan de forma independiente.
a. ¿Cuál es la probabilidad de que ambos den en el blanco?
b. ¿Cuál es la probabilidad de que solo Jorge de en el blanco?
c. ¿Cuál es la probabilidad de que solo Luis de en el blanco?
d. ¿Cuál es la probabilidad solo uno de en el blanco?
e. ¿Cuál es la probabilidad ninguno de en el blanco?
f. ¿Cuál es la probabilidad al menos uno de en el blanco?

64. Una empresa desea establecer tres negocios adicionales, una juguería, una heladería y una pa-
nadería, en tres locales diferentes. Por experiencias pasadas sabe que la probabilidad de que
tenga éxito en la juguería es del 60%, que tenga éxito en la heladería es del 70% y que fracase en
la panadería es 20%. Si podemos considerar a los tres negocios como independientes.
a. Calcule la probabilidad de que se tenga éxito solo en la juguería.
b. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.
c. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.

Notas
EPE UPC 143

Unidad 4. Variable aleatoria y distribución de


probabilidad

Variable aleatoria
Sea  un experimento aleatorio y  el espacio muestral asociado.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales.
El valor numérico de la variable aleatoria depende del resultado del experimento.
Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras
latinas minúsculas.

Variable Rango o recorrido de Discreta Si el rango está


aletoria una variable aleatoria determinado por un
Una variable conjunto finito o
Se denomina así al infinito numerable de
aleatoria es una conjunto de valores valores.
descripción posibles que puede
numérica del asumir la variable Continua Si el rango está
resultado de un aleatoria X. Se denota determinado por un
experimento. por RX. conjunto infinito no
numerable de valores.

Ejercicio 80
Sea el experimento aleatorio  consistente en lanzar dos monedas, entonces este experimento
determina el espacio muestral Ω = {C1C2, C1S2, S1C2, S1S2}.

Si se define la variable aleatoria X como número de caras obtenidas, entonces el rango o recorrido es
RX = {0, 1, 2}

Ejercicio 81
Sea el experimento aleatorio  consistente en lanzar un dado hasta que salga seis, entonces este
experimento determina el espacio muestral Ω = {(6), (6 C, 6), (6 C, 6C, 6), ...}

Si se define la variable aleatoria X como número de veces que se lanza el dado hasta que salga seis,
entonces el rango o recorrido es RX = {1, 2, 3, …….}

Ejercicio 82
Sea el experimento aleatorio  consistente en registrar el tiempo en que se mete el primer gol de
un partido de fútbol durante los 90 minutos de juego,   x  / 0  x  90 .

Si se define la variable aleatoria X como el tiempo registrado, entonces el rango o recorrido es


RX  x  / 0  x  90.

Notas
144 CE104 Estadística

Variable aleatoria discreta


Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito nume-
rable.
Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se denota
por P(X = x)

Distribución de probabilidad de una variable aleatoria discreta


La distribución de probabilidad de una variable aleatoria discreta X se describe como una función de
probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabilidad de
que X asuma ese valor, esto es:
f(x) = P(X = x)

Toda función de probabilidad debe cumplir que:


 f(x)  0
n
  f x   1
i 1
i

Ejercicio 83
La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X:= número de
cuentas de correo que tiene un estudiante universitario.
x 1 2 3 4
f(x) = P(X = x) 2k + 0,03 0,30 0,40 k
a. Determine el valor de k para que f(x) sea función de probabilidad.
b. Calcule la probabilidad de que un estudiante universitario tenga una cuenta de correo.
c. Calcule la probabilidad de que un estudiante universitario tenga menos de dos cuentas de correo.
d. Calcule la probabilidad de que un estudiante universitario tenga más de una cuenta de correo.
Solución
e. Determine el valor de k para que f(x) sea función de probabilidad.

f. Calcule la probabilidad de que un estudiante universitario tenga una cuenta de correo.

g. Calcule la probabilidad de que un estudiante universitario tenga menos de dos cuentas de correo.

h. Calcule la probabilidad de que un estudiante universitario tenga más de una cuenta de correo.

Notas
EPE UPC 145

Ejercicio 84
Sea el experimento aleatorio  : lanzar una moneda dos veces. Sea la variable aleatoria X: número
de caras obtenidas. Determine y grafique la función de probabilidad.
Solución
El espacio muestral es Ω = {(C1 C2), (C1 S2), (S1 C2), (S1 S2)} . El número de elementos del espacio mues-
tral es 4.
Sea la variable aleatoria X: número de caras obtenidas, entonces el rango de X es RX = {0, 1, 2}
La probabilidad de no obtener cara: f(0) = P(X = 0) = ¼ = 0,25
La probabilidad de obtener una cara: f(1) = P(X = 1) = ¼ + ¼ = 2/4 = 0,50
La probabilidad de obtener dos caras: f(2) = P(X = 2) = ¼ = 0,25
La tabla de función de probabilidad sería:
x 0 1 2
f(x) = P(X = x) 0,25 0,50 0,25
Esta tabla cumple con las siguientes condiciones:
 f(x)  0 Cada probabilidad es positiva y mayor o igual que cero
n
  f x   1
i 1
i La suma de todas las probabilidades es igual a uno

Ejercicio 85
La distribución de probabilidad de la variable aleatoria X definida como el número de defectos por
cada 10 metros de una tela sintética en rollos continuos de ancho uniforme, es:
x 0 1 2 3 4
f(x) = P(X = x) 0,41 0,37 k 0,05 0,01
a. Determine la constante k.
b. Calcule las siguientes probabilidades: PX  3 ; PX  1 X  3 y P1  X  4 
Solución
a. Determine la constante k.
4
Para hallar la constante k, usamos la condición que  f x   1
i 1
i

 f x   f 0  f 1  f 2  f 3  f 4  1 , por lo tanto, k = 0,16


i 0
i

b. Calcule las siguientes probabilidades.


P X  3  f 4   0,01
P  X  2 f 2 0,16
PX  1 X  3     0,1702
P X  3) f 0  f 1  f 2 0,41  0,37  0,16
P1  X  4  f 2  f 3  f 4  0,16  0,05  0,01  0,22

Notas
146 CE104 Estadística

Valor esperado de una variable aleatoria discreta


El valor esperado o esperanza matemática de una variable aleatoria X o media de una distribución de
probabilidad de X se denota E(X).
n
 X  E X    xi f xi   x1 f x1  x2 f x2   ...  xn f xn 
i 1

Propiedades del valor esperado


Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:

 E(k) = k
 E(aX + b) = a E(X) + b

Varianza de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X con distribución de probabilidad f(x) se calcula
por:
 
V X   E X 2  E X 2
La varianza de la variable aleatoria X, V(X), también se denota por  X , o simplemente como  2 .
2

Propiedades de la varianza
Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:
 V(k) = 0
 V(aX+b) = a2V(X)

Desviación estándar de una variable discreta


Se denota por  o DE(X). Sea X una variable aleatoria discreta con función de probabilidad f(x). La
desviación estándar de X es dada por la siguiente expresión:
  V( X )

Ejercicio 86
La solicitud de préstamo que presentan los clientes de un banco está compuesta por cinco rubros. El
gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros recha-
zados por cada solicitud. La siguiente tabla muestra la distribución de probabilidad de la variable
aleatoria X definida como el número de rubros rechazados por solicitud.
x 0 1 2 3 4 5
f(x) 0,79 2k k 0,03 0,02 0,01

a. Determine la constante k y grafique la función f(x)


b. Calcule la probabilidad de que una solicitud tenga dos rubros rechazados.
c. Calcule la probabilidad de que una solicitud tenga más de un rubro rechazado.
d. Calcule la probabilidad de que tenga más de uno, pero menos de cuatro rubros rechazados.
e. Calcule la probabilidad de que un cliente tenga a lo más tres rubros rechazados si se sabe que
esta cantidad es mayor a uno.
f. Calcule el número esperado de rubros rechazados.
g. Calcule el coeficiente de variación de la variable aleatoria X.

Notas
EPE UPC 147

Solución
a. Determine la constante k y grafique la función f(x)

x 0 1 2 3 4 5
f(x) 0,79 0,03 0,02 0,01

1.0
0.8
0.6
f(x)

0.4
0.2
0.0
0 1 2 3 4 5
X

b. Calcule la probabilidad de que una solicitud tenga dos rubros rechazados.


P(…………………………) = ………………………………………………………………………………………………

c. Calcule la probabilidad de que una solicitud tenga más de un rubro rechazado.


P(…………………………) = ………………………………………………………………………………………………

d. Calcule la probabilidad de que tenga más de uno, pero menos de cuatro rubros rechazados.
P(…………………………) = ………………………………………………………………………………………………

e. Calcule la probabilidad de que un cliente tenga a lo más tres rubros rechazados si se sabe que
esta cantidad es mayor a uno.
P(…………………………) = ………………………………………………………………………………………………
f. Calcule el número esperado de rubros rechazados.

g. Calcule el coeficiente de variación de la variable aleatoria X.

Notas
148 CE104 Estadística

Ejercicio 87
El director del diario A está interesado en conocer la distribución del número de errores ortográficos
en el diario. Para lo cual, se seleccionaron diversos textos publicados y se registró el número de erro-
res ortográficos por texto. Se definió la variable aleatoria X:= número de errores ortográficos por
texto y el siguiente cuadro muestra la función de probabilidad de X.

x 0 1 2 3 4
f(x) 0,65 0,25 0,05 0,03 0,02

Se selecciona un texto al azar.


a. Calcule la probabilidad de que se encuentre un error ortográfico.
b. Calcule la probabilidad de que, se encuentre más de un error ortográfico.
c. Calcule la probabilidad de que, se encuentre como máximo dos errores ortográficos.
d. Calcule e interprete el valor esperado de la variable aleatoria X.
e. Calcule la probabilidad de que se tenga un número de errores mayor al valor esperado de X.
Solución
a. Calcule la probabilidad de que se encuentre un error ortográfico.

b. Calcule la probabilidad de que, se encuentre más de un error ortográfico.

c. Si en las primeras palabras del texto se encontró un error, calcule la probabilidad de que se en-
cuentre un error ortográfico más en ese texto.

d. Calcule e interprete el valor esperado de la variable aleatoria X.

e. Calcule la probabilidad de que se tenga un número de errores mayor al valor esperado de X.

Notas
EPE UPC 149

Ejercicio 88
El año pasado Óleo A entró al mercado peruano de envases para aceites comestibles. El jefe de con-
trol de calidad analiza un lote 500 envases y determinó el número de defectos por envase. En la si-
guiente tabla se muestra la distribución de envases según el número de defectos identificados.

Número de defectos por envase 0 1 2 3 4


Número de envases 320 130 30 15 5

Sea la variable aleatoria X:= número defectos por envase para aceite comestible.
a. Construya la función de distribución de probabilidad para la variable aleatoria X.
b. Si se selecciona un envase al azar, calcule la probabilidad de que presente más de un defecto.
c. Calcule e interprete el valor esperado de la variable aleatoria X.
d. Determine el coeficiente de variación de la variable aleatoria X.
e. Calcule la probabilidad de que al seleccionar un envase al azar este presente por lo menos dos
defectos, si se sabe que al menos tiene un defecto por envase.
Solución
a. Construya la función de distribución de probabilidad para la variable aleatoria X.

X: = número de defectos por envase 0 1 2 3 4


f(x) = P(X = x) 320/500 130/500 30/500 15/500 5/500

X: = número de defectos por envase 0 1 2 3 4


f(x) = P(X = x) 0,64 0,26 0,06 0,03 0,01

b. Si se selecciona un envase al azar, calcule la probabilidad de que presente más de un defecto.


P(X > 1) = P(X = 2) + P(X = 3) + P(X = 4) = 0,06 + 0,03 + 0,01 = 0,1

c. Calcule e interprete el valor esperado de la variable aleatoria X.


4
E X    xf x   0 x 0,64 + 1 x 0,26 + 2 x 0,06 + 3 x 0,03 + 4 x 0,01 = 0,510
x 0
Interpretación: El número de defectos está alrededor 0,510 defectos por envase.

d. Determine el coeficiente de variación de la variable aleatoria X.

Primero calculemos la varianza.


4
V X   x
x 0
2
f x   0 ,512  02  0 ,64  12  0 ,26  22  0 ,06  32  0 ,03  42  0 ,01  0 ,512  0 ,6699

Ahora, calculemos el coeficiente de variación.


X 0 ,6699 0 ,818474
CV   100%   100%   100%  160,485%
X 0 ,510 0 ,510

e. Calcule la probabilidad de que al seleccionar un envase al azar este presente por lo menos dos
defectos, si se sabe que al menos tiene un defecto por envase.
P  X  2 f 2  f 3  f 4  0 ,1
P X  2 / X  1     0 ,278
P X  1 f 1  f 2  f 3  f 4  0 ,36

Notas
150 CE104 Estadística

Ejercicio 89
La empresa de muebles A, para garantizar la calidad y el acabado del mobiliario, decidió analizar un
lote de 900 sillas giratorias y registró el número de fallas por silla giratoria. En el siguiente cuadro, se
muestra la distribución de defectos que presenta las sillas giratorias que pasaron por el control de
calidad.

Número de defectos por silla 0 1 2 3 4


Número de sillas por lote 400 280 160 40 20

Sea la variable aleatoria X = número de defectos por silla.

a. Construya la función de distribución de probabilidad de X.


b. Calcule e interprete el valor esperado de la variable aleatoria X.
c. Determine el coeficiente de variación de X.
d. Calcule la probabilidad de que al seleccionar una silla giratoria al azar ésta presente más de tres
defectos, si se sabe que al menos tiene dos defectos por silla.

Solución
a. Construya la función de distribución de probabilidad

Número de piezas defectuosas 0 1 2 3 4


Número de unidades por lote 0,4444 0,3111 0,1778 0,0444 0,0222

b. Calcule e interprete el valor esperado de la variable aleatoria.


4
E X    xf x   0  0 ,4444 1 0 ,3111 2  0 ,1778 3 0 ,0444 4  0 ,0222 0 ,8889
x 0

c. Determine el coeficiente de variación

Primero calculemos la varianza.


4
V X   x
x 0
2
f x   0,88892

 0  0,4444 12  0,3111 2 2  0,1778 32  0,0444 4 2  0,0222 0,88892  0,9877


2

Ahora, calculemos el coeficiente de variación.


 0 ,9876 0 ,9938
CV  X  100%   100%   100%  111,8%
X 0 ,8889 0 ,8889

d. Calcule la probabilidad de que al seleccionar una silla giratoria al azar ésta presente más de tres
defectos, si se sabe que al menos tiene dos defectos por silla.

P  X  3  P  X  2 P  X  4  f 4 
P  X  3 / X  2   
P  X  2 P  X  2 f 2  f 3  f 4 
0,0222
  0,0909
0,1778 0,0444 0,0222

Notas
EPE UPC 151

Ejercicio 90
Cerámicas A comercializa las piezas de cerámicas en cajas de 16 unidades. Luego de la venta y de
acuerdo a las devoluciones realizadas por los propios clientes ha podido determinar el número de
cajas devueltas de las últimas 400 cajas vendidas. La información se muestra a continuación.

x 0 1 2 3 4
f(x) = P(X = x) 0,500 0,250 0,125 0,0625 0,0625

Sea la variable aleatoria X:= número de piezas de cerámicas defectuosas por caja de 16 unidades.

a. Calcule e interprete el valor esperado de la variable aleatoria


b. Determine el coeficiente de variación.
c. Calcule la probabilidad de que al seleccionar una caja al azar, ésta contenga más de 2 piezas de-
fectuosas, si se sabe que al menos tiene una pieza defectuosa por caja.

Solución
a. Calcule e interprete el valor esperado de la variable aleatoria.

4
E X    xf x   0  0 ,5  1 0 ,25  2  0 ,125 3  0 ,625 4  0 ,625  0 ,9375
x 0

Estos cálculos se pueden hacer con la mayoría de calculadoras.

b. Determine el coeficiente de variación.

Primero calculemos la varianza.


4
V X   x
x 0
2
f x   0 ,93752

 0  0 ,5  12  0 ,25  22  0 ,125 32  0 ,625 42  0 ,625  0 ,93752  1 ,4336


2

Ahora, calculemos el coeficiente de variación.


 1 ,4336 1 ,1973
CV  X  100%   100%   100%  127,712%
X 0 ,9375 0 ,9375

c. Calcule la probabilidad de que al seleccionar una caja al azar, ésta contenga más de dos piezas
defectuosas, si se sabe que al menos tiene una pieza defectuosa por caja.

P A  B 
Usamos la definición de probabilidad condicional, P A B 
PB

P  X  2   X  1 P  X  2 f 3  f (4)


P  X  2 / X  1   
P  X  1 P  X  1 f 1  f 2  f 3  f (4)
0,0625 0,0625 0,125
   0,250
0,250  0,125 0,625 0,625 0,500

Notas
152 CE104 Estadística

Ejercicio 91
Los negocios han de tomar en cuenta que abrir un perfil en las redes sociales no significa solamente
hablar de tu empresa, de tus productos o servicios, es vital la elaboración de una estrategia adecuada
a sus necesidades en la que se determine el público al que se quiere alcanzar mediante estos medios.
Sea la variable aleatoria X:= número de veces que actualiza su perfil a la semana, cuya función de
probabilidades es la siguiente.
0.30
6k
0.25
0.2
Probabilidad

0.20 0.16
0.14
0.15 0.12
0.1
0.10
k
0.05

0.00
1 2 3 4 5 6 7
Número de veces que actualiza su perfil
a. Obtenga el valor de k y complete la tabla de distribución de probabilidades.
b. Calcule PX  2 / X  6
c. Se dice que si el coeficiente de variación de la variable aleatoria X es mayor o igual al 15% enton-
ces la distribución de probabilidades es heterogénea. ¿Esta distribución es heterogénea?
d. Si cada actualización del perfil demora 35 minutos, calcule e interprete el tiempo que se espera
dedicar a la actualización del perfil a la semana.
Solución
a. En base a la información mostrada en el gráfico, obtenga el valor de k y complete la tabla de dis-
tribución de probabilidades.
Como es una función de probabilidad, la suma de todas las f(x) debe ser igual a 1, luego k = 0,05.
Por tanto, la tabla de distribución de probabilidades será:
x 1 2 3 4 5 6 7
f(x) 0,04 0,12 0,2 0,24 0,14 0,16 0,10

b. Calcule PX  2 / X  6
P2  X  6 0 ,12  0 ,2  0 ,24  0 ,14 0 ,70
PX  2 / X  6     0 ,9459
PX  6 0 ,74 0 ,74
c. Se dice que si el coeficiente de variación de la variable aleatoria X es mayor o igual al 15% enton-
ces la distribución de probabilidades es heterogénea. ¿Esta distribución es heterogénea?
 1,6371
CV   100%   100%  39,98%
 4,2
Como el coeficiente de variación es mayor a 15%, diremos que la distribución es heterogénea.

d. Si cada actualización del perfil demora 35 minutos, calcule e interprete el tiempo que se espera
dedicar a la actualización del perfil a la semana.
x 1 2 3 4 5 6 7
Tiempo, en minutos 35 70 105 140 175 210 245
f(x) = P(X = x) 0,04 0,12 0,2 0,24 0,14 0,16 0,1
E T   E 35X   35 E X   35 4 ,2  147 minutos

Notas
EPE UPC 153

Distribuciones discretas especiales

Distribución binomial

Un experimento binomial consiste en una serie de n


pruebas o ensayos, donde n se fija antes de realizar el
experimento.

Las pruebas son idénticas y Las pruebas son


cada una de ellas puede independientes entre sí por lo La probabilidad de éxito es
resultar en uno de dos posibles que el resultado de un intento constante de una prueba a otra
resultados que denotan éxito o en particular no influye en el y la denotamos como p.
fracaso. resultado de cualquier otro.

Entonces, si se tiene un experimento binomial con n intentos y la probabilidad p de éxito en cual-


quier intento, la probabilidad de tener x éxitos en los n intentos está dada por:
f x   PX  x   C xn p x 1  pnx x = 0, 1, 2,... , n

Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p y se denota
por X ~ B (n, p)
Características
 Es simétrica si p = 0,5. Para valores de p < 0,5 la distribución tiene sesgo derecho y para valores
p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.
 Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores rele-
vantes de probabilidad, la distribución es prácticamente simétrica.

El esperado de una variable binomial es   E  X   np


La varianza de una variable binomial es  2  V X   np1  p

En Excel, use la función =DISTR.BINOM.N(Núm_éxito, Ensayos, Prob_éxito, acumulado)


Por ejemplo, si X ~ B (n = 20, p = 0,3)
P(X = 4) =DISTR.BINOM.N(4, 20, 0.3, 0) = f(4)
P(X ≤ 4) =DISTR.BINOM.N(4, 20, 0.3, 1) = f(0) + f(1) + f(2) + f(3) + f(4)
P(X > 4) =1 - DISTR.BINOM.N(4, 20, 0.3, 1) = f(5) + f(6) + … + f(20) =1- (f(0) + f(1) + f(2) + f(3) + f(4))

Notas
154 CE104 Estadística

Ejercicio 92
La probabilidad de obtener éxito en una tienda de jugos por franquicia es igual a 0,4. Una empresaria
está interesada en invertir en cinco de estas tiendas. El éxito de cada negocio se considera indepen-
diente.

a. Calcule la probabilidad que el empresario tenga éxito en una tienda. Defina la variable necesaria
e indique su distribución, parámetros y rango o recorrido.
b. Calcule la probabilidad que el empresario tenga éxito en, como máximo, una tienda.
c. Calcule la probabilidad que el empresario tenga éxito en más de dos tiendas.
d. Determine el valor esperado (media) del número de tiendas con éxito.
e. Calcule la probabilidad que el número de tiendas con éxito sea mayor a su valor esperado.
Solución
a. Calcule la probabilidad que el empresario tenga éxito en una tienda. Defina la variable necesaria
e indique su distribución, parámetros y rango o recorrido.

Definamos la variable aleatoria X:= número de ……………….………………..………………………………..


Rango o recorrido RX = {………………………………..………………………………………..}
Distribución y parámetros X  B (n = …………..……….……., p = ………….…………..……….)

La probabilidad solicitada será P(X = ………….) = ………………………

En Excel, use la función =DISTR.BINOM.N(………….., ………….., ………….., …………..)

b. Calcule la probabilidad que el empresario tenga éxito en, como máximo, una tienda.

La probabilidad solicitada será P(X ………..………….) = ………………………

En Excel, use la función =DISTR.BINOM.N(………….., ………….., ………….., …………..)

c. Calcule la probabilidad que el empresario tenga éxito en más de dos tiendas.

La probabilidad solicitada será P(X ………..………….) = ………………………

En Excel, use la función =DISTR.BINOM.N(………….., ………….., ………….., …………..)

d. Determine el valor esperado (media) del número de tiendas con éxito.

E(X) = ………………………….. = ………………………….. = …………………………..

e. Calcule la probabilidad que el número de tiendas con éxito sea mayor a su valor esperado.

Notas
EPE UPC 155

Ejercicio 93
La empresa A, especialista en proyectos de inversión, tiene en cartera 10 proyectos elaborados y
expeditos para ser sometidos a la evaluación de concursos de licitación pública. Por su experiencia, el
gerente sabe que el 20% de los proyectos ganan la buena pro. En un concurso de licitación pública se
presentan estos diez proyectos e interesa saber la distribución del número de proyectos ganadores.
a. Calcule la probabilidad de que dos proyectos ganen la licitación.
b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.
c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación.
d. Si en cierto momento ya han ganado más de dos proyectos, calcule la probabilidad de que a lo
más seis proyectos ganen la licitación.
e. Calcule la media y desviación estándar de X.
Solución
Definamos la variable aleatoria X:= número de ……………….………………..………………………………..
Rango o recorrido RX = {………………………………..………………………………………..}
Distribución y parámetros X  B (n = …………..……….……., p = ………….…………..……….)

a. Calcule la probabilidad de que dos proyectos ganen la licitación.

La probabilidad pedida será P(X ………..………….) = ………………………

En Excel, use la función =DISTR.BINOM.N(………….., ………….., ………….., …………..)

b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.

La probabilidad pedida será P(X ………..………….) = ………………………

En Excel, use la función =DISTR.BINOM.N(………….., ………….., ………….., …………..)

c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación.

La probabilidad pedida será P(X ………..………….) = ………………………

En Excel, use la función =DISTR.BINOM.N(………….., ………….., ………….., …………..)

d. Si en cierto momento ya han ganado más de dos proyectos, calcule la probabilidad de que a lo
más seis proyectos ganen la licitación.

e. Calcule la media y desviación estándar de X.

Notas
156 CE104 Estadística

Ejercicio 94
En el proceso de control de calidad se analiza 60 envases de los productos de Expórtame. Por investi-
gaciones anteriores se sabe que la probabilidad de que un envase esté en mal estado es de 0,01.
a. Se rechazarán los 60 productos si la probabilidad de seleccionar más de dos envases en mal esta-
do es mayor al 30%, ¿qué decisión se debe de tomar?
Solución
Lo primero es definir la variable que nos permitirá resolver el problema.
Definamos la variable X:= número de envases en mal estado.

La variable X se tiene una distribución binomial con parámetros: n= número de ensayos = 60 y p =


probabilidad de éxito = 0,01.

El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 60. Enton-
ces, X  B(n = 60; p = 0,01)
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)

= 1 − 𝐶060 0,010 0,9960 + 𝐶160 0,011 0,9959 +𝐶260 0,012 0,9958 = 0,0224

Como la probabilidad pedida es menor al 30%, entonces los productos no serán rechazados.

b. Calcule el valor esperado y varianza del número envases en mal estado.


Solución
E(X) = n p = 60 x 0,01 = 0,6
V(X) = n p (1-p) = 60 x 0,01 x (1 – 0,01) = 0,594

Ejercicio 95
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al
azar 80 usuarios.

a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexio-
nes. Defina la variable, indique su distribución, parámetros y rango.
Solución
Sea X = cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la muestra
X  B(n = 80; p = 0,12)
El rango de X es Rx = {0,1,…,80}

P(8 ≤ X ≤ 9) = f(8) + f(9) = 0,2623

b. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560 mil
usuarios. Calcule el valor esperado y varianza de Y.
Solución
Y  B(n = 560 000; p = 0,12)
E(Y) = np = 560 000 x 0,12 = 67 000.
V(Y) = np(1-p) = 59 136

Notas
EPE UPC 157

Distribución de Poisson
El experimento que El número de resultados que ocurre en un intervalo o región de espacio
origina una cualquiera es independiente del número que ocurre en cualquier otro intervalo o
variable aleatoria región del espacio disjunto.
que sigue una
distribución de
Poisson se
denomina proceso La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o
de Poisson y posee región muy pequeña es proporcional a la longitud del intervalo o al tamaño de la
las siguientes región y no depende del número de resultados que ocurren fuera del intervalo o
propiedades: región.

La probabilidad de que ocurra más de un resultado en tal intervalo corto o caiga


en tal región pequeña es insignificante.

La probabilidad de tener x resultados en un intervalo dado o en una región específica es:


e   x
f x   , donde RX = 0, 1, 2, 3,…
x!
x = número de éxitos por unidad de tiempo o región.
 = número esperado de éxitos por unidad de tiempo o región o razón promedio de ocurrencia.
t = periodo de evaluación
e = 2,71828…

 Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro .
 Se denota X ~ P()
 Siempre es una distribución sesgada a la derecha. A medida que  aumenta y tomando en cuenta
sólo los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.
 El esperado de una variable Poisson es   E X   
 La varianza de una variable Poisson es  2  V X   

En Excel, use la función =POISSON.DIST(x, media, acumulado)

Por ejemplo, si X ~ P ( = 6)
P(X = 4) = POISSON.DIST(4, 6, 0) = f(4)
P(X ≤ 4) =POISSON.DIST (4, 6, 1) = f(0) + f(1) + f(2) + f(3) + f(4)
P(X > 4) =1 - POISSON.DIST(4, 6, 1) = f(5) + f(6) + f(7) + … = 1 – (f(0) + f(1) + f(2) + f(3) + f(4))

Notas
158 CE104 Estadística

Ejercicio 96
El número de clientes que llega a una agencia del banco A se modela con una variable Poisson con
una media de tres clientes por minuto.
a. Calcule la probabilidad de que, en un minuto, lleguen exactamente cuatro personas.
b. Calcule la probabilidad de que, en un minuto, lleguen a lo más cuatro personas.
c. Calcule la probabilidad de que, en un minuto, lleguen más de cinco personas.
d. Calcule la probabilidad de que en dos minutos lleguen como mínimo dos y como máximo cuatro
personas a la agencia.
e. Calcule la probabilidad de que en tres minutos lleguen como mínimo cinco personas a la agencia.
Solución
a. Calcule la probabilidad de que, en un minuto, lleguen exactamente cuatro personas. Defina la
variable aleatoria, rango y distribución.

Definamos la variable aleatoria X:= número de ……..……………………….…..………………………………..


Rango o recorrido RX = {………………………………..………………………………………..}
Distribución y parámetros X  P(  =…………..……….…….)

La probabilidad pedida es P(X = ………..…….) = ………………………


En Excel, use la función = POISSON.DIST(………….…….., ………….…….., ………….……..)

b. Calcule la probabilidad de que, en un minuto, lleguen a lo más cuatro personas.

La probabilidad pedida es P(X ………………….) = ………………………


En Excel, use la función = POISSON.DIST(………….…….., ………….…….., ………….……..)

c. Calcule la probabilidad de que, en un minuto, lleguen más de cinco personas.

La probabilidad pedida es P(X …..……….) = ………………………


En Excel, use la función = POISSON.DIST(………….…….., ………….…….., ………….……..)

d. Calcule la probabilidad de que en dos minutos lleguen como mínimo dos y como máximo cuatro
personas a la agencia.

e. Calcule la probabilidad de que en tres minutos lleguen como mínimo cinco personas a la agencia.

Notas
EPE UPC 159

Ejercicio 97
El número de llamadas que llegan a una central telefónica se modela con una variable Poisson con
una media de 1,2 llamadas por segundo.
a. Calcule la probabilidad de que, en un segundo, llegue exactamente una llamada.
b. Calcule la probabilidad de que, en un segundo, lleguen a lo más dos llamadas.
c. Calcule la probabilidad de que, en un segundo, lleguen más de tres llamadas.
d. Calcule la probabilidad de que, en dos segundos, llegue alguna llamada.
e. Si en los primeros instantes de un segundo llegó una llamada, calcule la probabilidad de que, den-
tro de ese segundo, lleguen una llamada más.
Solución
a. Calcule la probabilidad de que, en un segundo, llegue exactamente una llamada. Defina la varia-
ble aleatoria, rango y distribución.

Definamos la variable aleatoria X:= número de ……..……………………….…..………………………………..


Rango o recorrido RX = {………………………………..………………………………………..}
Distribución y parámetros X  P(  =…………..……….…….)

La probabilidad pedida es P(X = ………..…….) = ………………………


En Excel, use la función = POISSON.DIST(………….…….., ………….…….., ………….……..)

b. Calcule la probabilidad de que, en un segundo, lleguen a lo más dos llamadas.

La probabilidad pedida es P(X ………………….) = ………………………


En Excel, use la función = POISSON.DIST(………….…….., ………….…….., ………….……..)

c. Calcule la probabilidad de que, en un segundo, lleguen más de tres llamadas.

La probabilidad pedida es P(X ……………….) = ………………………


En Excel, use la función = POISSON.DIST(………….…….., ………….…….., ………….……..)

d. Calcule la probabilidad de que, en dos segundos, llegue alguna llamada.

e. Si en los primeros instantes de un segundo llegó una llamada, calcule la probabilidad de que, den-
tro de ese segundo, lleguen una llamada más.
f.

Notas
160 CE104 Estadística

Ejercicio 98
Entre las 10:00 am. y 11:00 am. en promedio ocho personas hacen uso de un cajero automático,
ubicado al lado de la puerta de entrada de un banco. Asimismo, el número de clientes que ingresan
al banco entre las 10:00 am. y 11:00 am. en promedio es 15 clientes. Considere que el número de
clientes que hacen uso del cajero es independiente del número de clientes que ingresan al banco y
ambos siguen un proceso de Poisson.
a. ¿Cuál es la probabilidad de que más de 8 pero menos de 10 usen el cajero en ese horario?
b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de
tres clientes?
Solución

a. ¿Cuál es la probabilidad de que menos de 10 pero más de 8 usen el cajero en ese horario?

Definamos la variable aleatoria


X = Número de clientes que hacen uso del cajero entre las 10 y 11 am.
X  P( = 8)

La probabilidad pedida es P(8 < X < 10) = P(X = 9) = 0,1241

En Excel, use la función =POISSON.DIST(9, 8, 0)

b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de
tres clientes?

Definamos la variable aleatoria:


Y = Número de clientes que ingresan al banco entre las 10 y 10:30 am.
Y  P( = 7,5)

La probabilidad pedida es P(Y < 3) = P(Y ≤ 2) = 0,0203

En Excel, use la función =POISSON.DIST(2, 7.5, 1)

Notas
EPE UPC 161

Distribuciones continuas especiales

Distribución normal
Es la distribución más importante de probabilidad para describir una variable aleatoria continua. Esta
tiene una gran variedad de aplicaciones prácticas en las que las variables aleatorias son altura y peso
de personas, puntuaciones de exámenes, mediciones científicas, etc.

La distribución normal fue desarrollada por primera vez por el matemático francés Abraham de Moi-
vre en un artículo del año 1733 y sus resultados fueron ampliados por Laplace (1812). Algunos auto-
res atribuyen un descubrimiento independiente al matemático alemán Gauss.

Función de densidad
2
1  x  
1   
f x   e 2  
 2

Características
La variable aleatoria X sigue una distribución normal con parámetros: media  y varianza 2.
Se denota X  N (, 2)

La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia
central coinciden.

El rango de la variable normal es toda la recta real, esto es, de – a + .

En Excel, use las siguientes funciones:


 P(X ≤ x) =DISTR.NORM.N(x; media; desviación estándar; acumulado)
 k = INV.NORM(α, media, desviación estándar), tal que P(X ≤ k) = α
Por ejemplo, si X  N ( = 50, 2 = 400)
 P(X ≤ 60) =DISTR.NORM.N(60; 50; 20; 1) = 0,69146
 Calcular k tal que P(X ≤ k) = 0,95. k = INV.NORM(0.95; 50; 20) = 82,897

Estandarización
Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1).
Se trabaja con la distancia entre x y  en función de la desviación estándar, tal como se muestra.
X 
Z

Notas
162 CE104 Estadística

Ejercicio 99
El consumo mensual de energía eléctrica, en kilowatts, de una ciudad tiene distribución normal con
media de 140 KW, con una varianza de 400 KW2.
Solución
La variable en estudio es …...……………………………………………………………………………………………………….……..

Sus parámetros son:  = …………………………..………. y 2 = ……………………………………..…….

a. ¿Cuál es la probabilidad que un hogar tenga un consumo menor de 150 KW?

P(X < ……….……………) = …………………………………………………..

En Excel, use la función =DISTR.NORM.N(……..…...., ………….., …………..., ……..…...)

b. ¿Cuál es la probabilidad que un hogar tenga un consumo mayor a 130 KW?

P(X > ……….……………) = …………………………………………………..

En Excel, use la función =DISTR.NORM.N(……..…...., ………….., …………..., ……..…...)

c. ¿Qué porcentaje de hogares registran un consumo entre 115 y 160 KW?

P(……….……….……………) = …………………………………………………..

En Excel, use la función =DISTR.NORM.N(……..…...., ………….., …………..., ……..…...)

d. Calcule el consumo mínimo de energía eléctrica para pertenecer al 15% de los mayores consumi-
dores.

El percentil a calcular es ……………. cuyo valor es ……………………

k = INV.NORM(…….……..…, …….……..…, …….……..…)

e. Calcule el consumo máximo de energía eléctrica para pertenecer al 25% de los menores consumi-
dores.

El percentil a calcular es ……………. cuyo valor es ……………………

k = INV.NORM(…….……..…, …….……..…, …….……..…)

Notas
EPE UPC 163

Ejercicio 100
La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable alea-
toria que tiene una distribución normal con una media igual a 460 soles y una desviación estándar
igual a 50 soles.
Solución
La variable en estudio es …...…………………………………………………………………….……..
La distribución de X  N( = ……………………… ;  2 = ……………………….)

a. Calcule la probabilidad de que un cliente ahorre menos de 480 soles en un mes.

b. Calcule la probabilidad de que un cliente ahorre más de 500 soles mensuales.

c. Calcule la probabilidad que el ahorro mensual de un cliente esté entre 460 y 520 soles.

d. Si se sabe que una persona está en el grupo de los que ahorró más de 450, calcule la probabilidad
que su ahorro mensual sea menor a 600 soles.

e. ¿Cuál es el ahorro mínimo para estar en el 10% de los clientes que más ahorran?

f. ¿Cuál es el ahorro máximo para estar en el 25% de los clientes que menos ahorran?

Notas
164 CE104 Estadística

Ejercicio 101
Una máquina que expende bebidas ligeras está regulada de modo que descarga un promedio de 200
ml por vaso. Si la cantidad descargada por esta máquina tiene distribución normal con desviación
estándar 15 ml.
a. ¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?
b. ¿Cuál es la probabilidad que un vaso contenga entre 191 y 209 ml?
c. ¿Cuál es la cantidad máxima descargada por esta máquina en un vaso para poder considerarlo
dentro del grupo del 30% con menores contenidos?
Solución
Sea X:= cantidad descargada por la máquina de bebidas (en ml), entonces:

X ~ N   200 ;  2  152 
a. ¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?
P X  224  1  P X  224 =1 - 0,9452 = 0,0548. El 5,48% de los vasos contendrá más de 224 ml.

b. ¿Cuál es la probabilidad que un vaso contenga entre 191 y 209 ml?

P191  X  209  PX  209  PX  191 = 0,7257 – 0,2743 = 0,4515

c. ¿Cuál es la cantidad máxima descargada por esta máquina en un vaso para poder considerarlo
dentro del grupo del 30% con menores contenidos?

P(X ≤ k) = 0,30, entonces k = 192,13 ml

Notas
EPE UPC 165

TABLA DE LA DISTRIBUCION NORMAL

Área bajo la curva normal: P(Z ≤ z) = α

Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350

-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275

-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866

-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000

Notas
166 CE104 Estadística

TABLA DE LA DISTRIBUCION NORMAL

Área bajo la curva normal: P(Z ≤ z) = α

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891

1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670

2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861

3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967

Notas
EPE UPC 167

Ejercicio 102
 
Si Z ~ N   0, 2  1 , calcular:

a. P(Z < 1,12) =

b. P(Z > 0,45) =

c. P(0,23 < Z < 1,25) =

d. Hallar c para que P(Z < c) = 0,67003

e. Hallar c para que P(Z > c) = 0,0250

f. Hallar c para que P(-c <Z < c) = 0,950

Notas
168 CE104 Estadística

Distribución exponencial
Se dice que una variable aleatoria continua X se distribuye exponencialmente con parámetro  si su
función densidad de probabilidad está dada por:
x
1  β donde x0
f( x)  e
β

Se denota por X ~ Exp( ).

Valor esperado = media E X   


Varianza V X    2

Es una distribución continua de probabilidad que es útil para describir el tiempo necesario para reali-
zar alguna actividad.

Para calcular probabilidades acumuladas en la distribución exponencial se usa:


x

PX  x   1  e 

Ejercicio 103
El tiempo de duración de cierto componente para computadora se modela con una variable con dis-
tribución exponencial con media de seis años.
a. Calcule la probabilidad que el componente funcione por lo menos cinco años.
b. ¿Cuánto debe ser la duración mínima para considerar este componente para computadora
dentro del grupo del 20% de los más durables?
Solución
a. Calcule la probabilidad que el componente funcione por lo menos
cinco años.

b. ¿Cuánto debe ser la duración mínima para considerar este


componente para computadora dentro del grupo del 20% de
los más durables?

Notas
EPE UPC 169

Ejercicio 104
La vida útil de la batería de iones de litio para un celular se modela con una variable aleatoria con
distribución exponencial, cuya media es tres años.

Calcule la probabilidad de que una batería de ese tipo tenga una vida útil de tres años o menos.

Calcule la probabilidad de que una batería de ese tipo tenga una vida útil de más de dos años.

Si una batería de ese tipo tiene un año funcionando, ¿cuál es la probabilidad de que funcione como
mínimo un año más?

Calcule la desviación estándar tiempo de vida útil de dichas baterías.

Si se seleccionan al azar y de forma independiente seis de estas baterías, calcule la probabilidad que
en por lo menos cinco de ellas se observe una vida útil mayor a dos años.

Notas
170 CE104 Estadística

Ejercicio 105
El tiempo de duración (en horas) de un dispositivo electrónico es una variable aleatoria que tiene la
siguiente función de densidad:
x
1  50 ,
f x   e x0
50
a. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure menos de 60 horas?
b. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure más de 80 horas?
c. ¿Cuánto debe ser la duración mínima para considerar este dispositivo del grupo del 10% de los
más durables?
Solución
Si X = tiempo de duración (en horas) de un dispositivo electrónico, entonces X ~ Exp  50
a. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure menos de 60 horas?
60

Nos piden, P X  60  1  e 50  0 ,6988

b. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure más de 80 horas?


 
80

Nos piden, P X  80  1  P X  80  1   1  e 50   1  0 ,7981  0 ,2019
 
 

c. ¿Cuánto debe ser la duración mínima para considerar este dispositivo del grupo del 10% de los
más durables?
k

Nos piden, hallar k para que PX  k   0,9 . P X  k   1  e 50  0 ,9 : despejando y tomando lo-
garitmos a ambos lados, se tiene que k = 115,13 horas.

Notas
EPE UPC 171

Ejercicios propuestos

65. El número de minutos necesario para que un obrero procese cierta pieza se modela con una
variable aleatoria X con la siguiente función de probabilidad:

X:= número de minutos 2 3 4 5 6 7


f(x) 0,1 0,1 0,3 0,2 0,2 0,1

a. Calcule el tiempo medio de procesamiento de una pieza y la varianza. Rpta: 4,6 y 2,04
b. Para cada pieza procesada el obrero gana una cantidad fija de S/.5, pero si utiliza menos de
seis minutos gana S/.1,20 por cada minuto ahorrado. Determinar la media y la varianza de
la variable aleatoria <ganancia obtenida por pieza ensamblada>. Rpta: 6,8 y 2,376

66. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X:= número de
papeletas impuestas a un taxista por exceso de velocidad en las zonas restringidas de una ciudad
durante el último año.
X:= número de papeletas 0 1 2 3 4
Probabilidad f(x) 0,40 b 2b 0,07 0,08

a. Determine el valor de b para que f(x) sea función de probabilidad. Rpta: 0,15
b. Calcule la probabilidad que un taxista tenga por lo menos una papeleta pero menos de cua-
tro papeletas por exceso de velocidad. Rpta: 0,52
c. Si el costo de una papeleta por exceso de velocidad es de 430 soles, calcule el valor espera-
do que paga un taxista por este tipo de papeletas durante el último año.
Rpta: 550,40 soles
d. Si a la municipalidad le genera una utilidad por papeleta impuesta por exceso de velocidad
con la siguiente función U(x)  150 x  20x 2 . Obtenga la utilidad que espera tener la municipa-
lidad por taxista. Rpta: 126,80 soles

67. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X: Número de


cuentas de correo que tiene un estudiante universitario.
X:= número de cuentas de correo 1 2 3 4
Probabilidad f(x) 2k+0,03 0,30 0,40 k

a. Determine el valor de k para que f(x) sea función de probabilidad Rpta: 0,09
b. Calcule la probabilidad que un estudiante universitario tenga al menos uno pero menos de
cuatro cuentas de correo. Rpta: 0,91
c. Determine e interprete el valor esperado del número de cuentas de correo.
Rpta: 2,37 cuentas
d. Si por cada cuenta de correo le demanda al alumno15 minutos diarios revisar cada cuenta
¿cuántos minutos espera un estudiante dedicar a sus cuentas de correo diariamente?
Rpta: 35,55

68. La solicitud de préstamo que presentan los clientes de un banco puede ser aceptada o negada.
Se desea estudiar la distribución de la cantidad de solicitudes aceptadas. La tabla muestra la dis-
tribución de probabilidad de la variable aleatoria X:= número de solicitudes aceptadas por día.

X:= número de solicitudes aceptadas por día 0 1 2 3 4 5


Probabilidad f(x) 0,05 0,15 0,05 2k 0,15 k

Notas
172 CE104 Estadística

a. Determine el valor de k para que f(x) sea función de probabilidad. Rpta: 0,20
b. Si se sabe que el gerente puede aceptar al menos una solicitud al día, ¿cuál sería la probabi-
lidad que tenga que aceptar a lo más cuatro solicitudes al día? Rpta: 0,7895
c. Determine e interprete el valor esperado de la variable X. Rpta: 3,05 solicitudes
d. Calcule el coeficiente de variación de X. Rpta: CV(X)= 46,915%
e. Para la revisión de cada solicitud de crédito, el gerente de préstamos demora 30 minutos.
Determine el tiempo esperado que le demanda diariamente este proceso. Rpta: 91,5 min.
69. La gerencia de ventas tiene información sobre el número de bebidas que consumen las mujeres
a la semana. Esta información se muestra en la tabla de distribución de probabilidades:
X: número de bebidas 0 1 2 3 4 5 6 7
f(x) 0,05 k + 0,02 0,13 0,35 5k 0,08 k 0,02
a. ¿Cuál es la probabilidad de que una mujer, elegida al azar, consuma por lo menos tres be-
bidas a la semana? Rpta: 0,75
b. Calcule el coeficiente variación de la variable X. Rpta: 45,55%
c. Si por cada bebida consumida la empresa obtiene una utilidad de 0,65 soles, determine e
interprete el valor esperado de la utilidad para esta semana. Rpta: 2,093 soles
70. La empresa textil A sabe por experiencias previas que el porcentaje de pedidos que cumple con
la entrega en el plazo establecido con sus clientes del exterior es del 92%.
a. Si se eligen al azar cinco pedidos, calcule la probabilidad de tres pedidos se entreguen en el
plazo establecido. Rpta: 0,0498
b. Si se eligen al azar cinco pedidos, calcule la probabilidad de que por lo menos cuatro pedi-
dos no se entreguen en el plazo establecido. Rpta: 0,0002
71. Un fabricante de piezas garantiza que una caja de sus piezas contendrá como máximo un defec-
tuoso. Si la caja contiene 10 piezas, y la experiencia ha demostrado que ese proceso de fabrica-
ción produce 5% de piezas defectuosas, ¿cuál es la probabilidad de que una caja elegida al azar
satisfaga la garantía? Rpta: 0,9139
72. A una garita de peaje, en promedio, llegan 240 autos por hora según un proceso de Poisson. El
administrador de la garita ordena atender inicialmente con una caseta, pero si en el lapso de
dos minutos llegan como mínimo 10 autos (considera que se produce una congestión), entonces
ordena inmediatamente atender en otra caseta más hasta que se produzca el descongestiona-
miento. Calcule la probabilidad que se tenga que atender en otra caseta. Rpta: 0,2834
73. La llegada de reclamos a una oficina reguladora sigue un proceso Poisson con media de dos re-
clamos cada cuatro minutos.
a. Calcule la probabilidad que en un minuto se reciba dos reclamos. Rpta: 0,0758
b. Determine la probabilidad que en 10 minutos se presenten por lo menos dos reclamos.
Rpta: 0,9596
c. Calcule la probabilidad de que en una hora se reciba exactamente 28 reclamos.
Rpta: 0,0702
74. Al pintar planchas de acero con cierto tipo de pintura ocurren pequeños defectos que se distri-
buyen aleatoriamente en la superficie según una distribución de Poisson con un promedio de
2,5 defectos por cada 100 cm2. Calcule la probabilidad de que presente por lo menos dos defec-
tos en una plancha de acero de 20 cm2. Rpta: 0,0902
75. Un equipo de fútbol ha ganado diecisiete partidos de los veinte disputados durante la tempora-
da. En la liga de ascenso se necesitan ganar al menos tres partidos, de cinco que se disputan, pa-
ra subir de categoría. Calcula la probabilidad de que dicho equipo consiga competir en una cate-
goría superior. Rpta: 0,9734

Notas
EPE UPC 173

76. La probabilidad de éxito de una determinada vacuna es 0,92. Calcula la probabilidad de que una
vez administrada a 15 pacientes:
a. Ninguno sufra la enfermedad. Rpta: 0,2863
b. Todos sufran la enfermedad. Rpta: 3,51844 E-17
c. Dos de ellos contraigan la enfermedad. Rpta: 0,3403
77. Un examen tipo test consta de 10 preguntas, cada una con cuatro respuestas, de las cuales sólo
una es correcta. Si un alumno contesta al azar:
a. ¿Cuál es la probabilidad de que conteste bien cuatro preguntas? Rpta: 0,1460
b. Calcule la probabilidad de que conteste correctamente más de dos preguntas. Rpta: 0,4744
c. Calcule la probabilidad de que conteste mal a todas las preguntas. Rpta: 0,0563
78. En la realización de un programa, el número de errores cometidos por página se modela con una
distribución de Poisson de varianza igual a 2. ¿Cuál sería la probabilidad de no cometerlos en un
programa de 20 páginas? Rpta: 4,2484 E-18
79. Un estacionamiento tiene dos entradas. Los autos llegan a la entrada I según una distribución
Poisson con tres autos por hora y a la entrada II con cuatro autos por hora. Si el número de au-
tos que llega a cada entrada son independientes, ¿cuál es la probabilidad de que en una hora
lleguen 3 autos al estacionamiento? Rpta: 0,0575
80. Se ha determinado que los depósitos bancarios del banco A tienen distribución normal con me-
dia de 3000 dólares y varianza 3240000 dólares2 por mes. Se elige un depósito al azar.
a. Determine la probabilidad de que dicho depósito exceda los 3500 dólares.
Rpta: 0,3906
b. Si el depósito bancario elegido excede los 3500 dólares, determine la probabilidad de que
dicho depósito sea menor a los 4000 dólares. Rpta: 0,2594
81. Una máquina llena recipientes con determinado producto. Se sabe que la media y desviación
estándar para los pesos de llenado, de acuerdo con datos históricos, son 18,123 onzas y 0,6 on-
zas. El peso de llenado se modelo mediante una variable aleatoria normal.
a. Si se selecciona un recipiente al azar, ¿cuál es la probabilidad que su peso sea mayor a 16
onzas pero menor o igual que 20 onzas? Rpta: 0,9989
b. ¿Cuál es el peso máximo de un recipiente para estar considerado dentro del 25% de los re-
cipientes menos pesados? Rpta: 17,72 onzas

82. El salario semanal que percibe un trabajador de una empresa dedicada a la construcción civil se
distribuye normalmente con una media de 900 soles y desviación estándar de 100 soles.
a. ¿Cuál es la probabilidad de que un trabajador elegido al azar tenga un salario semanal menor
de 910 soles? Rpta: 0,5398
b. El 10% de los trabajadores de esta empresa son jefes de cuadrillas y son los mejores pagados.
¿Cuál es salario mínimo de un jefe de cuadrilla? Rpta: 1028,16 soles

83. Perubank, es una institución bancaria que proporciona una amplia gama de servicios financie-
ros, que comprende todo tipo de depósitos, prestamos, hipotecas, seguros, entre otros servicios
de inversión, todos dentro del marco de una estrategia única. Se ha determinado que un cliente
de Perubank con una buena historia crediticia tiene una deuda que se distribuye normalmente
con promedio de 15015 soles y una desviación estándar de 3540 soles.
a. Si se selecciona a un cliente con buena historia crediticia, ¿cuál es la probabilidad de que el
monto de su deuda se encuentre entre 12000 y 18000 soles? Rpta: 0,6033
b. La gerencia de Perubank ha determinado amonestar a los clientes que hayan alcanzado
deudas muy altas al final del mes. Determine el valor de la deuda mínima a partir del cual
se amoneste al 11% de los clientes con deudas muy altas. Rpta: 19357

Notas
174 CE104 Estadística

84. Suponga que el tiempo utilizado en revisar sugerencias y comentarios de los clientes tiene dis-
tribución normal con media de 8,5 horas y una desviación estándar de 2,5 horas.
a. Calcule la probabilidad de que el tiempo sea mayor a 7,5 horas Rpta: 0,65542
b. Determine el tiempo mínimo que emplea un ejecutivo para atender al 15,38% de los clientes
que tienen muchas dudas, lo que implica que dedican más tiempo en consultas.
Rpta: 11,05 minutos
85. Las notas de los 200 alumnos del curso de Estadística de la universidad A se modelan con una
distribución normal con una media de 13 y una varianza igual a 4.
a. Calcule la probabilidad de que un alumno tenga menos de 14. Rpta: 0,6915
b. Calcule la probabilidad de que a lo más tenga 11. Rpta: 0,1587
c. Calcule la probabilidad de que consiga por lo menos 15. Rpta: 0,1587
d. Calcule la probabilidad de que tenga menos de 11 o más de 15. Rpta: 0,3173
e. Calcule la probabilidad de que tenga entre 7 y 14. Rpta: 0,6901
f. ¿Cuántos alumnos se espera que tengan entre 8 y 12? Rpta: 64,5

86. El tiempo necesario para que una ambulancia llegue a un centro deportivo se distribuye nor-
malmente con una media de 17 minutos y desviación estándar de tres minutos.
a. Calcule la probabilidad que el tiempo de llegada esté comprendido entre 13 y 21 minutos.
Rpta: 0,8176
b. ¿Para qué valor t, la probabilidad de que la ambulancia emplee más de t minutos en llegar
es el 5 %? Rpta: 21,9345

87. Una compañía telefónica ha determinado que el tiempo total de duración de las llamadas rea-
lizadas mensualmente por sus clientes menores de 35 años, medidos en minutos, sigue una
distribución normal de media 100 y desviación estándar 25.
a. Calcula la probabilidad de que un cliente facture menos de dos horas en llamadas.
Rpta: 0,7881
b. ¿Cuál es la probabilidad de que un cliente facture entre 80 y 110 minutos?
Rpta: 0,4436
c. La empresa decide iniciar una campaña para premiar a aquellos clientes que acumulen en
llamadas más del doble de los minutos esperados. ¿Qué porcentaje de los usuarios se bene-
ficiarán en dicha campaña? Rpta: 0,003%
d. Para los clientes que facturan poco, se piensa en incentivarlos con un sistema de retribu-
ciones. Si se quiere incluir en ese programa al 1% de los clientes, ¿cuál es la duración total
en minutos que debe acumular como máximo un cliente para ser incluido en la promoción?
Rpta: 41,8413

88. La distribución de la demanda (en número de unidades por unidad de tiempo) de un producto
a menudo puede aproximarse con una distribución de probabilidad Normal. Por ejemplo, una
compañía de comunicación por cable ha determinado que el número de interruptores termi-
nales de botón solicitados diariamente tiene una distribución Normal, con una media de 200 y
una desviación estándar de 50.
a. ¿En qué porcentaje de los días la demanda será de menos de 90 interruptores?
Rpta: 1,39%
b. ¿En qué porcentaje de los días la demanda estará entre 225 y 275 interruptores?
Rpta: 24,173%
c. La compañía ha determinado que su mejor estrategia consiste en producir una cantidad de
interruptores suficiente para atender plenamente la demanda en 94% de todos los días.
¿Cuantos interruptores terminales deberá producir la compañía cada día?
Rpta: 278

Notas
EPE UPC 175

89. La duración (en minutos) de una conversación telefónica de larga distancia nacional tiene dis-
tribución exponencial con promedio ocho minutos.
a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos? Rpta: 0,4008
b. ¿Cuál es la probabilidad que una llamada dure más de nueve minutos? Rpta: 0,3247
c. ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de
las de mayor duración? Rpta: 18,4207
d. Si ya pasaron cinco minutos, ¿cuál es la probabilidad de que la llamada dure al menos cua-
tro minutos más? Rpta: 0,6065

90. El tiempo entre dos pedidos consecutivos tiene distribución exponencial con media 20 segun-
dos.
a. ¿Cuál es la probabilidad de que el tiempo entre dos pedidos consecutivos sea como máxi-
mo 20 segundos? Rpta: 0,6321
b. Si del último pedido ya pasaron 15 segundos, calcule la probabilidad de que el siguiente pe-
dido demore al menos otros cinco segundos más. Rpta: 0,7788

91. La duración (en minutos) de una conversación telefónica de larga distancia nacional tiene dis-
tribución exponencial con una media de 5 minutos.
a. Calcule la probabilidad de que una llamada dure entre cuatro y diez minutos. Rpta: 0,3140
b. Si ya pasaron 4 minutos, ¿cuál es la probabilidad de que la llamada dure por lo menos cinco
minutos más? Rpta: 0,3679

92. En un proceso fotográfico, el tiempo de revelado de las impresiones de las fotos puede consi-
derarse una variable aleatoria con distribución normal con media 16,28 segundos y desviación
estándar de 0,12 segundos. Si se elige una impresión al azar:
a. Calcule la probabilidad de que el tiempo de revelado sea menor de 16,55 segundos.
Rpta: 0,9878
b. Calcule la probabilidad de que el tiempo de revelado sea menor de 15,96 segundos.
Rpta: 0,0038
c. Calcule la probabilidad de que el tiempo de revelado sea mayor de 16 segundos.
Rpta: 0,9902
d. Calcule la probabilidad de que el tiempo de revelado sea mayor de 16,12 segundos.
Rpta: 0,9088
e. Calcule la probabilidad de que el tiempo de revelado se encuentre comprendido entre
15,96 y 16,55 segundos. Rpta: 0,9839
f. Calcule el tiempo máximo de impresión para ser considerada en el grupo del 10% con los
menores tiempos de revelados. Rpta: 16,1262

Notas
176 CE104 Estadística

Unidad 5. Prueba de hipótesis

Hipótesis estadística
Es una afirmación que se hace acerca de la distribución o parámetros de una o más poblaciones.
Por ejemplo:
 El ingreso mensual medio de una familia es de 1920 soles, es decir, µ = 1920.
 El porcentaje de artículos defectuosos producidos en una fábrica por una máquina es menor al
2%, es decir, p < 0,02.

Hipótesis a establecer

Hipótesis nula (H0)


A partir de la información proporcionada por la muestra se verificará la suposición sobre el paráme-
tro estudiado.

La hipótesis que se contrasta se llama hipótesis nula.

Hipótesis alterna (H1)


Es la hipótesis que debe ser aceptada si se rechaza la hipótesis nula.

Es la conclusión a la que se llegaría si hubiera suficiente evidencia en la información de la muestra


para decidir que es improbable que la hipótesis nula sea verdadera.

El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que
los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.

Ejercicio 106

Indique cuál sería la hipótesis nula y la alterna según esta investigación.

La siesta, clave para mejorar la productividad


Algunas empresas en el mundo ofrecen siestarios para que sus emplea-
dos descansen durante el horario laboral. Los especialistas aseguran que
dormir “entre 20 y 30 minutos” después del almuerzo mejora el rendi-
miento de los trabajadores, aumenta la productividad y el desarrollo de la
creatividad.
31 de mayo del 2017. Fuente http://www.ambito.com

H………...: Tomar una siesta de 20 a 30 minutos después del almuerzo, mejora el rendimiento
de los trabajadores, aumenta la productividad y el desarrollo de la creatividad.

H……..….: Tomar una siesta de 20 a 30 minutos después del almuerzo, no mejora el rendimien-
to de los trabajadores, aumenta la productividad y el desarrollo de la creatividad.

Notas
EPE UPC 177

Ejercicio 107
Defina los parámetros de interés y las hipótesis nula y alterna a partir de las siguientes situaciones.
a. Se desea probar que el gasto medio diario de un alumno de EPE en la cafetería es menor a siete
soles.
b. Se desea probar que el porcentaje de personas que están a favor de que el presidente Kuczynski
otorgue un indulto humanitario al expresidente Alberto Fujimori es mayor al 50%.
c. Se desea probar que el sueldo medio de los hombres en Lima es mayor al sueldo medio de las
mujeres en Lima.
d. Se desea probar que los sueldos de hombres y los sueldos de las mujeres en Lima tienen varian-
zas diferentes.
Solución
a. Se desea probar que el gasto medio diario de un alumno de EPE en la cafetería es menor a siete
soles.

Parámetro: ……………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………

b. Se desea probar que el porcentaje de personas que están a favor de que el presidente Kuczynski
otorgue un indulto humanitario al expresidente Alberto Fujimori es mayor al 50%.

Parámetro: …………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………

c. Se desea probar que el sueldo medio de los hombres en Lima es mayor al sueldo medio de las
mujeres en Lima.

Parámetro 1: …..……………………………………………………………………………………………………………………………
Parámetro2: .…………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………

d. Se desea probar que los sueldos de hombres y los sueldos de las mujeres en Lima tienen varian-
zas diferentes.

Parámetro 1: …..……………………………………………………………………………………………………………………………
Parámetro2: .…………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………

Notas
178 CE104 Estadística

Tipos de errores
Cuando usamos los datos de una muestra para tomar decisiones acerca de un parámetro existe el
riesgo de llegar a una conclusión incorrecta. De hecho, se pueden presentar dos tipos diferentes de
error cuando se aplica la metodología de la prueba de hipótesis.

Decisión estadística
Situación
No rechazar H0 Rechazar H0
H0 verdadera No hay error Error tipo I ()
H0 falsa Error tipo II () No hay error

Error tipo I
Ocurre cuando se rechaza la hipótesis H0 que es verdadera.
A la probabilidad de cometer un error de tipo I se le conoce como nivel de significación o significa-
ción y es denotada por . Es fijado por la persona que realiza la investigación, por lo general, en 5% y
es el valor que ese usará si algún ejercicio de este curso no menciona el nivel de significación.
Error tipo II
Ocurre cuando no se rechaza la hipótesis H0 que es falsa. La probabilidad de cometer un error de tipo
II es denotada por .

Ejercicio 108
Se desea probar que poner un aditivo a un tipo de gasolina aumenta el rendimiento medio por galón,
que es de 43 kilómetros por galón. Indique el parámetro de interés, las hipótesis nula y alterna, los
errores tipo I y II y las consecuencias de cometer cada error.

Parámetro: ……………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………

Error tipo I: ……………………………………………………………………………………………………………………………………


……………………………………………………………………………………………………………………………………
Error tipo II: ……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………

Consecuencia ……………………………………………………………………………………………………………………………………
del error tipo I: ……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………

Consecuencia ……………………………………………………………………………………………………………………………………
del error tipo II: ……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………

Notas
EPE UPC 179

Pasos a seguir en una prueba de hipótesis

Pasos Ejemplo

Establecer la hipótesis nula y la H0: μ ≤ 10

1. hipótesis alterna
H1: μ > 10

Determinar el nivel de α = 0,05

2. significación.

Elegir el estadístico apropiado de 𝑋 − 𝜇0


𝑇=
3. prueba a utilizar, recolectar los
datos y calcular el valor del
estadístico de prueba apropiado.
𝑆/ 𝑛

Especificar los supuestos La muestra es aleatoria.

4. necesarios para la validez de la


prueba.
La muestra proviene de una
distribución normal.

Establecer los valores críticos que

5. separan la región de rechazo y no


rechazo.

Tomar la decisión estadística y Rechazo H0

6. expresar la conclusión en términos


del problema.

Notas
180 CE104 Estadística

Prueba de hipótesis para una media poblacional con varianza desconocida


Se utiliza cuando la muestra proviene de una población con distribución normal y la varianza pobla-
cional (2) es desconocida.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
Unilateral izquierda Bilateral Unilateral derecha
H0 :   0 H0 :   0 H0 :   0
H1 :   0 H1 :   0 H1 :   0

Paso 2: Determinar el nivel de significación


Nivel de significación = α

Paso 3: Elegir y calcular el estadístico de prueba


X  0
T  tn - 1
S
n
donde:
X : media muestral.
μ0 : valor supuesto de la media poblacional en la hipótesis nula.
S : desviación estándar de la muestra.
n : tamaño de la muestra.
tn - 1 : distribución t de Student con n – 1 grados de libertad.
α : nivel de significación de la prueba.
Paso 4: Especificar los supuestos para la validez de la prueba
La muestra es aleatoria.
La muestra proviene de una distribución normal o el tamaño de muestra es grande.

Paso 5. Establecer los valores críticos para la región de rechazo


El valor crítico divide la gráfica en zona de rechazo y no rechazo.

La región de rechazo está representada por la zona sombreada

Unilateral izquierda Bilateral Unilateral derecha

Para calcular los valores críticos en Excel, use la función =INV.T (área a la izquierda, n -1)

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.

Notas
EPE UPC 181

Ejercicio 109
El jefe de control de calidad la empresa Cereales A desea determinar si la máquina con la que embol-
san un cereal pone, en promedio, mayor cantidad de los 500 gramos que dice la etiqueta. Para ello,
tomó una muestra aleatoria de 60 bolsas y encontró una media muestral de 503,5 gramos y una des-
viación estándar muestral de 4,3 gramos. Si el jefe de control de calidad usa un nivel de significancia
del 5%, ¿a qué conclusión llegará?
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


H0: µ …………………………...
H1: µ …………………………...
Paso 2: Determinar el nivel de significación
 = …………………….
Paso 3: Elegir y calcular el estadístico de prueba
X  0
TC    ....................
S
n

Paso 4: Especificar los supuestos para la validez de la prueba


La muestra es aleatoria.
La muestra proviene de una distribución normal.

Paso 5. Establecer los valores críticos para la región de rechazo

………………………

Para calcular el valor crítico en Excel, usamos la función =INV.T(……………, …………..) = …………………………

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como Tc = …………………….. …………………………. ……………………, entonces, ……………..(sí o no) se rechaza H0

Con un 5% de nivel de significancia, …………….. (sí o no) existe evidencia estadística para afirmar que

…..……………………………………………………………………………………………………………………………………………………….

…..……………………………………………………………………………………………………………………………………………………….

Notas
182 CE104 Estadística

Ejercicio 110
Según la empresa A, exportadora de productos agrícolas, la media del peso de sus manzanas es 200
gramos. Para contrastar dicha afirmación, se tomó una muestra aleatoria de 30 manzanas. Los datos
de la muestra se muestran a continuación.
204 201 198 195 197 198 189 205 207 199
195 197 192 197 196 203 195 210 197 197
210 190 207 202 185 203 198 194 196 193
A un nivel de significancia del 5%, ¿los datos confirman la afirmación de la empresa? Asuma que el
peso de las manzanas es una variable aleatoria normal.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación
 = …………………….
Paso 3: Elegir y calcular el estadístico de prueba
La media muestral es 198,333 y la desviación estándar muestral es 5,985.

Paso 4: Especificar los supuestos para la validez de la prueba


La muestra es aleatoria.
La muestra proviene de una distribución normal.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
EPE UPC 183

Ejercicio 111
Por datos históricos se sabe que la media de la edad de los huéspedes del hotel A es 36 años. La ge-
rencia cree que la media de la edad de sus huéspedes ha aumentado; para esto se seleccionó al azar
una muestra aleatoria de 20 pasajeros. Las edades de los huéspedes en la muestra se presentan en la
siguiente tabla.

41 43 36 17 62 50 48 39 44 32
45 46 22 48 40 37 25 28 64 25

Con la información presentada y usando un nivel de significación del 4%, contraste la hipótesis de la
gerencia. Asuma que la edad sigue una distribución normal.
Solución
La unidad elemental es un huésped del hotel A
La variable en estudio es la edad del huésped.
El parámetro de interés es la media poblacional de la edad de los huéspedes (μ)

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


H0: µ ≤ 36
H1: µ > 36
Paso 2: Determinar el nivel de significación
 = 0,04
Paso 3: Elegir y calcular el estadístico de prueba
X  0 39 ,6  36
TC    1 ,3012
S 12,3731
n 20
Paso 4: Especificar los supuestos para la validez de la prueba
La muestra es aleatoria.
La muestra proviene de una distribución normal.
Paso 5. Establecer los valores críticos para la región de rechazo

1,8495

El valor crítico se calcula usando la función de Excel =INV.T(0.96,19) = 1,8495.

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como Tc = 1,3012 < 1,8495, entonces, no se rechaza H0

Con un 4% de significancia, no existe evidencia estadística para afirmar que la edad promedio de los
huéspedes del hotel sea mayor de 36 años.

Notas
184 CE104 Estadística

Ejercicio 112
INDECOPI ha recibido la queja de un grupo de personas que compraron tetra pack de leche de un
litro de la empresa A indicando que este producto tiene menor contenido al establecido. De ser cier-
tas esas quejas, la empresa recibiría una multa. Para corroborar ello, la persona encargada de realizar
la sanción a la empresa A, seleccionó ocho tetra packs y midió su contenido. Con los datos y un nivel
de significación de 1%, ¿cuál será la decisión de la persona encargada por INDECOPI? Asuma que el
contenido de los tetra packs de leche se distribuye normalmente.

0,865 0,950 1,020 0,753 0,942 0,879 0,983 0,784

Solución
La unidad elemental es un tetra pack de leche de un litro de la empresa A
La variable en estudio es el contenido de un tetra pack de leche de la empresa A
El parámetro de interés es la media poblacional del contenido de leche por tetra pack (μ)

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


H0: µ ≥ 1
H1: µ < 1
Paso 2: Determinar el nivel de significación
 = 0,01
Paso 3: Elegir y calcular el estadístico de prueba

X   0 0,897  1
TC    3,0894
S 0,0943
n 8
Paso 4: Especificar los supuestos para la validez de la prueba
La muestra es aleatoria.
La muestra proviene de una distribución normal.
Paso 5. Establecer los valores críticos para la región de rechazo

-2,9980

El valor crítico se calcula usando la función de Excel =INV.T(0.01,7) = -2,9980.

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como Tc = -3,0894 < -2,9980, entonces, se rechaza H0

Con un 1% de significancia, existe evidencia estadística para afirmar que el contenido medio de los
tetra packs es menor a un litro, es decir la empresa A debe ser sancionada por INDECOPI.

Notas
EPE UPC 185

Ejercicio 113
El gerente del Banco A plantea que uno de los factores de morosidad en la sucursal del centro de
Lima se debe a que la edad promedio de los clientes del banco, en esta zona, es inferior a 33 años,
por lo que debería declarárseles como clientes de alto riesgo. Realice la prueba de hipótesis adecua-
da para responder a lo siguiente: ¿debe declararse a los clientes de la sucursal Centro de Lima, clien-
tes de alto riesgo”? Use un nivel de significación del 3%. Los datos se muestran a continuación:

34 39 27 36 36 29 32 29 40 36 40 36 27 27 38
29 31 40 35 39 33 27 27 31 35 28 27 29 26 40

Solución
La unidad elemental es un cliente de la sucursal Centro de Lima
La variable en estudio es edad de un cliente de la sucursal Centro de Lima
El parámetro de interés es la media poblacional de edad de los clientes de la sucursal Centro de Lima
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µ ≥ 33
H1: µ < 33
Paso 2: Determinar el nivel de significación
 = 0,03
Paso 3: Elegir y calcular el estadístico de prueba

X  0 32,7667 33
TC    0,2602
S 4 ,9108
n 30
Paso 4: Especificar los supuestos para la validez de la prueba
La muestra es aleatoria.
La muestra proviene de una distribución normal.
Paso 5. Establecer los valores críticos para la región de rechazo

-1,9573

El valor crítico se calcula usando la función de Excel =INV.T(0.03,29) = -1,9573.

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como Tc = -0,2602 > -1,9573, entonces, no se rechaza H0

Con un 3% de significancia, no existe evidencia estadística para afirmar que la edad promedio de los
clientes de la sucursal Centro de Lima es inferior a 33 años. Por lo tanto, no debería declararse a los
clientes como de alto riesgo.

Notas
186 CE104 Estadística

Prueba de hipótesis para una proporción poblacional

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


Unilateral izquierda Bilateral Unilateral derecha
H0 : 𝑝 ≥ 𝑝0 H0 : 𝑝 = 𝑝0 H0 : 𝑝 ≤ 𝑝0
H1 : 𝑝 < 𝑝0 H1 : 𝑝 ≠ 𝑝0 H1 : 𝑝 > 𝑝0

Paso 2: Determinar el nivel de significación


Nivel de significación = α

Paso 3: Elegir y calcular el estadístico de prueba

P̂  p0
Z  N(0,1)
p0 1  p0 
n
P̂ : proporción muestral
p0 : valor supuesto de la media poblacional en la hipótesis nula
Z : distribución normal estándar
α : nivel de significación de la prueba

Paso 4: Especificar los supuestos para la validez de la prueba


La muestra es aleatoria.
El tamaño de muestra es grande, por lo menos, 30

Paso 5. Establecer los valores críticos para la región de rechazo


El valor crítico divide la gráfica en zona de rechazo y no rechazo.

La región de rechazo está representada por la zona sombreada

Unilateral izquierda Bilateral Unilateral derecha

Para calcular los valores críticos en Excel, use la función =INV.NORM.ESTAND(área a la izquierda)

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.

Notas
EPE UPC 187

Ejercicio 114
La aprobación de la gestión de un presidente de un país que lleva casi un año de gobierno es del 40%.
Un analista político, luego de destaparse recientes casos de corrupción e interpelaciones, afirma que
dicha aprobación ha bajado. Para probar dicha afirmación, se tomó una encuesta de 1240, encon-
trándose que 485 personas aprueban la gestión presidencial. Use un nivel de significancia del 5%,
para contrastar la opinión del analista.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


H0: p ……………………………………
H1: p ……………………………………
Paso 2: Determinar el nivel de significación
 = ………………………
Paso 3: Elegir y calcular el estadístico de prueba
P̂  p0 
ZC   = ……………………………………..
p0 1  p0  1  
n

Paso 4: Especificar los supuestos para la validez de la prueba


La muestra es aleatoria.
El tamaño de muestra es grande.
Paso 5. Establecer los valores críticos para la región de rechazo

………………

El valor crítico se calcula usando la función de Excel =INV.NORM.ESTAND(…………….)= ….……………..

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como Zc = …………………….. …………………………. ……………………, entonces, ……………..(sí o no) se rechaza H0

Con un nivel de significancia del 5%, …………….. (sí o no) existe evidencia estadística para afirmar que

…..……………………………………………………………………………………………………………………………………………………….

…..……………………………………………………………………………………………………………………………………………………….

Notas
188 CE104 Estadística

Ejercicio 115
El porcentaje de aceptación de cierta marca de detergente es 20%, se realiza una intensa campaña
de publicidad por radio y televisión. Luego de esta campaña, se evaluó si hubo un cambio en la acep-
tación. Para esto se seleccionó una muestra aleatoria de 450 consumidores de detergente y se en-
contró que 105 usaban el detergente en mención. Usando un nivel de significancia del 1%, ¿cuál es la
conclusión?
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación
 = …………………….
Paso 3: Elegir y calcular el estadístico de prueba

Paso 4: Especificar los supuestos para la validez de la prueba


La muestra es aleatoria.
El tamaño de muestra es grande.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
EPE UPC 189

Ejercicio 116
En la dirección de correos se implementaron nuevos procedimientos para reducir el porcentaje de
cartas extraviadas. Anteriormente, el porcentaje de cartas extraviadas era del 0,3 %. Recientemente
en una investigación en la que 8 000 cartas fueron enviadas se extraviaron 18 cartas. Al nivel de signi-
ficación del 10%, ¿se puede aceptar que los nuevos procedimientos consiguieron su objetivo?
Solución
La unidad elemental es una carta enviada
La variable en estudio es condición de la carta (extraviada o no extraviada)
El parámetro de interés es proporción de cartas extraviadas

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


H0: p = 0,003 (p0 = 0,003)
H1: p < 0,003

Paso 2: Determinar el nivel de significación


 = 0,10

Paso 3: Elegir y calcular el estadístico de prueba


p̂  p0 0 ,00225 0 ,003
Zc    1 ,23
p0 1  p0  0 ,003 0 ,997
n 8 000

Paso 4: Especificar los supuestos para la validez de la prueba


La muestra es aleatoria.
El tamaño de muestra es grande.

Paso 5. Establecer los valores críticos para la región de rechazo

-1,28

El valor crítico se calcula usando la función de Excel =INV.NORM.ESTAND(0,1) = -1,28

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como Zc = -1,23 > -1,28, entonces, no se rechaza H0 y se concluye que, a un nivel de significación del
10%, no existe evidencia muestral suficiente para afirmar que los nuevos procedimientos hayan con-
seguido reducir el porcentaje de cartas extraviadas.

Notas
190 CE104 Estadística

Prueba de hipótesis para la razón de varianzas poblacionales


Para esta prueba de hipótesis solo desarrollaremos el caso bilateral debido a que esta prueba indica-
rá si dos muestras independientes provienen de poblaciones con varianzas homogéneas o heterogé-
neas, lo que será necesario saber al realizar prueba de hipótesis para comparar dos medias.

Paso 1. Establecer la hipótesis nula y la hipótesis alterna

H0 : 12 = 22 (Varianzas homogéneas)


H1 : 12 ≠ 22 (Varianzas heterogéneas)

Paso 2: Determinar el nivel de significación


Nivel de significación = α

Paso 3: Elegir y calcular el estadístico de prueba

S12
F  Fn1 1 ,n2 1
S22
En donde:
n1 : tamaño de muestra proveniente de la población 1
n2 : tamaño de muestra proveniente de la población 2
S12
: varianza de la muestra de la población 1
S22
: varianza de la muestra de la población 2
F : distribución F con n1 – 1 y n2 – 1 grados de libertad
α : nivel de significación de la prueba

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias.
Las muestras provienen de distribuciones normales.

Paso 5. Establecer los valores críticos para la región de rechazo


El valor crítico divide la gráfica en zona de rechazo y no rechazo.
La región de rechazo está representada por la zona sombreada.

Se rechaza Ho si el valor calculado del estadístico de prueba cae en la zona de rechazo. El valor crítico
divide la gráfica en zona de rechazo y no rechazo.
Para calcular los valores críticos en Excel, use la función =INV.F(área a la izquierda, n1 - 1, n2 - 1)
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.

Notas
EPE UPC 191

Ejercicio 117
Se quiere probar si las varianzas reales de los sueldos de hombres y mujeres en Lima son iguales.
Para ello se ha tomado una muestra aleatoria de 120 hombres y 150 mujeres, encontrándose una
desviación estándar muestral de los sueldos de los hombres de 840 soles y una desviación estándar
muestral de los sueldos de las mujeres de 723 soles. Contraste dicha hipótesis, usando un nivel de
significancia del 5%.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación
 = …………………….
Paso 3: Elegir y calcular el estadístico de prueba

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias.
Las muestras provienen de poblaciones normales.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
192 CE104 Estadística

Ejercicio 118
El gerente del hotel A desea conocer los perfiles de los huéspedes que se encuentran en el hotel.
Para esto, se seleccionaron al azar una muestra aleatoria e independiente del registro del hotel, al-
gunas de las características que desea conocer se muestran en la siguiente tabla:

Edad 41 43 36 17 62 50 48 39 44 32
Sexo Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre
Edad 45 46 22 48 40 37 25 28 64 25
Sexo Hombre Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Mujer

Con la información presentada, responda lo siguiente: ¿Las edades de los huéspedes por género pre-
sentan la misma variabilidad? Use un nivel de significación del 3%.
Solución
La unidad elemental es un huésped del hotel A
La variable en estudio es edad de un huésped.
Los parámetros de interés son las varianzas poblacionales de las edades de cada sexo.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0 : 12 = 22 (Varianzas homogéneas)
H1: 12 ≠ 22 (Varianzas heterogéneas)
Paso 2: Determinar el nivel de significación
 = 0,03
Paso 3: Elegir y calcular el estadístico de prueba

S12 196,7636
FC    1 ,7396
S22 113,1111

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias.
Las muestras provienen de poblaciones normales.
Paso 5. Establecer los valores críticos para la región de rechazo

0,2223 5,1005
El valor crítico F1 se calcula usando la función de Excel = INV.F(0.015,10,8) = 0,2223
El valor crítico F2 se calcula usando la función de Excel = INV.F(0.985,10,8) = 5,1005

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como F1 = 0,2223 < Fc = 1,7396 < F2 = 5,1005, entonces, no se rechaza H0. Con un 3% de significancia,
las varianzas son homogéneas, es decir, las edades de los huéspedes por género presentan la misma
variabilidad.

Notas
EPE UPC 193

Prueba de hipótesis para la diferencia de medias con varianzas poblacionales


desconocidas y supuestas iguales
Previamente, debemos hacer una prueba de homogeneidad de varianzas para saber si estamos en
este caso.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
Unilateral izquierda Bilateral Unilateral derecha
H0 : 𝜇1 ≥ 𝜇2 H0 : 𝜇1 = 𝜇2 H0 : 𝜇1 ≤ 𝜇2
H1 : 𝜇1 < 𝜇2 H1 : 𝜇1 ≠ 𝜇2 H1 : 𝜇1 > 𝜇2

Paso 2: Determinar el nivel de significación


Nivel de significación = α
Paso 3: Elegir y calcular el estadístico de prueba

T
X1  X2   0  tn n 2
1 2
Sp2 Sp2

n1 n2

SP2 
n1  1S12  n2  1S22
n1  n2  2
X1 y X 2 : medias muestrales de la población 1 y 2, respectivamente.
S12 y S22 : varianzas muestrales de la población 1 y 2, respectivamente.
SP2 : varianza muestral ponderada
n1 : tamaño de muestra proveniente de la población 1
n2 : tamaño de muestra proveniente de la población 2
tn1 n2 2 : distribución t de Student con n1 + n2 – 2 grados de libertad.
α : nivel de significación de la prueba
μ0 : diferencia hipotética entre las medias poblacionales
Paso 4: Especificar los supuestos para la validez de la prueba
Las muestras son aleatorias y provienen de distribuciones normales.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo
El valor crítico divide la gráfica en zona de rechazo y no rechazo.
La región de rechazo está representada por la zona sombreada.

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


Para calcular los valores críticos en Excel, use la función =INV.T (área a la izquierda, n1 + n2 – 2)
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.

Notas
194 CE104 Estadística

Ejercicio 119
Se piensa que, para acelerar el pago de cuentas atrasadas, una llamada telefónica es más efectiva
que una carta. Se contactaron dos grupos con cuentas atrasadas y se registró el tiempo, en días, en-
tre el envío de la carta o la llamada y el pago. ¿Se pude concluir que las cuentas atrasadas son paga-
das, en promedio, más rápido con una llamada que con una carta? Use α=5%. Asuma varianzas ho-
mogéneas. Se muestra los resultados de las muestras.
Prueba t para dos muestras suponiendo varianzas iguales
Llamada telefónica Envío de carta
Media 4,4350 5,9473
Varianza 2,6135 2,5667
Observaciones 120 100
Varianza agrupada 2,5922
Diferencia hipotética de las medias 0
Grados de libertad 218
Estadístico t -6,9372
P(T<=t) una cola 0,0000
Valor crítico de t (una cola) 1,6519
P(T<=t) dos colas 0,0000
Valor crítico de t (dos colas) 1,9709
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación  = …………………….
Paso 3: Elegir y calcular el estadístico de prueba

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias y provienen de poblaciones normales e independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
EPE UPC 195

Ejercicio 120
El gerente del hotel A desea conocer los perfiles de los huéspedes que se encuentran en el hotel.
Para esto, se seleccionaron al azar una muestra aleatoria e independiente del registro del hotel, al-
gunas de las características que desea conocer se muestran en la siguiente tabla:
Edad 41 43 36 17 62 50 48 39 44 32
Sexo Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre
Edad 45 46 22 48 40 37 25 28 64 25
Sexo Hombre Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Mujer
Con la información presentada, responda lo siguiente: ¿La media de la edad de los huéspedes hom-
bres es mayor que la media de la edad de las mujeres? Use un nivel de significación del 3%. Asuma
varianzas homogéneas.
Solución
La unidad elemental es un huésped del hotel A. La variable en estudio es edad de un huésped.
Los parámetros de interés son las medias poblacionales de las edades de cada sexo, μ1 para los hom-
bres y μ2 para las mujeres.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µ1 ≤ µ2
H1: µ1 > µ2
Paso 2: Determinar el nivel de significación
 = 0,03
Paso 3: Elegir y calcular el estadístico de prueba
Como las varianzas se consideran iguales, de un ejercicio anterior, usamos este estadístico.
SP2 
11  1 196,7636 9  1 113,1111  159,5847
11  9  2

TC 
40,8182 38,1111  0  0 ,4768
159,5847 159,5847

11 9
Paso 4: Especificar los supuestos para la validez de la prueba
Las muestras son aleatorias y provienen de distribuciones normales.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

2,0071
El valor crítico se calcula usando la función de Excel =INV.T(0,97;11+9 - 2) = 2,0071
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Como Tc = 0,4768 < t = 2,0071, entonces, no se rechaza H0. Con un 3% de significancia, no existe evi-
dencia estadística para afirmar que la media de la edad de los huéspedes hombres es mayor a la me-
dia de la edad de las mujeres.

Notas
196 CE104 Estadística

Prueba de hipótesis para la diferencia de medias con varianzas poblacionales


desconocidas y supuestas desiguales
Previamente, debemos hacer una prueba de homogeneidad de varianzas para saber si estamos en
este caso.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
Unilateral izquierda Bilateral Unilateral derecha
H0 : 𝜇1 ≥ 𝜇2 H0 : 𝜇1 = 𝜇2 H0 : 𝜇1 ≤ 𝜇2
H1 : 𝜇1 < 𝜇2 H1 : 𝜇1 ≠ 𝜇2 H1 : 𝜇1 > 𝜇2

Paso 2: Determinar el nivel de significación


Nivel de significación = α
Paso 3: Elegir y calcular el estadístico de prueba

X1  X 2   0  t v
S12
n1

S22
n2
 2

T v  S12 
2
 S22 
2

S12 S22    
n  n 
  1   2 
n1 n2 n1 1
 n2 1

X1 y X 2 : medias muestrales de la población 1 y 2, respectivamente.


S12 y S22 : varianzas muestrales de la población 1 y 2, respectivamente.
n1 : tamaño de muestra proveniente de la población 1
n2 : tamaño de muestra proveniente de la población 2
tv : distribución t de Student con v grados de libertad.
α : nivel de significación de la prueba
μ0 : diferencia hipotética entre las medias poblacionales
Paso 4: Especificar los supuestos para la validez de la prueba
Las muestras son aleatorias.
Las muestras provienen de distribuciones normales.
Las poblaciones son independientes.

Paso 5. Establecer los valores críticos para la región de rechazo


El valor crítico divide la gráfica en zona de rechazo y no rechazo.
La región de rechazo está representada por la zona sombreada.

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


Para calcular los valores críticos en Excel, use la función =INV.T (área a la izquierda, v)

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.

Notas
EPE UPC 197

Ejercicio 121
Una compañía quiere reducir el tiempo de secado de una pintura. Se pintaron placas con dos fórmu-
las de pintura: la fórmula 1 con contenido químico estándar y la fórmula 2 con un nuevo ingrediente
secante que debe reducir el tiempo de secado. ¿A qué conclusión se puede llegar sobre la eficacia del
nuevo ingrediente? Use α = 0,01. Asuma varianzas desiguales. Los datos se muestran a continuación.
Prueba t para dos muestras suponiendo varianzas desiguales
Fórmula 1 Fórmula 2
Media 115,5058 103,9342
Varianza 34,5993 263,2995
Observaciones 50 70
Diferencia hipotética de las medias 0
Grados de libertad 92
Estadístico t 5,4834
P(T<=t) una cola 0,0000
Valor crítico de t (una cola) 2,3676
P(T<=t) dos colas 0,0000
Valor crítico de t (dos colas) 2,6303
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación  = …………………….
Paso 3: Elegir y calcular el estadístico de prueba

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias y provienen de poblaciones normales e independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
198 CE104 Estadística

Ejercicio 122
El gerente del hotel A desea conocer los perfiles de los huéspedes que se encuentran en el hotel.
Para esto, se seleccionaron al azar una muestra aleatoria e independiente del registro del hotel, al-
gunas de las características que desea conocer se muestran en la siguiente tabla:
Edad 41 43 36 17 62 50 48 39 44 32
Sexo Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre
Edad 45 46 22 48 40 37 25 28 64 25
Sexo Hombre Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Mujer
Con la información presentada y considerando que las varianzas de las edades de cada grupo son
diferentes entre sí, responda lo siguiente: ¿La media de la edad de los huéspedes hombres es mayor
que la media de la edad de las mujeres? Use un nivel de significación del 3%.
Solución
La unidad elemental es un huésped del hotel A
La variable en estudio es edad de un huésped.
Los parámetros de interés son las medias poblacionales de las edades de cada sexo, μ1 para los hom-
bres y μ2 para las mujeres.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µ1 ≤ µ2
H1: µ1 > µ2
Paso 2: Determinar el nivel de significación
 = 0,03
Paso 3: Elegir y calcular el estadístico de prueba
Como las varianzas se consideran iguales, de un ejercicio anterior, usamos este estadístico.

40,8182 38,1111  0 v
196,7636
11  113,91111
2
  18
TC   0,4905 2
 196,7636  113,1111
2
196,7636 113,11111    
  11 
  9 
11 9 111 9 1

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias y provienen de distribuciones normales.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

2,0071
El valor crítico se calcula usando la función de Excel =INV.T(0,97; 18) = 2,0071
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Como Tc = 0,4905 < t = 2,0071; entonces, no se rechaza H0. Con un 3% de significancia, no existe evi-
dencia estadística para afirmar que la media de la edad de los huéspedes hombres es mayor a la me-
dia de la edad de las mujeres.

Notas
EPE UPC 199

Prueba de hipótesis para la diferencia de medias en muestras relacionadas


Considere dos poblaciones relacionadas con medias y variancias desconocidas desde las cuales se
extrae una muestra aleatoria bivariada de tamaño n, (X1, Y1), (X2, Y2),……, (Xn, Yn). Defina la variable Di =
Xi - Yi. Entonces esta prueba se reduce a la prueba para una media considerando a la variable D.

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


Unilateral izquierda Bilateral Unilateral derecha

H0 : 𝜇𝑑 ≥ 0 H0 : 𝜇𝑑 = 0 H0 : 𝜇𝑑 ≤ 0
H1 : 𝜇𝑑 < 0 H1 : 𝜇𝑑 ≠ 0 H1 : 𝜇𝑑 > 0

Paso 2: Determinar el nivel de significación


Nivel de significación = α

Paso 3: Elegir y calcular el estadístico de prueba


D  0
T  t n1
SD
n

D : media muestral de las diferencias


SD : media muestral de las diferencias
n : tamaño de muestra proveniente de la población
t n1 : distribución t de Student con n – 1 grados de libertad.
α : nivel de significación de la prueba
μ0 : diferencia hipotética entre las medias poblacionales

Paso 4: Especificar los supuestos para la validez de la prueba


La muestra es aleatoria.
La diferencia de las primeras observaciones con respecto a las segundas observaciones (o viceversa)
provienen de una distribución normal.

Paso 5. Establecer los valores críticos para la región de rechazo


El valor crítico divide la gráfica en zona de rechazo y no rechazo.
La región de rechazo está representada por la zona sombreada.

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha


Para calcular los valores críticos en Excel, use la función =INV.T (área a la izquierda, n - 1)

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.

Notas
200 CE104 Estadística

Ejercicio 123
Un analista de sistemas quiere usar un nuevo sistema de cómputo, y decide que cambiará de sistema
si tiene evidencia de que el nuevo sistema utiliza menos tiempo de procesamiento. Para esto tomó
de siete trabajadores elegidos al azar, los que realizaron un trabajo usando el nuevo sistema y el sis-
tema antiguo. Si α = 5%, ¿qué se decide al respecto? Los tiempos, en minutos, son los siguientes.

Trabajadores 1 2 3 4 5 6 7
Con sistema antiguo 8 4 10 9 8 7 12
Con sistema nuevo 6 3 7 9 5 8 9
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación  = …………………….
Paso 3: Elegir y calcular el estadístico de prueba

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias y provienen de poblaciones normales e independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
EPE UPC 201

Ejercicio 124
El gerente de una gasolinera cree que el nuevo aditivo A+ en la gasolina disminuye su consumo. Para
corroborar esto el jefe de mantenimiento de la gasolinera toma una muestra de seis autos en los
cuales evalúa el consumo de gasolina en los autos, antes y después de añadir el nuevo aditivo, en el
mismo tramo de carretera, estos resultados se presentan en la siguiente tabla:

Auto 1 Auto 2 Auto 3 Auto 4 Auto 5 Auto 6


Antes 11,4 15,5 18,7 15,9 14,0 8,6
Después 9,7 3,9 7,4 12,8 10,3 4,0

¿La sospecha del gerente es válida al nivel de significación de 5%? Suponga que la distribución de las
diferencias del consumo de gasolina por día antes y después de añadir el aditivo es normal.
Solución
Las variables en estudio son:
X1:= consumo de gasolina antes del aditivo, en galones
X2:= consumo de gasolina después del aditivo, en galones
D = X1 – X2
El parámetro de interés es la media poblacional de las diferencias de los consumos antes y después
del aditivo.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µd ≤ 0
H1: µd > 0
Paso 2: Determinar el nivel de significación
 = 0,05
Paso 3: Elegir y calcular el estadístico de prueba

d  0 6 ,0  0
TC    3 ,3968
sD 4 ,3266
n 6
Paso 4: Especificar los supuestos para la validez de la prueba
Las muestras son aleatorias y provienen de distribuciones normales.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

2,015
El valor crítico se calcula usando la función de Excel =INV.T(0,95; 6 - 1) = 2,015
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Como Tc = 3,3968 < t = 2,015; entonces, se rechaza H0. Con un 5% de significancia, se puede afirmar
que el nuevo aditivo A+ disminuye el consumo medio de gasolina.

Notas
202 CE104 Estadística

Prueba de hipótesis para la diferencia de proporciones poblacionales

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


Unilateral izquierda Bilateral Unilateral derecha

H0 : 𝑝1 ≥ 𝑝2 H0 : 𝑝1 = 𝑝2 H0 : 𝑝1 ≤ 𝑝2
H1 : 𝑝1 < 𝑝2 H1 : 𝑝1 ≠ 𝑝2 H1 : 𝑝1 > 𝑝2

Paso 2: Determinar el nivel de significación


Nivel de significación = α
Paso 3: Elegir y calcular el estadístico de prueba

P1  P2 ~  n1P1  n2P2  a1  a2
Z  N(0,1)
p 1  ~
p ~ p 1  ~
p
~ P
n1  n2 n1  n2

n1 n2

P1 y P2 : proporciones muestrales de la población 1 y 2, respectivamente.


n1 : tamaño de muestra proveniente de la población 1
n2 : tamaño de muestra proveniente de la población 2
Z : distribución normal estándar
α : nivel de significación de la prueba

Si la hipótesis nula propone alguna diferencia específica entre las proporciones poblacionales some-
tidas a prueba, y denotamos esta diferencia por 0, entonces el estadístico de prueba será:
Z
P1  P2    0  N(0,1)
P1 1  P1  P2 1  P2 

n1 n2

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias
Los tamaños de las muestras son grandes, por lo menos de tamaño 30.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo
El valor crítico divide la gráfica en zona de rechazo y no rechazo.
La región de rechazo está representada por la zona sombreada.

Prueba unilateral izquierda Prueba bilateral Prueba unilateral derecha

Para calcular los valores críticos en Excel, use la función =INV.NORM.ESTAND(área a la izquierda)
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.

Notas
EPE UPC 203

Ejercicio 125
Se seleccionó una muestra aleatoria de 150 personas capacitadas y 180 personas no capacitadas; se
halló que 11 de las personas capacitadas cometieron errores en cierta tarea y 16 de las personas
capacitadas cometieron errores en la misma tarea. Con base en esta información, ¿es posible afirmar
que la proporción de capacitadas que comete errores es menor a la proporción de personas no capa-
citadas que comete errores en dicha tarea? Use un nivel de significancia del 6%.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación  = …………………….
Paso 3: Elegir y calcular el estadístico de prueba

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias y los tamaños de las muestras son grandes, por lo menos de tamaño 30.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
204 CE104 Estadística

Ejercicio 126
Un patrocinador de un programa especial de televisión afirma que el programa representa un atrac-
tivo mayor para los televidentes hombres que para las mujeres. Si una muestra aleatoria de 300
hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres estaban viendo el programa
especial de televisión. Al nivel de significación del 5%, ¿se podría decir que el patrocinador tiene la
razón?
Solución
La unidad elemental es un televidente del programa especial.
Las variables en estudio son:
X1:= número de hombres a los que les agrada el programa especial.
X2:= número de mujeres a los que les agrada el programa especial.
Los parámetros son las proporciones de hombres y mujeres a los que les agrada el programa espe-
cial, p1 y p2, respectivamente.

Paso 1. Establecer la hipótesis nula y la hipótesis alterna


H0: p1 ≤ p2
H1: p1 > p2
Paso 2: Determinar el nivel de significación
 = 0,05
Paso 3: Elegir y calcular el estadístico de prueba
120 120

120  120
Z 300 400  2 ,7583 P~   0 ,3429
0 ,34291  0 ,3429 0 ,34291  0 ,3429 300  400

300 400

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias
Los tamaños de las muestras son grandes, por lo menos de tamaño 30.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

1,645

El valor crítico se calcula usando la función de Excel =INV.NORM.ESTAND(0,95) = 1,645

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema


Como Zc = 2,7583 > 1,645, entonces, se rechaza H0 y se concluye que, con un 5% de significancia, se
puede afirmar que el patrocinador tiene la razón, es decir, el programa representa un atractivo ma-
yor para los televidentes hombres que para las mujeres.

Notas
EPE UPC 205

Ejercicio 127
En una prueba de dos comerciales de televisión se pasó cada uno en un área varias veces, durante
una semana. La semana siguiente se llevó a cabo una encuesta entre los quienes habían visto los dos
comerciales. Se les pidió recordaran los mensajes principales. Se obtuvo siguientes resultados.
Comercial Personas que lo vieron Personas que recordaron el mensaje principal
A 150 63
B 200 60
Use  = 0,02 para probar si hay diferencia en las proporciones de personas que recuerdan el mensaje
principal de los dos comerciales.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación  = …………………….
Paso 3: Elegir y calcular el estadístico de prueba

Paso 4: Especificar los supuestos para la validez de la prueba


Las muestras son aleatorias y sus tamaños son grandes (n ≥ 30) de poblaciones independientes.
Paso 5. Establecer los valores críticos para la región de rechazo

Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema

Notas
206 CE104 Estadística

Prueba de hipótesis en Excel

Prueba de hipótesis para una media poblacional (µ) con varianza desconocida

Para calcular los valores críticos, usaremos la función: =INV.T (área a la izquierda, grados de liber-
tad)

Prueba de hipótesis para una proporción poblacional (p)

Para calcular los valores críticos, usaremos la función: INV.NORM. ESTAND(área a la izquierda)

Notas
EPE UPC 207

Prueba de hipótesis para la razón de varianzas poblacionales (12 /22)

1. Ordene los datos por la variable que requerida (en este ejemplo: género) para los cual seleccione
la opción Datos del menú principal, seleccione Ordenar.

2. Seleccione la variable de ordenación, y haga clic en Aceptar.

Obtendrá la base de datos ordenada por la variable requerida.

3. Seleccione la opción Datos del menú principal, seleccione Análisis de Datos.

Notas
208 CE104 Estadística

4. Seleccione Prueba F para varianzas de dos muestras, y haga clic en Aceptar.

5. Seleccione los datos de cada grupo a comparar.

6. Obtendrá lo siguiente:

Prueba F para varianzas de dos muestras


Variable 1 Variable 2
Media 40.8182 38.1111
Varianza 196.7636 113.1111
Observaciones 11 9
Grados de libertad 10 8
F 1.7396 Estadístico de prueba
P(F<=f) una cola 0.2222
Valor crítico para F (una cola) 4.0306
Hombre Mujer

….

7. Luego, el valor F podremos tomar la decisión en la prueba de hipótesis:

Notas
EPE UPC 209

Prueba de hipótesis para la diferencia de medias con varianzas desconocidas supuestas iguales
1. Seleccione la opción Datos del menú principal, seleccione Análisis de Datos.

2. Seleccione Prueba t para dos muestras suponiendo varianzas iguales, y haga clic en Aceptar.

3. Seleccione los datos de cada grupo a comparar.

4. Obteniendo lo siguiente:
Prueba t para dos muestras suponiendo varianzas iguales
Variable 1 Variable 2
Media 40,8182 38,1111
Varianza 196,7636 113,1111
Observaciones 11 9
Varianza agrupada 159,5847
Diferencia hipotética de las medias 0
Grados de libertad 18
Estadístico t 0,4768
P(T<=t) una cola 0,3196
Valor crítico de t (una cola) 2,0071
P(T<=t) dos colas 0,6393
Valor crítico de t (dos colas) 2,3562
5. Luego, obtendrá en Excel el punto crítico a emplear en la prueba de hipótesis:
Puntos críticos
INV.T(0.015,18) = -2.3562
INV.T(0.03,18) = -2.0071
INV.T(0.97,18) = 2.0071
INV.T(0.985,18) = 2.3562

Notas
210 CE104 Estadística

Prueba de hipótesis para la diferencia de medias con varianzas desconocidas supuestas desiguales

1. Seleccione la opción Datos del menú principal, seleccione Análisis de Datos.

2. Seleccione Prueba t para dos muestras suponiendo varianzas desiguales, y haga clic en Aceptar.

3. Seleccione los datos de cada grupo a comparar.

4. Obtendrá lo siguiente:
Prueba t para dos muestras suponiendo varianzas desiguales
Variable 1 Variable 2
Media 3.9091 2.2222
Varianza 2.8909 0.9444
Observaciones 11 9
Diferencia hipotética de las medias 0
Grados de libertad 16
Estadístico t 2.7817
P(T<=t) una cola 0.0067
Valor crítico de t (una cola) 1.5529
P(T<=t) dos colas 0.0133
Valor crítico de t (dos colas) 1.9417
Hombre Mujer
5. Luego, obtener en Excel el punto crítico a emplear en la prueba de hipótesis:
Puntos críticos
INV.T(0.035,16) = -1,9417
INV.T(0.07,16) = -1,5529
INV.T(0.93,16) = 1,5529
INV.T(0.965,16) = 1,9417

Notas
EPE UPC 211

Prueba de hipótesis para la diferencia de medias en muestras relacionadas

1. Seleccione la opción Datos del menú principal, seleccione Análisis de Datos.

2. Seleccione Prueba t para medias de dos muestras emparejadas, y haga clic en Aceptar.

3. Seleccionar los datos de cada grupo a comparar.

4. Obteniendo lo siguiente:

Prueba t para medias de dos muestras emparejadas


Antes Después
Media 14,0167 8,0167
Varianza 12,7737 12,8777
Observaciones 6 6
Coeficiente de correlación de Pearson 0,2702
Diferencia hipotética de las medias 0
Grados de libertad 5
Estadístico t 3,3968
P(T<=t) una cola 0,0097
Valor crítico de t (una cola) 2,0150
P(T<=t) dos colas 0,0193
Valor crítico de t (dos colas) 2,5706
5. Luego, obtener en Excel el punto crítico a emplear en la prueba de hipótesis:
Puntos críticos
INV.T(0.025,5) = -2,571
INV.T(0.05,5) = -2,015
INV.T(0.95,5) = 2,015
INV.T(0.975,5) = 2,571

Notas
212 CE104 Estadística

Ejercicios propuestos

93. La directora de marketing de Cola A está preocupada porque el producto no atrae a suficientes
consumidores jóvenes. Para probar su hipótesis, encuesta aleatoriamente a 200 consumidores
de Cola A. Se obtuvo como resultado una media de 30 años con una desviación estándar de 9
años. Al nivel de significación del 3%, ¿estos hechos son suficientes para concluir que los consu-
midores de Cola A poseen una edad promedio menor a 29 años?
Rpta: Prueba unilateral izquierda, Tc = 1,5713, Decisión: No rechazar H0

94. El fabricante de las motocicletas A anuncia en una propaganda de televisión que su vehículo po-
see un rendimiento promedio de 90 millas por galón en viajes largos. El recorrido (en millas) ob-
servado en ocho viajes prolongados fueron: 88, 82, 81, 87, 80, 78, 79, y 89. Al nivel de significa-
ción del 1% ¿el recorrido medio es menor que el anunciado?
Rpta: Prueba unilateral izquierda, Tc = -4,5593, Decisión: Rechazar H0

95. El gerente de una agencia bancaria tiene como objetivo que el número promedio de clientes
atendidos, entre las 13 y 14 horas, debe ser mayor a 45 clientes. La siguiente muestra aleatoria
registra el número de clientes que se atendieron entre ese periodo de tiempo durante 14 días:

45 47 42 42 46 44 46
43 44 46 48 45 46 47

Si el gerente encuentra que se atiende, en promedio, más de 45 clientes en ese horario, se verá
obligado a abrir una ventanilla adicional. Utilice un nivel de significación del 3% y asuma que el
número de clientes atendidos en ese horario tienen una distribución normal.
El gerente, ¿se verá obligado a abrir una nueva ventanilla?
Rpta: Prueba unilateral derecha, Tc = 0,1437, Decisión: No rechazar H0

96. En una encuesta de 900 hogares en Lima, se encontró que 100 de los hogares tenían al menos un
miembro de familia con educación superior. ¿Este resultado refuta la aseveración de que en los
hogares de Lima este porcentaje es menor a 15%? Use un nivel de significación del 4%.
Rpta: Prueba unilateral izquierda, Zc = -3,2673, Decisión: Rechazar H0

97. Se realizó una investigación de mercadotecnia para estimar la proporción de amas de casa que
pueden reconocer la marca de un producto de limpieza con base a la forma y color del recipien-
te. De las 1500 amas de casa, 620 fueron capaces de identificar la marca del producto. ¿Se puede
afirmar, a un nivel de significación del 2%, que la proporción de amas de casa que reconocen la
marca del producto es superior a 0.37?
Rpta: Prueba unilateral derecha, Zc = 3,4761, Decisión: Rechazar H0

98. Una compañía dedicada a la fabricación de muebles para armar está analizando las ventas de
esos productos realizadas vía telefónica. El gerente de la compañía continuará con dicha modali-
dad de ventas, si en más del 80% de las llamadas, la venta se logra concretar con éxito. Si al ana-
lizar una muestra de 100 llamadas encuentra que 85 resultaron cerrar la venta con éxito, ¿la
compañía deberá continuar con las ventas de su producto por teléfono? Use un nivel de signifi-
cación del 1%.
Rpta: Prueba unilateral derecha, Zc = 1,2500, Decisión: No rechazar H0

Notas
EPE UPC 213

99. Una política del Organismo Supervisor de Entidades del Estado Peruano (OSEEP) es de uniformi-
zar el tiempo de atención (en días) de los expedientes presentados, pero lamentablemente por
burocracias administrativas se sospecha que los expedientes de la zona norte (1) son atendidos
en promedio en menos tiempo que los presentados en la zona sur (2). Si se llegase a demostrar
tal sospecha se comprobaría el fracaso del plan de mejora. ¿Los datos confirman la sospecha a
un nivel de significación de 2%? Asuma heterogeneidad de varianzas poblacionales y distribución
normal de la variable en estudio.

Norte Sur
n 70 65
μi 25.2 22.6
𝜎𝑖2 12 15

Rpta: Prueba unilateral izquierda, Tc = 4,0997, Decisión: No rechazar H0

100. Se llevó a cabo una encuesta entre los miembros del Club del libro del mes, para determinar si
pasan más tiempo viendo televisión que leyendo. Suponga que en una muestra de 12 encues-
tados se obtuvieron las horas semanales que se dedican a ver televisión y las que se dedican a
la lectura. Con un nivel de significación del 5%, ¿se puede llegar a la conclusión de que los
miembros del Club del libro del mes pasan más tiempo, en promedio, viendo televisión que le-
yendo? Asuma normalidad de las variables en estudio.

Encuestado 1 2 3 4 5 6 7 8 9 10 11 12
Televisión 11 19 8 5 16 8 4 12 10 14 15 18
Leyendo 6 10 3 10 5 8 7 14 14 8 10 10

Rpta: Prueba unilateral derecha, Tc = 1,8477, Decisión: Rechazar H0

101. Se realiza un estudio en la Universidad A para medir el efecto del cambio ambiental en estu-
diantes. Uno de los aspectos del estudio es una comparación del peso de los alumnos al ingre-
sar a esa universidad, un año después se midió el peso de los mismos estudiantes pues se sos-
pecha que los alimentos más consumidos provocan aumento de peso.
Los datos para una muestra de estudiantes se dan a continuación.

Alumno 1 2 3 4 5 6
Peso al inicio 74 67 98 90 103 75
Peso un año después 82 67 96 102 116 84

Con 1% de nivel de significación, ¿los alimentos más consumidos provocan aumento de peso?
Rpta: Prueba unilateral izquierda, Tc = -2,6126, Decisión: No rechazar H0

102. El jefe de personal de la OSEEP desea determinar si el ambiente laboral influye en el rendi-
miento de los trabajadores. A sugerencia de la supervisora de producción, quien afirmaba que
la música mejorará la producción promedio diaria, se realizó un estudio en la cual se seleccio-
naron seis trabajadores y se les hizo un seguimiento a la producción semanal de los trabajado-
res antes y después de trabajar con música ambiental, obteniéndose la siguiente producción
semanal (en unidades):

Notas
214 CE104 Estadística

Empleado 1 2 3 4 5 6
Semana sin música 219 203 226 198 209 216
Semana con música 235 200 240 210 223 217

¿La producción obtenida sugiere que la música ambiental logró aumentar la producción prome-
dio diaria como afirma la supervisora de producción? Realice la prueba estadística respectiva a
un nivel de significación del 5%.
Rpta: Prueba unilateral izquierda, Tc = -2,7731, Decisión: Rechazar H0

103. En una agencia bancaria se capacitan a diez empleados para mejorar la atención al cliente. El
jefe del área contabiliza el tiempo de atención en ventanilla de estos empleados, antes y des-
pués de la capacitación, para determinar la eficiencia.
La siguiente tabla muestra el tiempo de atención (en minutos) que demora un empleado en
atender al reclamo de un cliente.

Empleado 1 2 3 4 5 6 7 8 9 10
Antes 44 70 40 73 50 54 40 58 67 67
Después 26 59 38 67 45 47 42 49 61 41

A un nivel de significación del 4%, ¿el jefe de la oficina de atención al personal puede afirmar
que la atención al cliente es más eficiente?
Rpta: Prueba unilateral derecha, Tc = 3,4617, Decisión: Rechazar H0

104. Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno
diurno es diferente al de los trabajadores en el turno nocturno. Se realiza una comparación de
150 trabajadores de cada turno. Los resultados muestran que 28 trabajadores diurnos han falta-
do por lo menos cinco veces durante el año anterior, mientras que 50 trabajadores nocturnos
han faltado por lo menos cinco veces. Con un nivel de significación del 3%, ¿existen diferencias
significativas entre las proporciones de trabajadores de los turnos que faltaron cinco veces o
más al año.
Rpta: Prueba bilateral, Zc = -2,8957, Decisión: Rechazar H0

105. Los expedientes atendidos por la OSEEP tienen un plazo de atención máximo y dependiendo de
su complejidad, éste podría ser atendido en un plazo mayor. Se han puesto en marcha acciones
de mejora para brindar una atención eficiente y se quiere verificar si las acciones implementa-
das resultaron ser más efectivas en la zona sur que en la zona norte, debido a que se han repor-
tado un porcentaje mayor de quejas de los clientes de la zona sur.
Los datos registrados a partir de una muestra de clientes de ambas zonas son los siguientes:

Atención a tiempo Norte Sur


Si 60 50
No 10 15

Realice la prueba estadística respectiva a un nivel de significación de 4%.


Rpta: Prueba unilateral izquierda, Zc = 1,3139, Decisión: No rechazar H0

Notas
EPE UPC 215

106. El gerente de comercio ha incluido una promoción para incentivar los créditos orientados a capi-
tal de trabajo. Orientará su campaña, principalmente a las microempresas si encuentra que la
proporción de pequeñas empresas que solicitan crédito para capital de trabajo es mayor que en
las microempresas. Con un nivel de significación del 2% ¿deberá orientar la campaña publicitaria
a las microempresas?
Crédito Pequeña empresa Microempresa
Capital 22 20
Otros 18 13
Rpta: Prueba unilateral derecha, Zc = -0,4823, Decisión: No rechazar H0

107. Star A es una línea aérea de capital compartido (peruano-americano) que tiene más de 10 años
laborando en el Perú. El gerente de marketing de aerolíneas Star A desea realizar un estudio
considerando como segmentos de interés a los pasajeros nacionales y extranjeros. Para realizar
dicho estudio se seleccionan al azar muestras aleatorias e independientes de los registros de pa-
sajeros peruanos y extranjeros. Algunas de las características que desea analizar el gerente son
las siguientes: Origen del pasajero: peruano o extranjero, género, opinión sobre el servicio, edad
del pasajero (en años), peso del equipaje en el último viaje (en kg).
Origen Género Opinión Edad Peso
Extranjero Mujer Regular 17 18.1
Extranjero Hombre Regular 62 17.9
Extranjero Hombre Regular 50 21.2
Extranjero Mujer Regular 48 19.1
Extranjero Mujer Regular 39 19.7
Extranjero Hombre Mala 44 21.3
Extranjero Mujer Regular 40 19.3
Extranjero Mujer Mala 37 18.8
Extranjero Mujer Muy buena 25 17.8
Extranjero Hombre Muy buena 7 16.3
Extranjero Hombre Regular 7 22.5
Peruano Mujer Mala 29 24
Peruano Hombre Buena 56 16.2
Peruano Hombre Muy buena 44 19.4
Peruano Hombre Buena 7 20.6
Peruano Hombre Regular 51 22.2
Peruano Hombre Mala 41 18
Peruano Hombre Regular 46 20.6
Peruano Hombre Buena 41 19
Peruano Mujer Regular 30 18
Peruano Hombre Buena 45 23.5
Peruano Mujer Regular 46 21.7
Peruano Hombre Regular 22 17.2
Peruano Mujer Muy buena 8 20.7
Peruano Hombre Regular 64 19.4
Peruano Mujer Mala 16 17.9
Peruano Hombre Muy buena 41 16.4
Peruano Mujer Buena 43 21.3
Peruano Hombre Buena 12 22.5
Notas
216 CE104 Estadística

Con la información que se muestra y usando un nivel de significación del 6% responda lo si-
guiente:

a. Verifique el supuesto de homogeneidad de varianzas en la edad para las personas de género


femenino y masculino.
Rpta: Prueba bilateral, Fc = 0.4494, Decisión: No rechazar H0

b. ¿Se podría afirmar que las mujeres, en promedio, son mayores que los hombres?
Rpta: Prueba unilateral derecha, Tc = -0,9629, Decisión: No rechazar H0

c. ¿Existen diferencias significativas entre los pesos medios de los equipajes por género?
Rpta: Prueba bilateral, Fc = 0,6376, Decisión: No rechazar H0;
Prueba bilateral, Tc = 0,0497, Decisión: No rechazar H0
108. La cadena de librerías A está realizando una investigación sobre el funcionamiento del negocio.
En cada una de sus sucursales aplicó, este año 2017, una pequeña encuesta entre sus clientes y
se les preguntó sobre las siguientes variables:

Sucursal Local donde el cliente realiza sus compras


Nro_hijos Número de hijos del cliente
Gasto 2016 Gasto total realizado en compra de útiles el 2016
Gasto 2017 Gasto total realizado en compra de útiles el 2017
Opinión Como califica el servicio del personal
Ingreso Ingreso del cliente

a. Si se sostuviera que las varianzas poblacionales de los ingresos de los clientes de las
sucursales de San Miguel y Breña son iguales, ¿cuál sería su conclusión? Use α=0.04
Asuma que las muestras de clientes en cada sucursal son independientes y que provienen de
poblaciones normales.

b. Se piensa que los clientes de San Miguel ganan, en promedio, menos que los clientes de
Breña.
Pruebe esta hipótesis usando un nivel de significancia del 4%. Asuma que las muestras de
clientes en cada sucursal son independientes y que provienen de poblaciones normales.

c. En el distrito de Los Olivos, ¿hubo un mayor gasto el 2017 con respecto al 2016?
Pruebe esta hipótesis usando un nivel de significancia del 6%. Asuma que las muestras de
clientes en cada sucursal son independientes y que las diferencias de las observaciones de los
gastos del 2016 y 2017 provienen de una distribución normal.

La información recopilada se muestra a continuación:

Notas
EPE UPC 217

Gasto Gasto Gasto Gasto


Sucursal Nro_hijos Opinión Ingresos Sucursal Nro_hijos Opinión Ingresos
2016 2017 2016 2017
San Miguel 3 1015 1167.25 malo 5075 Los Olivos 4 1451.2 1741.4 bueno 7256
Breña 5 1092.6 1092.6 bueno 5463 Breña 5 1452 1452 bueno 7260
Breña 3 1093.6 1093.6 bueno 5468 Los Olivos 2 1461.8 1754.2 malo 7309
Los Olivos 1 1118.2 1341.84 malo 5591 Breña 1 1464.2 1464.2 malo 7321
San Miguel 4 1154.6 1327.79 regular 5773 Los Olivos 2 1471.4 1765.7 bueno 7357
Los Olivos 4 1176.4 1411.68 regular 5882 San Miguel 4 1473.2 1694.2 regular 7366
Breña 2 1177 1177 malo 5885 Breña 3 1478.8 1478.8 regular 7394
Breña 4 1211.6 1211.6 regular 6058 Breña 5 1480.2 1480.2 regular 7401
San Miguel 4 1231.8 1416.57 regular 6159 Breña 1 1481.6 1481.6 regular 7408
Los Olivos 2 1245.2 1494.24 malo 6226 Los Olivos 1 1487 1784.4 malo 7435
Breña 2 1251.2 1251.2 malo 6256 San Miguel 2 1501.8 1727.1 regular 7509
Breña 1 1256.8 1256.8 bueno 6284 Breña 3 1502.4 1502.4 malo 7512
San Miguel 3 1267 1457.05 bueno 6335 Breña 2 1506.4 1506.4 regular 7532
Los Olivos 4 1267.6 1521.12 regular 6338 San Miguel 1 1517.4 1745 regular 7587
Breña 4 1268 1268 bueno 6340 Breña 3 1520.2 1520.2 regular 7601
Los Olivos 3 1270.6 1524.72 bueno 6353 Los Olivos 4 1531.6 1837.9 regular 7658
San Miguel 1 1273.8 1464.87 malo 6369 Los Olivos 5 1537 1844.4 malo 7685
Breña 4 1276.4 1276.4 malo 6382 Breña 2 1537 1537 malo 7685
Los Olivos 2 1279.8 1535.76 malo 6399 Breña 3 1542.2 1542.2 bueno 7711
Los Olivos 5 1282.6 1539.12 regular 6413 Breña 2 1549.4 1549.4 bueno 7747
Breña 3 1282.6 1282.6 bueno 6413 Los Olivos 3 1554.4 1865.3 regular 7772
Breña 4 1284.8 1284.8 regular 6424 Los Olivos 2 1554.6 1865.5 malo 7773
San Miguel 4 1294 1488.1 bueno 6470 Breña 2 1558.8 1558.8 regular 7794
Los Olivos 2 1299.4 1559.28 bueno 6497 Breña 2 1567.8 1567.8 bueno 7839
San Miguel 5 1300.4 1495.46 malo 6502 San Miguel 5 1568.2 1803.4 bueno 7841
San Miguel 1 1300.8 1495.92 bueno 6504 Los Olivos 5 1574 1888.8 bueno 7870
Breña 1 1305 1305 bueno 6525 San Miguel 3 1574.4 1810.6 bueno 7872
San Miguel 3 1309.4 1505.81 malo 6547 Los Olivos 1 1576 1891.2 regular 7880
San Miguel 5 1309.4 1505.81 malo 6547 Breña 2 1576.4 1576.4 malo 7882
Los Olivos 3 1319.4 1583.28 bueno 6597 Los Olivos 2 1577 1892.4 malo 7885
San Miguel 3 1340.4 1541.46 regular 6702 San Miguel 5 1580.2 1817.2 bueno 7901
Los Olivos 1 1346.6 1615.92 regular 6733 Los Olivos 4 1582.4 1898.9 regular 7912
Los Olivos 3 1350.4 1620.48 bueno 6752 Los Olivos 3 1584.4 1901.3 regular 7922
San Miguel 5 1355.4 1558.71 bueno 6777 San Miguel 3 1588.2 1826.4 malo 7941
Los Olivos 4 1360.6 1632.72 bueno 6803 San Miguel 2 1600.8 1840.9 malo 8004
Los Olivos 2 1361.2 1633.44 regular 6806 San Miguel 4 1609.2 1850.6 malo 8046
Los Olivos 2 1368.4 1642.08 malo 6842 San Miguel 4 1623.8 1867.4 bueno 8119
Breña 5 1370.2 1370.2 bueno 6851 Breña 3 1626.2 1626.2 bueno 8131
San Miguel 3 1396.4 1605.86 regular 6982 San Miguel 4 1626.4 1870.4 bueno 8132
Breña 4 1398.6 1398.6 bueno 6993 San Miguel 1 1628.6 1872.9 bueno 8143
San Miguel 2 1409.6 1621.04 bueno 7048 Los Olivos 4 1630.6 1956.7 regular 8153
Breña 5 1410.6 1410.6 malo 7053 Los Olivos 3 1631 1957.2 malo 8155
San Miguel 2 1420.2 1633.23 regular 7101 Los Olivos 1 1632.2 1958.6 regular 8161
Los Olivos 3 1421.4 1705.68 regular 7107 Los Olivos 4 1635.6 1962.7 regular 8178
San Miguel 5 1425.4 1639.21 regular 7127 San Miguel 3 1642.8 1889.2 bueno 8214
Los Olivos 1 1425.6 1710.72 malo 7128 Los Olivos 1 1649 1978.8 malo 8245
San Miguel 4 1425.8 1639.67 malo 7129 San Miguel 2 1651.2 1898.9 bueno 8256
San Miguel 2 1438.8 1654.62 bueno 7194 San Miguel 3 1658.6 1907.4 bueno 8293
San Miguel 5 1439 1654.85 malo 7195 Breña 2 1661.6 1661.6 bueno 8308
San Miguel 5 1443.4 1659.91 regular 7217 Breña 1 1256.8 1256.8 bueno 6284

Notas
218 CE104 Estadística

Unidad 6. Análisis de Regresión


Regresión lineal simple
Es el estudio de la relación entre una variable aleatoria Y, llamada variable dependiente o respuesta
y otra variable X, llamada variable independiente, explicativa o predictora.

El objetivo principal del análisis de regresión es estimar el valor de la variable dependiente, sabiendo
que el valor de la variable independiente, es conocido.

Diagrama de dispersión
Es una gráfica en la que cada punto representa un par de valores observados (xi,yi) de las variables
dependientes e independientes. El valor de la variable independiente, X se grafica en el eje horizon-
tal, mientras que el valor de la variable dependiente, Y en el eje vertical.
El tipo de la relación observada en el diagrama de dispersión puede ser curvilínea (relación no lineal),
puede ser lineal o ninguna de las anteriores.

Relación directa entre X e Y Relación inversa entre X e Y Relación no lineal entre X e Y

Si el diagrama de dispersión indica una relación de tipo lineal, entonces se estima una línea recta a
los datos.
La relación que se proponga entre estas variables no es exacta. Es decir, a un valor dado de X no co-
rresponde un valor exacto de Y. No es un modelo determinístico. Para una relación lineal, la ecuación
propuesta tiene la forma:
Y  01 X  
El término  es denominado “término aleatorio” o “error”.

El modelo propuesto se denomina modelo de regresión lineal simple. La linealidad se expresa por
que la función es lineal en los parámetros, pero no necesariamente es lineal en X.

Supuestos
• Las variables independiente y dependiente se asocian linealmente y la relación funcional entre
ellas puede ser expresada mediante el modelo lineal:
y i   o   1 xi   i
• Los términos aleatorio i son independientes y tienen una distribución normal con media 0 y
varianza  2
• Los valores de X son fijados y se miden sin error.
• Las distribuciones de Y para los diferentes valores de X, tienen igual varianza.
• Los valores de Y, para cada valor de X, son obtenidos mediante una muestra aleatoria.

Notas
EPE UPC 219

Ejercicio 128
El gerente de un banco ha observado que la atención en ventanilla es lenta, preocupado por las cons-
tantes quejas de los clientes del banco. Por tal razón, ha decidido observar las diez últimas visitas al
banco. Se ha registrado el número clientes que encontró haciendo cola y el tiempo que tuvo que
esperar hasta ser atendido, en minutos.

Clientes en cola 7 8 2 4 4 12 15 10 12 5
Tiempo de espera 10 8 3 4 6 15 18 10 14 5

Solución
a. Identifique la variable independiente y la variable dependiente. Justifique.

b. Realice el diagrama de dispersión y trace, aproximadamente, una recta que se ajuste a la nube de
puntos.

c. A partir del gráfico, estime el tiempo que José esperaría en ser atendido, si al llegar al banco en-
cuentra seis clientes haciendo cola.

Notas
220 CE104 Estadística

Estimación de los parámetros del modelo

El modelo propuesto está dado por:


Y  0  1 x 
Los parámetros  0 y 1 deben ser estimados. Para el proceso de estimación se usa el método de mí-
nimos cuadrados que propone minimizar la suma de cuadrados del error.
Los parámetros estimados están expresados por:
n

S S
x y
i 1
i i  nx y
b1  r Y  XY 
SX S X2 n

x
i 1
i  nx 2

b0  y  b1 x
Ejercicio 129
En los siguientes casos, determine la ecuación de regresión e indica cuál es el coeficiente de regre-
sión e interprete.

Coeficientes
Intercepción 62,4604
Demanda -0,3512

Un comerciante desea fijar el precio de su producto en función a la demanda existente.

Solución
La ecuación de regresión es: ………………………………………………………………………………………………………………..
El valor del coeficiente de regresión es: ………………………………………………………………………….…………………..
Interpretación: ………………………………………………………………………………………………………………..…………………..
…………………………………………………………………………………………………………………………………………………………….

Coeficiente de correlación
El coeficiente de correlación mide el grado de asociación lineal que existe entre dos variables.

El coeficiente de correlación se denota por r y se encuentra dentro del intervalo cerrado de [-1 y 1].

 Si r está cerca de cero entonces indicará que no existe relación lineal significativa entre las varia-
bles.
 Si r está cerca de -1, indicará que existe una relación lineal fuerte e inversa.
 Si r está cerca de 1, indicará que existe una relación lineal fuerte y directa

El coeficiente de correlación r y se calcula mediante la siguiente fórmula:


n

x y nx y
i 1
i i
r
 n  n 

 i 1

 i 1

 x i  nx 2  y i  ny 2 
 

Notas
EPE UPC 221

Coeficiente de determinación
Es una medida de la bondad del ajuste para una ecuación de regresión.

Se define el coeficiente de determinación como:


SCR
R2 
VŶ
x100%  n  1 x100% 
SCR
x100%
V Y  SCT SCT
n 1
V(Y) es la varianza de los valores observados de la variable dependiente Y:
n

 (y
i 1
i  y )2
SCT
V (Y )  
n 1 n 1

V Yˆ es la varianza de los valores estimados con la recta de regresión
n

(yˆ  y )2

i
SCR
V Yˆ  i 1

n 1 n 1

 R2 mide el porcentaje de la varianza de los valores observados de Y ( Ŷ ) representa la varianza de


los valores estimados por la recta de regresión. Es decir, la proporción de la varianza total, V(Y),
que es explicada por la recta de regresión de mínimos cuadrados.
 Su rango de valores está entre 0% y 100%.
 Se cumple que R 2  r 2 , es decir, el coeficiente de determinación es el cuadrado del coeficiente
de correlación lineal de Pearson.
 Mientras más próximo a 1 sea el coeficiente de determinación, mejor será el ajuste de los datos
al modelo lineal.

Ejercicio 130
Para las variables X e Y se tiene la recta de regresión y = 1,0926 + 14,009.
La varianza de la variable Y es 12,278 y la varianza de los valores estimados es 11,290. Luego, el coe-
ficiente de determinación es 0,9195. Es decir, el 91,95% de la varianza de Y es explicado por el mode-
lo de regresión.

Notas
222 CE104 Estadística

Ejercicio 131
En los siguientes casos, indica cuál de las variables independientes presentadas es la que más explica
la variabilidad de la variable dependiente e interprete dicho valor.

Variable dependiente Variable independiente r R2


Número de páginas 0,972 0,945
Tiempo de impresión
Velocidad de la impresora 0,984 0,968
de un informe
Calidad de la impresora 0,821 0,675

Variable dependiente Variable independiente r R2


Gasto publicidad televisiva 0,987 0,975
Ventas de publicidad
Fuerza de venta 0,993 0,988
(unidades)
Años de experiencia de vendedor 0,937 0,878

Ejercicio 132

En los siguientes casos, indica cuál de las variables independientes presentadas es la que presenta
una mayor asociación con la variable dependiente. Indique el tipo de asociación, directa o inversa.

Variable dependiente Variable independiente r R2


Área en metros cuadrados 0,995 0,990
Precio de un departa-
Número de habitaciones 0,882 0,778
mento
Número de baños 0,733 0,537

Variable dependiente Variable independiente r R2


Precio por kilo -0,941 0,8855
Demanda de mangos Tamaño de los mangos -0,854 0,7293
Días desde la cosecha -0,751 0,5640

Notas
EPE UPC 223

Validación del modelo. Prueba de hipótesis sobre la pendiente


Permite verificar si existe relación lineal entre las variables en estudio:

H0 :  1  0 La variable X no es significativa en el modelo


H1 :  1  0 La variable X sí es significativa en el modelo

La prueba es bilateral.

El estadístico de prueba es:


b1
Tc  ~ t n 2
S b1
b1: Coeficiente de regresión estimado
Sb1 : Desviación estándar del coeficiente de regresión b1, es decir, el error estándar de b1.
Se
Sb1 
x 2
i  nx 2
Se : Error estándar (error típico) de estimación, que calcula del análisis de varianza: S e  CME

La región crítica o de rechazo se determina a partir de una distribución t de Student con n – 2 grados
de libertad.

Con el Excel, se observa el valor p de la siguiente tabla y se rechaza H0 si el valor p es menor que α.

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción b0 Valor p
Variable X b1 Valor p

Para el caso de regresión lineal simple también se puede realizar esta prueba usando el análisis de
varianza de la regresión.

ANÁLISIS DE VARIANZA
Fuente de variación Grados de libertad Suma de cuadrados Cuadrado medio Fc Ftab
Regresión 1 SCR CMR Fcal F(1; n-2)
Error n-2 SCE CME
Total n -1 CST

Se rechazará la hipótesis nula si: Fcal > Ftabla

También: se rechaza H0 si valor p < α (nivel de significación)

Reporte de regresión en Excel

En Excel, se puede obtener este reporte de regresión mediante la opción en Datos. Luego se hace clic
en Análisis de Datos y finalmente en Regresión.

Cabe mencionar, que Excel presenta un error en el texto “Valor crítico de F” en la tabla Análisis de
varianza, el texto correcto es “Probabilidad”, que se refiere al valor p de la prueba.

Notas
224 CE104 Estadística

Ejercicio 133
En una empresa aérea se desea establecer un modelo de regresión entre la cantidad de agua necesa-
ria, en litros, en un vuelo y el número de pasajeros en ese vuelo. Se tiene la siguiente información.
Cantidad de agua 91 91 93 97 97 99 99 101 101 101 104 105 105 107 107
Cantidad de pasajeros 80 82 82 85 85 86 87 87 90 93 93 95 95 97 98

Solución
a. Indique la variable independiente y la dependiente. Complete los valores en la tabla.
Variable dependiente: …..…..…..….…..…...…..…..….…..…..…..…..….…..…..…..…..….…..…..…..…..….…..….
Variable independiente: …..…..…..….…..…...…..…...…..…..…..…..….…..…..…..…..….…..…..…..…..….…..….
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple
Coeficiente de determinación R^2

Coeficientes Error típico Estadístico t Probabilidad


6,0602 3,5751 0,0034
0,0680 12,9300 8,4941E-09

b. Calcule la ecuación de regresión lineal. Interprete el coeficiente de regresión del modelo.

c. Calcule e interprete el coeficiente de determinación del modelo.

d. Calcule e interprete el coeficiente de correlación del modelo.

e. Valide el modelo de regresión lineal. Use un nivel de significación del 5%.

f. Estime la cantidad de agua necesaria para un vuelo con 110 pasajeros

Notas
EPE UPC 225

Ejercicio 134
Se llevó a cabo un estudio para determinar la relación entre el número de años de experiencia (X) y el
salario mensual, en cientos de soles (Y) entre los administradores de cierta ciudad. Para ello, se tomó
una muestra aleatoria de 16 administradores y se obtuvieron los siguientes datos:

Experiencia Salario Experiencia Salario Experiencia Salario


13 41,76 20 58,40 31 58,24
16 53,12 1 27,04 19 54,08
30 57,76 4 31,68 7 34,24
2 26,40 10 39,36 15 49,60
8 42,24 27 57,60 25 58,40
6 30,56

a. Obtenga un diagrama de dispersión con la información anterior.


b. Calcule la recta de regresión de mínimos cuadrados. Interprete los coeficientes del modelo.
c. El salario de un administrador que tiene 18 años de experiencia.
d. El coeficiente de correlación. Interprete este valor.
e. El coeficiente de determinación. Interprete este valor.
f. Compruebe la validez del modelo obtenido. Use α = 0,05.
Solución
a. Obtenga un diagrama de dispersión con la información anterior.

b. Calcule la recta de regresión de mínimos cuadrados. Interprete los coeficientes del modelo.

En Excel use Análisis de datos en Excel es Herramientas > Análisis de datos > Regresión

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,939884642
Coeficiente de determinación R^2 0,883383141
R^2 ajustado 0,875053365
Error típico 4,325046117
Observaciones 16

Notas
226 CE104 Estadística

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 28,0619 1,9708 14,2389 1,01155E-09 23,835 32,289
Experiencia 1,1602 0,1127 10,2981 6,48427E-08 0,919 1,402

La ecuación de la recta de regresión es ŷ  28,0619 1,1602 x

b0  28,0619. Cuando el administrador no tiene experiencia, el valor de su salario es de aproxi-


madamente 2 806,19 soles mensuales.
b1  1,1602. Ante el incremento de un año de experiencia del administrador el salario se ve in-
crementado en 116,02 soles mensuales aproximadamente.

c. El salario de un administrador que tiene 18 años de experiencia.

Cuando el administrador tiene 18 años de experiencia su salario aproximado será de:


ŷ  28,0619 1,1602 x 18  48,9455 cientos de soles mensuales.
ŷ = 489,55 soles mensuales.

d. El coeficiente de correlación. Interprete este valor.

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,939884642
Coeficiente de determinación R^2 0,883383141
R^2 ajustado 0,875053365
Error típico 4,325046117
Observaciones 16
El coeficiente de correlación es 0,93988, es decir, existe una relación fuerte y directa entre los
años de experiencia del administrador y el salario que percibe.

e. El coeficiente de determinación. Interprete este valor.

El coeficiente de determinación (R^2) es 0,8834, es decir, el 88,34 % de la varianza del salario


mensual de un administrador es explicado por el modelo de regresión.

f. Compruebe la validez del modelo obtenido. Use α = 0,05.

H 0:  1  0
H1:  1  0

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 28,0619 1,9708 14,2389 1,01155E-09 23,835 32,289
Experiencia 1,1602 0,1127 10,2981 6,48427E-08 0,919 1,402

El valor p es 6,48427E-08 < 0,05. Por lo tanto, se rechaza H0, es decir, bajo un nivel de significa-
ción del 5% podemos afirmar que existe una relación funcional lineal entre los años de expe-
riencia y el salario del administrador.

Notas
EPE UPC 227

Ejercicios propuestos

109. Un economista del Departamento de Recursos Humanos del estado de Florida está preparan-
do un estudio sobre el comportamiento del consumidor. Él recolectó los datos que aparecen
en miles de dólares para determinar si existe una relación entre el ingreso del consumidor y los
niveles de consumo. Determine cuál es la variable dependiente.

Consumidor 1 2 3 4 5 6 7 8 9 10 11
Ingreso 24,3 12,5 31,2 28 35,1 10,5 23,2 10 8,5 15,9 14,7
Consumo 16,2 8,5 15 17 24,2 11,2 15 7,1 3,5 11,5 10,7
a. Elabore el diagrama de dispersión para los datos.
b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre
el consumo y el ingreso?
c. ¿Qué proporción de cada dólar adicional que se gana se invierte en consumo?

110. Se reúne datos acerca de la cantidad de familias que ven programas donde se pasan determina-
do anuncio. Esta observación es de utilidad para los publicistas. porque les dice a cuantos con-
sumidores llegan. Los datos siguientes muestran la cantidad de familias espectadoras. en miles.
y la cantidad de veces que salió al aire el anuncio en una semana.
Veces que salió el anuncio 95 46 41 38 29 32 25 21 21 16
Familias espectadoras 758,8 323,0 275,3 241,8 219,9 198,5 193,8 189,7 161,9 160,0
a. Determine la ecuación de regresión para predecir la cantidad de familias espectadoras a
partir de la cantidad de veces que apareció el anuncio. Suponga que existe una relación en-
tre la cantidad de familias espectadoras y la cantidad de veces que apareció el anuncio.
b. Interprete los coeficientes de regresión de la ecuación de la parte a)
c. Validar el modelo de la parte a). Use un nivel de significación del 5%.
d. ¿Se puede afirmar que por cada anuncio adicional que se realice el número de familias es-
pectadoras se incrementa en 6000? Use un nivel de significación del 5%.
e. ¿Qué porcentaje de la variabilidad total del número de familias espectadoras es explicado
por el modelo determinado en la parte a)?

111. En un estudio acerca de la talla. medidas en centímetros y el peso. medido en kilogramos. de un


grupo de 10 personas. se ha recolectado los siguientes valores:

Talla (cm.) 160 165 168 170 171 175 175 180 180 182
Peso (kg.) 55 58 58 61 67 62 66 74 79 83

a. Identifique la variable independiente y la variable dependiente


b. Elabore el diagrama de dispersión.
c. Suponga que existe una relación funcional lineal entre la talla y el peso y escriba la ecuación
de regresión lineal simple.
d. Interprete los coeficientes de la línea de regresión estimada.
e. ¿Existe relación funcional lineal entre el peso y la talla de las personas? Use un nivel de signi-
ficación del 5%
f. ¿Se puede afirmar que por cada centímetro adicional en la talla de la persona, los pesos se
incrementan en un kilogramo? Use un nivel de significación del 5%
g. Calcule e interprete el coeficiente de determinación
h. Calcule e interprete el coeficiente de correlación
i. ¿En cuánto se estima el peso de una persona, cuando su talla es de 162 centímetros?

Notas
228 CE104 Estadística

112. Los siguientes datos corresponden al cloro residual en una piscina en diversos momentos des-
pués de haberse tratado con químicos.

Número de horas Cloro residual (partes por millón)


2 1,8
4 1,5
6 1,4
8 1,1
10 1,1
12 0,9

a. Estime la recta por el método de mínimos cuadrados. Interprete sus coeficientes.


b. Calcule e interprete el coeficiente de determinación.
c. Verifique la existencia de la pendiente del modelo. Use un nivel de significación de 0,05.

113. El propietario de una empresa de mudanzas desea desarrollar un modelo de regresión que le
permita estimar el tiempo total (horas) empleado para realizar una mudanza en función de la
carga transportada (pies cúbicos). Para lograr su propósito recolectó la información que a usted
se muestra a continuación.

Y: horas 24 13,5 26,3 25 9 20 22 11,3 50 12 38,75 40 19,5 18 28


X: pies3 545 400 562 540 220 344 569 340 900 285 865 831 344 360 750

a. Determine la ecuación de regresión lineal simple e interprete sus coeficientes.


b. Valide el modelo de regresión usando un nivel de significación del 5%.
c. Interprete el coeficiente de determinación y correlación.
d. ¿Se puede afirmar que por cada pie cúbico adicional en la carga transportada el tiempo total
para realizar la mudanza aumenta en menos de 0,07 horas? Use un nivel de significación del
5%.
e. Estimar el tiempo medio total empleado para realizar una mudanza cuando el transporte tie-
ne una carga de 400 pies cúbicos.

Notas
EPE UPC 229

Análisis de regresión lineal

1. Digite y seleccione los datos de la siguiente manera:

2. En el menú principal seleccione Insertar, luego Dispersión y después Dispersión solo con marcadores.

2. Botón Dis-
1. Menú Inser- persión
tar

3. Dispersión solo
con marcadores

4. Clic derecho
en uno de los
puntos
5. Agregar línea
de tendencia

Notas
230 CE104 Estadística

6. Haga clic en
Lineal.

7. Clic en Ce-
rrar.

Obtendrá el siguiente gráfico de dispersión

Salario según años de experiencia

70
60
50
Salario

40
30
20
10
0
0 10 20 30 40
Años de experiencia

3. Luego vaya a Datos elija la opción Análisis de datos y luego Regresión

1. Elija Datos
2. Haga clic en
Análisis de Datos

4. Haga clic en
Aceptar
3. Elija Regresión

Notas
EPE UPC 231

1. Seleccione X 2. Seleccione Y

3. Activar Rótulos (si se


seleccionó la base de 4. Seleccionar celda
datos con los títulos) en la cual saldrá tus
resultados

5.Clic en Aceptar
Estadísticas de la regresión
Coeficiente de
correlación múltiple 0.93988
Coeficiente de
determinación R^2 0.88338
R^2 ajustado 0.87505
Error típico 4.32505
Observaciones 16

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 1983.8 1983.8 106.1 6E-08
Residuos 14 261.884 18.706
Total 15 2245.68

Error Estadístico Inferior Superior


Coeficientes típico t Probabilidad 95% 95%
Intercepción 28.0619 1.97079 14.239 1E-09 23.84 32.29
Exper. 1.16021 0.11266 10.298 6E-08 0.919 1.402

Notas
232 CE104 Estadística

Ejercicio 135 Caso: Natural Power Nutrition


Natural Power Nutrition es una empresa peruana líder en el mercado de vitaminas y complementos
nutricionales para la salud y el deporte. Son representantes de marcas mundialmente reconocidas. El
gerente de la empresa, preocupado por la baja demanda a inicios del año, desea identificar los prin-
cipales problemas que ocasionaron la migración de sus clientes a la competencia, para ello ha reali-
zado un estudio. El estudio encuestó a 200 clientes, a los cuales se midió las siguientes variables:
 Edad: Edad del cliente, en años.
 Tipo de suplemento: Proteína, quemador de grasa, ganador de masa, preentreno y aminoácidos.
 Sexo: Sexo del cliente (Femenino, masculino).
 Nivel de satisfacción: Nivel de satisfacción del cliente respecto a la atención (Totalmente satisfe-
cho, satisfecho, insatisfecho, totalmente insatisfecho).
 Problemas reportados: Los productos no llegan a tiempo, error de envío de tipo de producto,
consultor desconoce los productos del catálogo, no responden a tiempo los reclamos presenta-
dos por Facebook, muy pocos puntos de ventas, otros
 Tipo de compra: Compra por internet, compra directa de tienda, compra directo a consultor
 Monto de compra: Monto de compra del cliente durante al mes (en soles).
 Tipo de pago: Tipo de pago que el cliente realiza en su compra (Efectivo, tarjeta de débito, tarje-
ta de crédito)
 Número de productos: Número de productos que compra el cliente al mes.
 Tiempo de demora: Es el tiempo que demora en llegar el producto a su casa (minutos)
Parte de la base de datos obtenida con la información de los clientes se muestra a continuación:
Monto de Tiempo
Tipo de su- Nivel de Problema Tipo de Tipo de Número de
ID Edad Sexo compra de demo-
plemento satisfacción reportado compra pago productos
unitario ra
1 23 Aminoácidos Femenino Satisfecho Ninguno Internet 153 Crédito 1 100
Pocos puntos
2 21 Preentreno Femenino Insatisfecho Consultor 153 Crédito 1 50
de venta
3 29 Aminoácidos Femenino Satisfecho Ninguno Internet 153 Crédito 1 20
. . . . . . . . . . .
Totalmente
200 31 Ganador masa Masculino Ninguno Internet 150 Crédito 3 55
satisfecho

Definiciones básicas
5. Complete la información solicitada, indique:
Población Todos los clientes de la empresa Natural Power Nutrition
Muestra Algunos clientes de la empresa Natural Power Nutrition
Unidad elemental Un cliente de la empresa Natural Power Nutrition
6. Complete los espacios en la tabla considerando la información del estudio:

Nombre de la variable Tipo de variable Escala Dato


Tipo de suplemento Cualitativa Nominal Aminoácidos
Nivel de satisfacción Cualitativa Ordinal Satisfecho
Monto de compra Cuantitativa continua Razón 149 soles
Número de productos Cuantitativa discreta Razón 20
7. Algunos resultados del estudio mostraron:
 El 37,5% de los clientes encuestados realizan su compra por Internet.
 El tiempo promedio de demora de productos al mes es de 1,2 horas.
 El 20% de los clientes realiza su pago con tarjeta de crédito.
 La edad promedio de los clientes es 22 años.
 El problema más común que los clientes manifiestan es que hay muy pocos puntos de venta.
Notas
EPE UPC 233

Complete los espacios en blanco considerando los resultados del estudio.

Nombre de la variable Tipo de variable Estadístico Valor del estadístico


Tipo de compra Cualitativa Porcentaje 37,5 %
Tiempo de envío Cuantitativa continua Media 1,2 horas
Tipo de pago Cualitativa Porcentaje 20%
Edad Cuantitativa continua Promedio 22 años
Tipo de problema Cualitativa Moda Pocos puntos de ventas

8. De la base de datos, complete los siguientes espacios en blanco:


Cantidad total de datos 2000
Cantidad total de observaciones 200
Cantidad de datos que conforman una
10
observación
Un ejemplo de observación Aminoácidos, femenino, satisfecho, ninguno, por
Internet, 153 soles, crédito, un producto, una hora

Objetivo 1: Determinar el producto comprado con más preferencia por los clientes al mes.
Complete los elementos faltantes y responda a los enunciados solicitados.
Distribución porcentual de los clientes según tipo de suplemento
30.00%
24.50%
Porcentaje de clientes

24.00%
25.00%
19.50%
20.00% 18.00%
14.00%
15.00%
10.00%
5.00%
0.00%
Aminoácidos Ganador de masa Pre Proteina Quemador de
entrenamiento grasa
Tipo de suplemento
Fuente: Natural Power Nutrición
e. Responda al objetivo: Pre entrenamiento, pues su porcentaje (25,5%) es el mayor de todos.
f. El número de clientes que ha comprado quemador de grasa es: 39
g. Interprete h2%: De total de clientes, el 18% de los clientes compran el suplemento ganador de
grasa
h. Construye la tabla de frecuencia usando el gráfico de columnas.

Título: Distribución de los clientes según tipo de suplemento


Tipo de suplemento Número de clientes hi
Proteína 28 0.140
Quemador de grasa 39 0.195
Ganador de masa 36 0.180
Pre-entreno 49 0.245
Aminoácido 48 0.240
Fuente: Natural Power Nutrition

Notas
234 CE104 Estadística

Objetivo 2: Identificar el tipo de pago de mayor preferencia entre los clientes para evaluar una estra-
tegia promocional por tipo de producto.
A continuación, se muestra la siguiente información obtenidas de los 200 clientes al momento de
analizar el tipo de suplemento y el turno de pago.

Tipo de pago
Total
Tipo de suplemento Efectivo Tarjeta de crédito Tarjeta de débito
Proteína 3,75% 12,50% 7,50% 23,75%
Quemador de grasa 6,25% 10,00% 3,75% 20,00%
Ganador de masa 5,00% 8,75% 11,25% 25,00%
Preentreno 7,50% 5,63% 3,12% 16,25%
Aminoácidos 2,50% 7,50% 5,00% 15,00%
Total 25,00% 44,38% 30,62% 100,00%
Fuente: Natural Power Nutrition
a) Complete los elementos faltantes de la tabla y el gráfico mostrado.
 Título de la tabla: Distribución porcentual de clientes según tipo de pago y tipo
de suplemento
 Valor faltante del gráfico: 33,33%
 Valor faltante de la tabla: 3,12%
 El tipo de gráfico mostrado es: Agrupado

b) Según lo observado en la tabla y el grafico llene los siguientes espacios en blanco:


 Del total de clientes, el 12,5% compran proteínas y realizan el pago de la compra con tarjeta
de crédito,
 Del total de clientes que compran proteínas, el 52,63% realizan el pago de la compra con tar-
jeta de crédito,
 De total de clientes, el número de clientes que compró el tipo de suplemento quemador de
grasa es:40 Clientes,
 Del total de clientes que pagan en efectivo, son 50 clientes compran complemento ganador
de grasa,
 Los gráficos posibles para elaborar con la tabla 2 son: agrupados y apilados

c) Responda al objetivo: Para los productos proteína, quemador de grasa y aminoácidos es con
tarjeta de crédito, mientras que; ganador de grasa es tarjeta de débito y pre-entrenamiento paga
con efectivo.

Notas
EPE UPC 235

Objetivo 3: Determinar el número de productos comprados menos frecuente por los clientes al mes.
Complete el valor faltante y responda los enunciados solicitados.

f. Responda al objetivo: Seis productos


g. El número de productos mínimo comprados por la mitad de sus clientes es: Tres
h. Interpretar h3%: De total de clientes, el 26% de los clientes compran tres productos
i. El porcentaje de clientes que compran más de tres productos es: 43,5% ((32 + 38 + 17)/200)%)
j. Interpretar F2: Son 61 (25 + 36) clientes que compran como máximo dos productos

Objetivo 4: Determinar la distribución de los clientes respecto al tiempo de demora que llega el pro-
ducto a su casa.
El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168

a. Construir la tabla de distribución de frecuencias, use la regla de Sturges.


Rango (R) 100
k = número de intervalos = 1+3,322 log(n) 7
Amplitud (w) 15
Distribución de los clientes según tiempo de demora que llega el producto a su casa
Tiempo de demora Marca de clase fi hi Fi Hi
68 83 75,5 4 0,0769 4 0,0769
83 98 90,5 7 0,1346 11 0,2115
98 113 105,5 15 0,2885 26 0,5000
113 128 120,5 10 0,1923 36 0,6923
128 143 135,5 6 0,1154 42 0,8077
143 158 150,5 7 0,1346 49 0,9423
158 173 165,5 3 0,0577 52 1,0000
Fuente: Natural Power Nutrition

b. Interprete h2%: Del total de clientes, el 13,46% de clientes su tiempo en que demora que llegue
su producto es más de 83 minutos hasta 98 minutos,
c. Interprete F4: Son 36 clientes su tiempo de demora que llegue su producto es a lo más 69,23%.

Notas
236 CE104 Estadística

Objetivo 5: Clasificar los montos de compras al mes de sus clientes.

a. Complete los elementos faltantes del histograma de frecuencias del monto de compra al mes.

20%
17.5%
18%
16% 14.5%
14% 13.0% 12.5% 12.0%
12%
10.0%
10%
7.5% 8.0%
8%
6% 5.0%

4%
2%
0%
81.4 102.7 124 145.3 166.6 187.9 209.2 230.5 251.8 273.1
Fuente: Natural Power Nutrition

 Título: Distribución de clientes según su monto de compra al mes (soles)


 Título en el eje X: Monto en soles
 Título en el eje Y: Porcentaje de clientes

a) Teniendo en cuenta el gráfico de frecuencia construye la tabla de frecuencia

Tabla 1: Distribución de clientes según su monto de compra al mes (soles)


Monto de compra Marca de clase fi hi Fi Hi
[81,4 102,7 92,05 26 0,130 26 0,130
102,7 124,0 113,35 15 0,075 41 0,205
124,0 145,3 134,65 20 0,100 61 0,305
145,3 166,6 155,95 16 0,080 77 0,385
166,6 187,9 177,25 29 0,145 106 0,530
187,9 209,2 198,55 35 0,175 141 0,705
209,2 230,5 219,85 25 0,125 166 0,830
230,5 251,8 241,15 10 0,050 176 0,880
251,8 273,1 262,45 24 0,120 200 1
Fuente: Natural Power Nutrition

Objetivo 6: Identificar la concentración de los clientes respecto al tiempo de demora que llega el
producto a su casa.

Jorge ha decidido crear una tabla que permita conocer la distribución porcentual de la variable estu-
diada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:

68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168

Notas
EPE UPC 237

d. A partir de los datos, calcule el indicador pertinente que permita responder al objetivo.
Mediana 113,5 Media 117,519231 Desviación 24,2717381 As 0,4967791

e. Responda al objetivo
Presenta una asimetría positiva, los tiempos de demora se concentran en valores bajos es decir
se demoran poco al llevar los productos a la casa de los clientes

f. La empresa contratará más motorizados si se tardan mucho en enviar sus productos, ¿Deben
contratar más motorizados?
No, porque los tiempos de envío se concentran en valores bajos.

Objetivo 7: Comparar el monto de compra entre los clientes de sexo masculino y los de sexo feme-
nino.

Los datos representan el monto de compra de los clientes por sexo.

Femenino Masculino
Media 152,832 Media 153,606
Mediana 154,000 Mediana 168,000
Moda 153,000 Moda 149,000
Desviación estándar 37,527 Desviación estándar 43,840
Varianza de la muestra 1408,261 Varianza de la muestra 1921,955
Coeficiente de asimetría -0,609 Coeficiente de asimetría -0,612
Rango 139 Rango 165
Suma 15436 Suma 15207
Cuenta 101 Cuenta 99

a. Encuentre los valores faltantes de los clientes de sexo femenino: 152,832, 1408,261 y 101
b. Encuentre los valores faltantes de los clientes de sexo masculino: 43,840 y 15207
c. Encuentre el valor del coeficiente de variación para el sexo masculino: 28,58%
d. Encuentre el valor del coeficiente de variación para el sexo femenino: 24,54%
e. Indique el sexo con los montos de compra más homogéneos: Femenino
f. La empresa emprenderá una campaña promocional al sexo que presente mayor dispersión, ¿cuál
es el sexo que debe emprender la campaña? Masculino

Notas
238 CE104 Estadística

Índice
Axiomas de la probabilidad, 124 Mediana, 55
Coeficiente de asimetría Medidas de asimetría, 70
de Fisher, 70 Medidas de dispersión, 61
Coeficiente de variación, 66 Medidas de tendencia central, 53
Cuantiles, 58 Moda, 56
Desviación estándar, 64 Probabilidad
de una variable aleatoria, 148 condicional, 125
Distribución Teoremas básicos de, 124
binomial, 155 Rango
de frecuencias, 26, 29 de una variable, 62
normal, 163 Rango intercuartil, 62
Poisson, 159 Tabulaciones cruzadas, 34
Espacio muestral, 120 Teorema de Bayes, 132
Partición de un, 132 Teorema de la probabilidad total, 132
Evento, 120 Valor esperado
Complemento, 122 de una variable aleatoria discreta, 148
Eventos Variable aleatoria
independientes, 129 definición, 144
Intersección de, 122 discreta, 145
Unión de, 122 Función de probabilidad, 145
Gráfico Varianza, 64
circular, 22 de una variable aleatoria discreta, 148
de barras, 22

Notas

You might also like