Professional Documents
Culture Documents
Ciencias Aplicadas
Estudios Profesionales
para Ejecutivos
ESTADÍSTICA
CE104
Esta guía ha sido realizada con el trabajo de la profesora Silvia Gutiérrez y el profesor Walter Luna y
los aportes de los profesores Jimmy Chávez, Elba Vega, Fanny Campomanes, Raúl Aliaga, Violeta Val-
cárcel, Pilar Depaz, Miluska Osorio y los demás profesores del curso.
Los autores agradeceremos que los usuarios de esta guía nos hagan llegar sus críticas y comentarios
a esta publicación.
Los autores.
Estadística
Es la ciencia que proporciona un conjunto de métodos, técnicas y procedimientos para recopilar,
organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones válidas.
Subdivisión de la Estadística
Estadística
Descriptiva Inferencial
Estadística descriptiva
Son métodos asociados a la caracterización, resumen y presentación
de datos, que permiten describirlos apropiadamente. Comprende el
uso de gráficos, tablas e indicadores de resumen obtenidos al realizar
algunos cálculos.
Estadística inferencial
Son métodos y técnicas que hacen posible estimar una o más caracte-
rísticas de una población o tomar decisiones referentes a una pobla-
ción, basados en los resultados obtenidos del estudio de muestras ele- Flash
gidas adecuadamente.
electoral
Estas conclusiones no tienen que ser totalmente válidas, pueden tener
cierto margen de error, por eso se dan con una medida de confiabili-
dad o probabilidad.
Notas
10 CE104 Estadística
Población
Es el conjunto de todas las unidades elementales de interés en un determinado estudio.
Pueden ser personas, animales, objetos, conceptos, etc. de los cuales sacamos conclusiones a
partir de una o más características observables de naturaleza cualitativa o cuantitativa
Muestra
Es una parte o un subconjunto de la población que se selecciona adecuadamente para obtener in-
formación acerca de la población de la cual proviene.
Una muestra será representativa si es elegida de forma aleatoria
Unidad elemental
Es el objeto sobre el cual se hace la medición. También se le conoce como unidad de análisis, unidad
estadística o elemento
Por ejemplo, en estudios de poblaciones humanas, con frecuencia ocurre que la unidad elemen-
tal es cada individuo.
Encuesta
Actividad que tiene por objetivo la recopilación de información.
Ejercicio 1
De los universitarios que estudian en la ciudad de Lima, se quiere estimar el porcentaje de universita-
rios que trabajan. Determine:
Población
Muestra
Unidad elemental
Notas
EPE UPC 11
Ejercicio 2
En el presente año se realizarán los Censos Nacionales 2017: XII de Población, VII de Vivienda y III de
Comunidades Indígenas. Las unidades estadísticas de investigación y análisis del censo de población
serán las personas individuales y el hogar que conforman, mientras que para el censo de vivienda
será la vivienda y para el caso de comunidades indígenas será la comunidad.
Tomado de http://www.censos2017.pe
Notas
12 CE104 Estadística
Ejercicio 3
Se desea estimar la media del ingreso mensual de los taxistas de Lima. Determine:
Población
Muestra
Unidad elemental
Ejercicio 4
Se desea estimar el promedio diario de clientes que ingresan a un supermercado, para lo cual se eli-
gieron cinco días al azar del presente mes y se registró el número de clientes que ingresó cada día al
supermercado. Determine:
Población
Muestra
Unidad elemental
Dato
Es el resultado de medir una característica de una unidad elemental.
Observación
Es el conjunto de datos de una unidad elemental. La observación se obtiene para cada unidad ele-
mental.
Por ejemplo, para una vivienda se pueden registrar los siguientes datos, que conforman una obser-
vación.
Ejercicio 5
Se hace una encuesta a los alumnos de EPE, entre ellos a usted. Responda a las siguientes preguntas:
¿Cuál es su nombre? ……………………………………………………………………………………………………………………………
¿Cuál es su sexo? …………………………………………………………………………………………………………………………………
¿En qué distrito vive? …………………………………………………………………………………………………………….……………
¿Cuántos hermanos tiene? ……………………………………………………………………………………………………….…………
Indique:
Unidad elemental
Un dato
Una observación
Notas
EPE UPC 13
Variable
Se define así a una característica que presentan los elementos de una población y que puede asumir
diferentes valores cuando se realiza su medición.
Variables cualitativas
Son aquellas variables que al ser medidas quedan expresadas por etiquetas o nombres que se utilizan
para identificar una característica o atributo.
Variables cuantitativas
Son aquellas variables que al ser medidas quedan expresadas por números que se utilizan para identifi-
car una característica o atributo.
Estas a su vez pueden clasificarse en discretas o continuas.
Una variable es cuantitativa discreta si el conjunto de posibles valores que toma es finito o infinito
numerable, es decir, que sólo puede tomar ciertos valores en un intervalo determinado.
Una variable es cuantitativa continua si el conjunto de posibles valores es infinito no numerable, es
decir, que puede tomar cualquier valor en un intervalo determinado.
Cualitativa
Cuantitativa
Cuantitativa continua
Ejercicio 6
Las siguientes variables son de una encuesta aplicada a un postulante de una agencia publicitaria:
Variables cualitativas
Lugar de nacimiento
Grado de instrucción
Variables cuantitativas discretas
Número de capacitaciones que llevó el año anterior
Número de trabajos que ha tenido en los últimos dos años
Variables cuantitativas continuas
Tiempo que demora para trasladarse de su casa al trabajo (en minutos)
Salario actual (en soles)
Ejercicio 7
Los clientes que se suscriben a la revista Economía A llenan un formato con información personal.
Identifique el tipo de cada variable.
Variable Tipo de variable
Sexo
Profesión
Ingreso mensual familiar (en soles)
Grado de instrucción
Número de hijos
Notas
14 CE104 Estadística
Escalas de medición
Otra forma común de clasificar las variables es mediante el uso de cuatro niveles de medición; nomi-
nal, ordinal, de intervalo y de razón. Cuando la estadística se aplica a problemas reales el nivel de
medición de las variables es un factor importante para determinar el procedimiento a usar.
Escala nominal
Los diferentes valores que toma una variable medida en escala nominal carecen de un orden o de un
significado numérico, no pueden utilizarse para realizar cálculos. A menudo se asignan números a las
diferentes categorías, pero no tienen significado computacional y cualquier promedio que se calcule
carece de sentido.
Escala ordinal
La escala de medición ordinal permite establecer un orden entre los diferentes valores que toma la
variable. En esta escala de medición no es posible determinar las diferencias entre los valores de la
variable o tales diferencias carecen de sentido.
Escala de intervalo
Los datos son numéricos. La escala de medición de intervalo tiene las propiedades de la escala ordi-
nal, pero con la característica adicional que la diferencia entre dos valores cualesquiera de la variable
tiene un significado. Sin embargo, los valores en esta escala no tienen un punto de partida natural o
cero.
Escala de razón
La escala de medición de razón tiene las propiedades de la escala de intervalo con la propiedad adi-
cional de tener un punto de partida natural o cero, que indica que nada de la variable se encuentra
presente. Para esta escala de medición además de las diferencias, las proporciones también tienen
significado.
Notas
EPE UPC 15
Ejercicio 8
Complete la siguiente tabla:
Número de celular
Ejercicio 9
En base a la siguiente lista de variables:
Tamaño de bebida (pequeño, mediano, grande)
Marca de celular
Número de personas a favor de la pena de muerte
Ventas anuales, en dólares
Año de fabricación de auto
Kilometraje de auto
Marca de automóvil
Intervalo
Ordinal
Cuantitativa continua
Nominal
Cuantitativa discreta
Cualitativa
Notas
16 CE104 Estadística
Parámetro
Un parámetro es un valor que representa alguna característica de la población.
Estadístico
Un estadístico o estimador es un valor que representa alguna característica de la muestra.
Ejercicio 10
En este ejemplo, el parámetro es <porcentaje poblacional de votantes que lo hicieron por PPK> y su
valor es 50,120%. Es parámetro pues este porcentaje fue calculado contando todos los votos válidos.
En este ejemplo, el estadístico es <porcentaje muestral de votantes que lo hicieron por PPK> y su
valor es 46,9%. Es estadístico pues este porcentaje fue calculado de una muestra obtenida antes de
la votación.
Notas
EPE UPC 17
Ejercicio 11
Según los Censos Nacionales XI de Población y VI de Vivienda 2007 ejecutados por el INEI, el 50,30%
de los peruanos son mujeres, ¿este dato es un parámetro o un estimador?
Solución
Ejercicio 12
Según la Encuesta Demográfica y de Salud Familiar (Endes 2016), publicada en junio del 2017, el
68,2% de las mujeres en el Perú han sido víctimas de violencia psicológica, física o sexual alguna vez
por parte de sus respectivas parejas, ¿este dato es un parámetro o un estimador?
Solución
Ejercicio 13
El banco A estudió la información que dieron sus clientes en el presente mes al solicitar un préstamo
vehicular.
Al seleccionar una muestra de 180 clientes algunos resultados fueron:
• El 12% declaró tener un trabajo independiente.
• La media de la edad de los clientes al solicitar un préstamo fue de 41,3 años.
• El 50% declaró ser casado.
• La media del monto de las solicitudes fue de 3025 soles.
Identifique el estimador y el valor del estimador para cada una de las variables.
Solución
Notas
18 CE104 Estadística
Ejercicio 14
El hotel La Posada es nuevo en el mercado hotelero de Puno. La gerencia general desea invertir en
publicidad para incrementar la cantidad de huéspedes extranjeros en el hotel. Desea conocer qué
características del hotel es conveniente resaltar en la publicidad, para ello aplicó una encuesta a una
muestra aleatoria de 56 mujeres y 64 hombres extranjeros que se hospedaron entre enero y mayo
del presente año. A continuación, se presenta parte de la base de datos:
Dato X4 = 65 años
Observación X4 = 65 años, masculino, Francia, 45 dólares, 0 acompañantes, precio
Notas
EPE UPC 19
g. Identifique el estimador y el valor del estimador para cada una de las variables de la base de da-
tos.
Notas
20 CE104 Estadística
Notas
EPE UPC 21
Distribución de frecuencias
Es el resumen de un conjunto
Esta tabla muestra las
de datos, presentado en una
frecuencias absolutas, las Las categorías o clases no se
tabla llamada la tabla de
frecuencias relativas y los traslapan.
distribución de frecuencias
porcentajes
(TDF)
Si la medición está hecha en escala nominal sólo deberá mostrarse las frecuencias absolutas y
relativas.
Si la variable cualitativa está medida en escala ordinal, tendrá sentido mostrar las frecuencias
acumuladas absolutas y relativas.
Notas
22 CE104 Estadística
Ejercicio 15
Perú: Distribución de víctimas de feminicidio, según región de ocurrencia. 2014
Región fi pi
Lima 29 31,87%
Arequipa 10 10,99%
Puno 7 7,69%
Cusco 6 6,59%
Junín 6 6,59%
La Libertad 5 5,49%
Ayacucho 4 4,40%
Huánuco 4 4,40%
Lambayeque 4 4,40%
Otros 16 17,60%
Fuente: Ministerio Público Perú - Observatorio de Criminalidad.2014
Interprete p1.
Interprete f3.
¿Se podría afirmar que los hombres son más violentos en Lima que en Arequipa?
Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de
ordenadas las frecuencias absolutas, relativas o porcentuales.
Gráfico circular
En este caso las categorías de la variable cualitativa ocupan un espacio en el círculo
que es proporcional a la frecuencia que representan. También se denomina
diagrama de sector circular, gráfico tipo torta o pastel.
Notas
EPE UPC 23
Ejercicio 16
La universidad A realizó una encuesta a 30 jóvenes que están terminando el colegio con la finalidad
de conocer sus preferencias profesionales.
Solución
a. Obtenga la tabla de distribución de frecuencias.
Notas
24 CE104 Estadística
Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y
solo el 10% prefiere la carrera de Deporte.
Interpretación
Del gráfico se puede observar que el 26,7% de los estudiantes prefieren la carrera de Ingeniería y
solo el 10% prefiere la carrera de Deporte.
Notas
EPE UPC 25
Ejercicio 17
Se aplicó una encuesta a una muestra de 30 empleados de la empresa Motores A. Se preguntó por la
función que desempeñaba. Los datos se presentan a continuación:
Obrero Profesional Técnico Servicios Obrero Obrero Obrero Obrero
Profesional Producción Técnico Producción Obrero Producción Obrero Obrero
Obrero Técnico Profesional Obrero Técnico Producción Profesional
Obrero Producción Técnico Profesional Servicios Obrero Profesional
a. Presente la tabla de distribución de frecuencias.
b. Interprete la frecuencia absoluta y la frecuencia relativa de la primera categoría.
c. Realice e interprete el gráfico de barras de frecuencias absolutas.
Solución
a. Presente la tabla de distribución de frecuencias.
Título: ……………………………………………………………………………………………………………………………………….
Función fi hi pi
Obrero
Producción
Profesional
Servicios
Técnico
Total
Fuente: ……………………………………………………………………………
14
12
10
8
6
4
2
0
Obrero Producción Profesional Servicios Técnico/ventas
Función
Fuente: ..........................................................
Interpretación
Notas
26 CE104 Estadística
Ejercicio 18
500,000
400,000
300,000
200,000 119,642
58,315
100,000 18,748 9,908 81 32 22 7
0
0 1 2 3 4 5 6 7 8 9
Número de veces que postuló
Fuente: PERÚ, II Censo Nacional Universitario 2010. INEI
Calcule e interprete f2 y h1
Notas
EPE UPC 27
Ejercicio 19
Los siguientes datos corresponden a una encuesta realizada por un grupo de estudiantes de la uni-
versidad A a una muestra de 40 aficionados al cine. Al formular la pregunta, ¿cuántas veces ha visto
su película preferida? las respuestas fueron las siguientes:
1 2 3 4 3 3 2 3 6 3 3 4 6 3 2 3 3 2 4 1
2 3 4 3 1 1 2 4 1 2 2 3 1 3 4 2 1 4 6 2
Solución
a. Presente la tabla de distribución de frecuencias.
Título: …………………………………………………………………..……………………………………………………………………………
fi hi Fi Hi
Fuente: …………………………………………………………………………………
f3 = …………...
F2 = ………..…
h1 = …………..
H4 = …………..
Notas
28 CE104 Estadística
Ejercicio 20
Los siguientes datos corresponden al número de capacitaciones recibidas por los colaboradores de la
empresa Creativa en lo que va del año.
1 2 2 0 1 1 3 2 1 1 2 0 2 1 1 1 2 2 1 1 1 2 2 1 5 2 1 0 3 1
a. Presente la tabla de distribución de frecuencias.
b. Interprete f2, F2 , h3 y H2%
c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.
Solución
a. Presente la tabla de distribución de frecuencias.
b. Interprete f2 , F2 , h3 y H2%
c. Presente e interprete el gráfico de bastones de frecuencias absolutas para los siguientes datos.
Interpretación
De un total de treinta empleados, catorce de ellos han recibido una capacitación y solo un colabora-
dor ha recibido cinco capacitaciones en lo que va del año
Notas
EPE UPC 29
Por ejemplo:
𝒓 w
Si los datos tienen 𝒘=
𝒌 (redondeo a más)
Cero decimales w = 50,2381 w = 51
Una cifra decimal w = 50,2381 w = 50,3
Dos cifras decimales w = 50,2381 w = 50,24
Tres cifras decimales w = 50,2381 w = 50,239
Marcas de clase
Son los puntos medios de los límites de cada intervalo.
'
Su notación es X i
Se calcula de la siguiente manera:
Límiteinf erior Límitesuperior LI LS
Xi'
2 2
Límites de cada clase
Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y
sólo a una.
El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase y el lími-
te superior de clase es el valor máximo posible de los datos que se asigna a la clase.
Notas
30 CE104 Estadística
Ejercicio 21
10 24 38 40 43 44 51 53 55 57
16 25 39 40 43 46 51 53 55 57
21 31 39 40 43 46 52 53 55 58
21 31 40 43 44 47 53 54 55 62
23 33 40 43 44 48 53 54 55 65
Solución
Cálculo de los límites de los intervalos
Máximo =MAX(datos)
Mínimo =MIN(datos)
Rango =MAX(datos) – MIN(datos)
Cantidad de datos (n) =CONTAR(datos)
k (por regla de Sturges) =1+3,322*LOG10(n)
k (entero)
w (amplitud) =Rango/k (entero)
Número de decimales de los datos
w (redondeada por exceso)
Distribución de trabajadores según el tiempo de servicio
Tiempo de servicio Marca de clase fi hi Fi Hi
Fuente: Empresa A
Interprete.
f4 = …………..
F2 = ………….
h1 = …………..
H4 = ………….
Notas
EPE UPC 31
Ejercicio 22
El jefe de la Oficina de Rentas de una municipalidad ha realizado un estudio sobre los impuestos que
pagan los vecinos del distrito. Los datos de los pagos de impuestos, en soles, de 48 viviendas elegidas
al azar en el 2015 son:
145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7
151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6
159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7
195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1
Elabore la tabla de frecuencias para la variable “Pago por impuestos municipales” para el presente
año.
Solución
El rango r se calcula con:
r = valor máximo – valor mínimo = 351,1 – 145,1 = 206
Usamos redondeo por exceso a un decimal debido a que los datos tienen como máximo un decimal.
Interprete:
f2 = 3 En tres viviendas pagaron más de 174,60 soles y hasta de 204,10 soles
h3 %= 20,84% El 20,84% de las viviendas pagaron más de 204,10 soles y hasta 233,6 soles
Notas
32 CE104 Estadística
Ejercicio 23
A continuación, se muestra el tiempo de servicio, en meses, de los trabajadores de la empresa A.
Título: …………….………………………………………………………………………………………………………………………………
Marca de clase fi hi Fi Hi
[10 , 20 6
20 , 30 15
30 , 40 45
40 , 50 63
50 , 60 80
Total
Fuente: Empresa A
Título: ..................................................................................................
40%
Porcentaje de .........................
35%
30%
25%
20%
15%
10%
5%
0%
-5 5 15 25 35 45 55 65
..................................................
Fuente: …………………………………………………………………….
Interpretación
Notas
EPE UPC 33
Ejercicio 24
La gerencia de una compañía, que brinda servicios de llamadas por celulares, está preocupada por el
poco monto de las llamadas realizadas por sus clientes. Para corroborarlo se encargó al área de ad-
ministración que eligiera, del mes de enero, una muestra de clientes de Lima y registró el monto que
costaron sus llamadas, en soles.
Solución
Interpretación
A partir del gráfico podemos observar que el 37,5% de los clientes de Lima tienen montos superiores
a 20 y como máximo de 30 soles y que solo el 5% de estos clientes tienen montos superiores a 50 y
como máximo de 60 soles.
Notas
34 CE104 Estadística
Tablas cruzadas
Si el gráfico presenta las frecuencias porcentuales con respecto a la variable 2, el título será:
Distribución de <elementos> según <variable 1> por <variable 2>
Ejercicio 25
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadística e Informática se
preguntó a todos los peruanos la religión que profesa, obteniéndose los siguientes resultados:
Título: …………………………………………………………………………………………………………………………………………..
Religión que profesa
Sexo
Católica Cristiana - Evangélica Otra Ninguna Total
Hombre 8 379 120 1 200 953 324 445 374 024 10 278 542
Mujer 8 577 602 1 405 102 354 846 234 410 10 571 960
Total 16 956 722 2 606 055 679 291 608 434 20 850 502
Fuente: INEI - Censos Nacionales 2007: XI de Población y VI de Vivienda
Solución
a. El número de cristianos evangélicos en el Perú es …………………..……
b. Del total de peruanos, ………………………………………. son católicos.
c. De …………………………………….. de católicos, ………………………..……………….. son mujeres.
d. El ………….…….% de los hombres peruanos profesa la religión católica.
e. El ………………..% de las mujeres peruanas profesa una religión diferente a la católica.
f. El ………………..% de los hombres peruanos no profesa religión alguna.
Notas
EPE UPC 35
Ejercicio 26
La tabla que se presenta a continuación fue publicada el mes pasado por el diario A. La encuesta se
aplicó a una muestra de 805 hogares según nivel socioeconómico (NSE) y área de residencia. Los
resultados se presentan a continuación:
Notas
36 CE104 Estadística
e. Tomando como referencia alguna de las tablas anteriores, complete los espacios en blanco:
Notas
EPE UPC 37
Ejercicio 27
La siguiente tabla muestra el lugar de residencia y el giro de negocio que posee una muestra de clien-
tes del banco A que solicitaron préstamo durante el primer trimestre año.
Notas
38 CE104 Estadística
Interpretación
Del total de trabajadores,
- el 48,4% son obreros
- el 47,5% manifestaron tener una buena relación con la gerencia.
- el 23,8% son obreros y manifestaron tener una regular relación con la gerencia.
Interpretación
Del total de obreros, el 49,2% tiene una regular relación con la gerencia.
Interpretación
Del total de trabajadores que tienen una relación regular con la gerencia, el 65,9% son obreros.
Notas
EPE UPC 39
Gráficos comparativos
Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría. El
alto de cada barra es proporcional a la frecuencia de cada categoría.
Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada cate-
goría. El alto de cada barra es proporcional a la frecuencia de cada categoría.
Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es el mismo para cada categoría.
Ejercicio 29
Distribución de los trabajadores según su función y relación con la gerencia
25% 23.8%
Porcentaje de trabajadores
20%
16.4% 15.6%
14.8%
15%
8.2% 9.0%
10%
5.7%
4.9%
5%
1.6%
0%
Apoyo/adm. Obrero Profesional Técnico/ventas
Función
Buenas Regulares Malas
Notas
40 CE104 Estadística
Ejercicio 30
Cierto S.A., una empresa investigadora de mercados, realizó durante el último trimestre un estudio
acerca de los principales problemas que enfrenta la capital. La información está en la siguiente tabla.
Distribución de encuestados según principales problemas de Lima y estatus social
Principales problemas de Lima
Total
Sector social Tráfico Delincuencia Basura
Alto 70 38 12 120
Medio 52 80 14 146
Bajo 48 88 10 146
Total 170 206 36 412
Fuente: Cierto S.A.
Solución
a. Según lo mostrado, complete los siguientes espacios en blanco:
De 412 ciudadanos, 14 ...……………………………………………….…………………………………………....……..…
Del total de ciudadanos de sector bajo, 88 ………………………………………………………….……………...…..
Del total de ciudadanos que opinan que el principal problema en Lima es la delincuencia, el
………………....…… % de ellos son de sector medio.
Del total de ciudadanos, el …………………..…….% de ellos son de sector alto y opinan que el prin-
cipal problema en Lima es la delincuencia.
b. Presente la tabla cruzada para el título: “Distribución porcentual de los ciudadanos según princi-
pal problema de Lima y sector social”
Principales problemas de Lima
Total
Sector social Tráfico Delincuencia Basura
Alto 16,99% 2,91% 29,13%
Medio 12,62% 19,42% 3,40%
Bajo 11,65% 21,36% 2,43% 35,44%
Total 41,26% 8,74% 100,00%
Fuente: Cierto S.A.
c. Elabore el gráfico de barras comparativas para el título: “Distribución porcentual de los ciudada-
nos según principal problema de Lima y sector social”.
Notas
EPE UPC 41
Ejercicio 31
La tabla que se presenta a continuación fue publicada el mes pasado por el diario A. La encuesta se
aplicó a una muestra de 737 hogares según nivel socioeconómico (NSE) y área de residencia. Los
resultados se presentan a continuación:
Elabore el gráfico de barras comparativas para el título: “Distribución de los encuestados según nivel
socioeconómico por área de residencia.
Solución
Notas
42 CE104 Estadística
Ejercicio 32
Un productor musical de la empresa Creativa ha entrevistado a 200 personas haciéndolos oír una
canción y pidiéndoles que la identifiquen.
Solución
Presente el gráfico de barras apiladas al 100%.
...................................................................................................
100%
………………………………………………………….
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0 0 0
.........................................................................................................
Fuente: …………………………………………………………………….
Interpretación
Notas
EPE UPC 43
Ejercicio 33
La tabla que se presenta a continuación fue publicada el mes pasado por el diario A. La encuesta se
aplicó a una muestra de 737 hogares según nivel socioeconómico y área de residencia. Los resultados
se presentan a continuación:
a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.
b. A partir de la tabla anterior elabore e interprete un gráfico de barras apiladas al 100%.
Solución
a. Presente la tabla cruzada porcentual por área de residencia. Coloque el título apropiado.
b. A partir del cuadro anterior elabore e interprete un gráfico de barras apiladas al 100%.
Distribución de encuestados según nivel socioeconómico por área de
residencia
100%
Porcentaje de encuestados
90% 12.67%
80% 35.64%
70%
60% 31.33%
50% NSE E
34.65%
40% NSE D
30%
35.00% NSE C
20%
10% 28.71%
0%
Área Urbana Área Rural
Fuente: Diario A Área de residencia
Del total de encuestados que viven en el área urbana, el 35% pertenece al nivel socioeconómico
C, mientras que, en el área rural, el 28,71% pertenece al nivel socioeconómico C.
Del total de encuestados que viven en el área urbana, el 12,67% pertenece al nivel socioeconó-
mico E, mientras que, en el área rural, el 35,64% pertenece al nivel socioeconómico E.
Notas
44 CE104 Estadística
Ejercicios propuestos
2. El gerente de una red de librerías, con sucursales en Surco, San Borja y San Luis ha observado
que en los últimos meses las ventas han disminuido, y desea conocer qué origina este proble-
ma. Por ello, realizó una encuesta a 210 clientes seleccionados al azar de todas las sucursales.
Algunas de las variables recolectadas mediante la encuesta son las siguientes:
Ingreso mensual familiar (en soles)
Distrito de residencia
Número de hijos en edad escolar
Nivel de satisfacción con la atención recibida (muy buena, buena, mala, muy mala)
Del enunciado anterior identifique la población en estudio, la muestra y la unidad elemental.
3. La Oficina de Turismo de Cusco recopiló datos sobre los turistas que llegaron a la ciudad. Entre
las 16 preguntas de un cuestionario que se entregó a los pasajeros que llegaron en el mes de
enero del presente año, figuraban, entre otras, las siguientes preguntas:
Esta visita a Cusco es la: ………………… vez (primera, segunda, tercera, etc.).
El motivo principal de este viaje es: …………… (16 categorías incluyendo vacaciones, trabajo).
Voy a estar alojado en: ………… (10 categorías incluyendo hotel, apartamento, parientes).
Mi estadía en Cusco va a durar: …………………. días.
Identifique la población, la muestra y unidad elemental. Además, indique el tipo y la escala de
medición de cada una de las variables.
4. Para cada una de las variables mencionadas, indique la escala de medición y tipo:
a. Número de DNI
b. Estado civil de una persona
c. Escala de sueldos de una empresa
d. Calificación obtenida en un examen
e. Religión practicada por cada individuo
f. Preferencia política
g. Temperatura en grados centígrados Celsius
h. Temperatura en grados centígrados Kelvin
i. Cantidad de acciones vendidas diariamente en la Bolsa de Valores de Lima
j. Tiempo de servicio de los empleados de una empresa
k. Número de cheques girados diariamente en un mes
l. Lugar de nacimiento de una persona que vive en Lima.
m. Número de cigarrillos vendidos en una actividad.
n. Coeficiente de inteligencia de una persona.
o. Número de fallecidos en el hospital durante la última noche.
p. Cantidad de errores por página en una guía de ejercicios.
q. Distrito de procedencia de un alumno de EPE UPC.
r. Grado de satisfacción laboral del personal de una empresa.
s. Opinión de los empleados de una empresa sobre la realización o no de cursos de capacita-
ción (De acuerdo, ni en acuerdo ni en desacuerdo, En desacuerdo).
t. Tiempo de vida útil de un USB.
Notas
EPE UPC 45
6. Se encuestó a 245 estudiantes de la universidad A. Se sabe que en esta universidad el 72% del
alumnado pertenece al área de Humanidades y el resto al área de Ciencias.
Después de procesar la información muestral se obtuvo que:
56% eran mujeres,
el 33,2% prefiere el rock como género musical,
el 45,7% gusta de la emisora 104,7 VIVA F.M.
la media del número de veces que un oyente llamó a la radio en el último mes fue de
2,86 llamadas y la moda de esa misma variable fue igual a uno.
Identifique el estimador o parámetro y su valor para cada una de las variables.
7. El tiempo requerido para cancelar sus facturas de todos los clientes que tiene crédito en tien-
das A debe estimarse utilizando el promedio de días que necesitaron para pagar 50 clientes
elegidos al azar. Relacione las siguientes expresiones con los conceptos dados:
a. Dato
b. Datos (conjunto)
c. Muestreo
d. Parámetro
e. Población
f. Muestra
g. Estadígrafo
h. Variable
8. La agencia de viajes Turismo A realizó un estudio a sus 15 000 turistas extranjeros que llegaron
al Cusco el año pasado. Se encontró que todos hablaban más de un idioma, el 35% eran de
EEUU y el gasto medio durante su viaje en la ciudad fue de 2 300 soles.
De acuerdo con el enunciado anterior:
a. Identifique la población, la muestra y la unidad elemental.
b. Para cada una de las variables identifique su tipo y escala de medida.
c. Mencione los parámetros y estadísticos detallados en texto.
Notas
46 CE104 Estadística
9. El banco A tiene sucursales en Lima y Callao. Cuenta 9784 clientes. Su gerente general desea
determinar la situación de la entidad y la de sus clientes. Para ello, seleccionó una muestra de
1200 clientes que solicitaron préstamo durante el último semestre. Parte de la base de datos
correspondiente a la muestra se presenta a continuación:
Número de Edad del Tipo de Monto del Número de cuo- Moneda del Giro del
tarjetas cliente préstamo préstamo tas del préstamo préstamo negocio
Capital
1 53 años $5000 6 meses Soles Bodega
trabajo
3 36 años Cuota fija $1500 12 meses Soles Restaurante
5 54 años Cuota fija $4500 18 meses Soles Abarrotes
4 43 años Mi local $6000 36 meses Dólares Mueblería
10. Una entidad estatal realizó un estudio para determinar algunos indicadores socioeconómicos
de los inmigrantes peruanos en Estados Unidos. Se encuestó a 400 inmigrantes peruanos. Al-
gunas de las preguntas del cuestionario fueron las siguientes:
Nivel educativo alcanzado en el Perú.
Monto enviado (en dólares) el último mes a sus familiares en el Perú.
Problema principal: Ninguno, indocumentado, vivienda no adecuada, salud, etc.
Número de veces que ha visitado el Perú desde que viajó por primera vez a EEUU.
11. El departamento de logística de una aerolínea registró el día 12 de marzo del presente año, en
cada uno de sus 20 vuelos, el número de asientos sobrantes (con negativos), esto es cuando se
presentaron menos pasajeros que la capacidad total del avión y el número de asientos faltan-
tes (con positivos), cuando se presentaron más pasajeros que la capacidad total del avión.
-2 0 0 1 1 0 -1 -2 -1 1 0 -1 0 2 -1 -1 2 1 -3 0
12. Se presenta la información de una muestra de clientes elegidos al azar del banco América so-
bre el destino de dichos préstamos: V (vivienda), N (negocio), E (estudio) y D (viaje).
Destino del préstamo
V V E E E E E E D D D D D V V V D E E E V V V V N
N N N E E D D D E E D N N N V V V V V E E E E E D
Presente la tabla de distribución de frecuencias que resuma la información de la variable cuali-
tativa. Interprete f2.
Notas
EPE UPC 47
13. Edificar es una empresa dedicada al rubro de la construcción. La gerenta de Recursos Humanos
ha recibido quejas de los trabajadores y ha decidido estudiar la situación laboral de los traba-
jadores. Al seleccionar una muestra de 115 trabajadores obtuvo la siguiente información:
Trabajador Sexo Edad Número de hijos Cargo Ingreso mensual Motivo de la queja
1 M 32 años 1 Maestro de obra 2862 soles Mal remunerado
2 M 32 años 2 Peón 742 soles Sin bonificación
3 M 25 años 0 Oficial 2256 soles Sin horas extras
115 M 37 años 3 Oficial 1438 soles Mal remunerado
Estable- Número de Condición del Ingreso Estable- Número de Condición del Ingreso
cimiento empleados establecimiento cimiento empleados establecimiento
1 6 Buena 20,0 11 5 Regular 35,1
2 4 Buena 20,4 12 5 Mala 40,0
3 3 Regular 20,5 13 4 Buena 40,4
4 5 Regular 25,9 14 3 Buena 45,1
5 7 Mala 28,8 15 3 Mala 45,3
6 8 Buena 29,1 16 8 Muy buena 46,0
7 5 Regular 30,0 17 4 Buena 50,4
8 5 Regular 30,1 18 3 Muy buena 50,5
9 3 Muy buena 30,5 19 9 Buena 50,8
10 4 Buena 30,9 20 7 Muy buena 60,6
15. A un grupo de compradores de auto tomados al azar, se les preguntó sobre el color de su auto.
Los resultados obtenidos fueron:
Blanco Azul Verde Verde Verde Negro Rojo Negro Rojo Verde Blanco Azul
Negro Rojo Rojo Azul Azul Azul Rojo Verde Negro Azul Verde Negro
Azul Blanco Verde Blanco Blanco Rojo Blanco Rojo Azul Verde Blanco Negro
Negro Rojo Negro Rojo Rojo Verde Negro Negro Blanco Blanco Azul Blanco
a. Presente la tabla de distribución de frecuencias que resuma la información de la variable.
b. Realice un gráfico circular. ¿Qué puede observar acerca del color de auto?
Notas
48 CE104 Estadística
16. La empresa auditora A está organizando la información relacionada a las empresas con las que
trabaja. El siguiente cuadro corresponde al sector al que pertenecen estás empresas:
Sector fi hi hi %
Agricultura 100
Minas 0,375
Pesca 12,5%
Servicios 80
Otros 20
Total 400 1
a. ¿Cuál es la variable estudiada y de qué tipo es?
b. Complete la tabla de distribución de frecuencias.
c. Interprete los valores más importantes.
17. Complete la siguiente tabla de distribución de frecuencias que representa el número de fallas
en libros contables encontrados en una muestra de 200 libros de los archivos de un contador.
Número de fallas fi Fi hi % Hi %
1 5%
2 14% 37%
3 16
4 124
5 20
6 82%
7 97%
8
Total
18. A continuación, se presenta la información del número de veces que una muestra de clientes
elegidos al azar del banco América presentaron solicitudes de préstamo.
19. El gerente de un banco está interesado en estudiar el comportamiento del número de cuentas
de ahorros cerradas por día. La información disponible para este fin se muestra a continuación:
0 3 1 2 1 0 2 3 0 1 4 1 4 4 0 4 3 1 2 2
1 5 0 5 4 1 0 2 1 3 0 3 2 1 1 2 5 4 0 1
Notas
EPE UPC 49
20. Los directivos de la empresa A solicitaron a los gerentes de cada una de sus dos locales de ven-
tas, A y B, que informen sobre los sueldos de todos sus trabajadores correspondientes al mes
de marzo del año en curso. La información proporcionada (en soles) por el gerente del local A
se muestra a continuación.
i Sueldos fi
1 [ 1 000 – 2 000 2
2 2 000 – 3 000 3
3 3 000 – 4 000 14
4 4 000 – 5 000 15
5 5 000 – 6 000 5
6 6 000 – 7 000] 1
a. Complete la tabla anterior con la frecuencia relativa y las frecuencias acumuladas, absolu-
tas y relativas. Ponga títulos y fuente.
b. Interprete los valores de f3, h4 y H2.
c. Los siguientes datos corresponden a los sueldos (en soles) del local B. Construya la tabla de
distribución de frecuencias usando la regla de Sturges.
58,7 99,3 118,1 173,3 177,5 205,3 206,2 206,3 222,9 224,4 602,7 505,7
242,9 245,7 260,9 262,0 265,9 272,9 273,2 274,0 275,9 295,0 544,8 503,3
299,8 319,7 319,9 324,5 328,1 330,0 332,3 338,9 342,1 364,1 522,2 501,2
372,3 373,0 381,3 393,8 394,5 419,2 432,4 435,0 436,1 441,6 518,8 463,3
21. Los datos corresponden a los ingresos, en cientos de soles, de una muestra de 60 clientes del
banco A.
5,25 7,22 8,53 9,27 9,54 10,21 10,32 10,45 10,52 10,76
10,85 11,25 11,56 12,42 13,27 14,65 15,72 16,85 17,22 18,56
19,32 20,56 21,72 22,85 23,12 24,32 25,65 26,72 28,72 29,65
31,42 32,71 33,55 34,28 35,21 37,45 38,32 39,65 41,22 43,28
45,72 47,32 49,45 51,27 52,38 54,75 55,81 56,27 57,45 58,22
59,32 61,45 63,75 65,72 66,85 69,32 69,54 72,30 75,81 77,42
a. Construya una tabla completa de distribución de frecuencias usando la regla de Sturges.
b. Interprete los valores de f2, h3 y H4.
22. Sean las siguientes cantidades, las calificaciones en un curso de Estadística en el que se han
evaluado a 56 personas, siendo la escala de evaluación de 0 a 100.
58 89 73 59 87 63 43 59 64 74 63 63 82 95
73 81 44 69 30 38 75 66 76 84 72 82 59 75
63 72 52 55 75 43 48 52 77 68 47 53 36 65
67 61 87 39 62 75 69 53 79 95 50 38 70 84
Representar esta información en forma tabular. Elabore un informe ejecutivo
23. En una tabla de distribución de frecuencias simétrica con siete intervalos de clases de igual
longitud, se conocen los datos siguientes:
w = 10 f1 = 8 f2 + f5 = 62 h3 = 0,21 H6 = 0,96
Reconstruya la tabla de distribución de frecuencias, sabiendo además que el primer intervalo
es [5 - 15
Notas
50 CE104 Estadística
24. La siguiente tabla corresponde a la distribución de frecuencias de los salarios, en soles, del
último mes de los empleados de la empresa A. Complete la tabla:
25. La tabla muestra la distribución del ingreso familiar diario correspondiente a 80 familias.
26. En los X Censos Nacionales de Población y V de Vivienda de año 2007 se preguntó por el tipo
de alumbrado de la vivienda según área (urbana o rural).
Notas
EPE UPC 51
27. La siguiente tabla muestra el total de productos con quiebre de stock por sección y por motivo
del quiebre en el supermercado A.
Artículo Problema Problema Quiebre
Sección Total
descontinuado comercial stock teórico logístico
Bebidas 2 12 16 88 118
Comestibles 4 25 56 220 305
Cuidado personal 2 14 15 84 115
Total 8 51 87 392 538
a. Ponga título y fuente a la tabla.
b. Construya un gráfico de barras apiladas al 100% por motivo del quiebre según sección.
Notas
52 CE104 Estadística
Podemos distinguir cuatro grupos de medidas de resumen: las medidas de tendencia central, las
medidas de posición, las medidas de dispersión y las medidas de forma (asimetría).
Decil
Notas
EPE UPC 53
Por ejemplo, según el V Monitor Anual Adecco sobre Salarios, elaborado por la empresa de recursos
humanos y los investigadores de Barceló y Asociados, que analiza el salario en España.
Tomado de http://cincodias.elpais.com/cincodias/2016/10/28/economia/1477647044_581527.html
Tomado de https://www.facebook.com/Sunass.Regulador
Notas
54 CE104 Estadística
Media
La media de un conjunto de valores de una variable es la suma de dichos valores dividida entre el
número de valores. También se le denomina media aritmética o promedio.
x i
Media poblacional i 1
N
n
x i
Media muestral x i 1
n
Ejercicio 34
Los siguientes datos corresponden al número de visitas al mes que una muestra de 30 estudiantes
realizó a la cafetería de la universidad.
4 2 4 2 1 3 3 1 3 3 4 1 1 4 1
5 5 5 3 1 3 1 4 1 1 2 4 1 4 1
Esto significa que el número de visitas al mes a la cafetería de la universidad está alrededor de 2,6
veces al mes.
Ejercicio 35
Los siguientes datos corresponden a la estatura, en metros, de una muestra aleatoria de hombres
peruanos de 18 años.
1,73 1,73 1,84 1,71 1,61 1,50 1,78 1,50 1,90 1,81 1,72 1,84 1,75 1,69 1,63
1,51 1,77 1,81 1,77 1,80 1,68 1,56 1,71 1,78 1,49 1,57 1,71 1,82 1,66 1,69
Solución
El promedio de la estatura de una muestra de hombres peruanos de 18 años es ………………………..….
Notas
EPE UPC 55
Mediana
La mediana de un conjunto de datos observados de una variable es el valor que ocupa la posición
central una vez puestos los datos en orden de magnitud, es decir, ordenados de menor a mayor.
La mediana es el valor tal que aproximadamente el 50% de las observaciones son menores o iguales
a su valor. Se denota por Me.
Ejercicio 36
Interprete las siguientes afirmaciones.
Características de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razón.
La mediana es una medida robusta, es decir, no se ve afectada por valores extremos. Por eso se
le utiliza cuando hay datos inusuales o la distribución de frecuencias no es simétrica.
Ejercicio 37
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de
estudiantes a la cafetería de la universidad.
4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8
Notas
56 CE104 Estadística
Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia. Se denota por Mo.
Características de la moda
La moda se puede calcular para cualquier escala de medición.
El valor de la moda no se ve afectada por valores extremos.
La moda no siempre es un valor único. Una serie de datos puede tener dos modas (bimodal) o
más de dos modas (multimodal).
Un conjunto de datos pudiera incluso no tener moda.
La moda es una medida menos importante que la mediana o la media debido a su ambigüedad.
Ejercicio 38
Los siguientes datos corresponden al número de visitas que realizó el presente mes una muestra de
estudiantes a la cafetería de la universidad.
4 2 4 2 1 3 3 1 3 3 4 1 1 4 1 2 4 1 4 1
5 5 5 3 1 3 1 4 1 1 5 2 3 2 1 6 2 3 2 8
Esto significa que los estudiantes visitan con mayor frecuencia la cafetería de la universidad
…………………………….. vez al mes.
Ejercicio 39
A continuación, se presenta la información de una muestra aleatoria de 15 profesionales egresados
de la carrera de Administración.
Edad (años) 15 19 21 31 21 24 30 26 22 31 31 28 31 31 24
Estatura (cm) 154 154 154 184 173 170 176 188 168 161 171 175 187 161 161
Notas
EPE UPC 57
n1 x1 n2 x2
x
n1 n2
Ejercicio 40
En una negociación por aumento de salarios, la gerencia de la empresa A ofrece a sus empleados dos
alternativas.
La primera consiste en un aumento general del 5%.
La segunda consiste en un aumento general del 2% más un bono de 150 soles.
Indique la alternativa que da a los empleados el mayor promedio de sueldos, si la media de los suel-
dos es actualmente de 3700 soles.
Solución
Alternativa 1
Alternativa 2
Decisión
Ejercicio 41
Se sabe que los ingresos mensuales que perciben los trabajadores de una empresa tienen un prome-
dio de 2800 soles, determine el nuevo ingreso promedio que se obtendría luego de realizar los si-
guientes aumentos:
a. los ingresos de los trabajadores se incrementan en 250 soles.
b. los ingresos se incrementan en un 7,5%.
c. los ingresos se incrementan en un 12,5% más una bonificación de 125 soles.
Solución
Definamos las variables:
X := antiguo ingreso de un trabajador
Y = nuevo ingreso de un trabajador
a. Y = X + 250, entonces y x 250 2800 250 3050soles
b. Y = X + 0,075X = 1,075X, entonces y (1 0,075)x 1,075 2800 3010 soles
c. Y = X + 0,125X + 125. Entonces, y (1 0,125)x 125 1,125 2800 125 3275soles
Notas
58 CE104 Estadística
Las medidas de posición o cuantiles son los valores que determinan la posición de un dato respecto a
todos los demás datos de una serie y que previamente ha sido ordenada de menor a mayor.
Los cuantiles más importantes dividen a los datos ordenados de menor a mayor en 4, 10 y 100 canti-
dades iguales de datos, denominándose cuartiles, deciles y percentiles, respectivamente.
Notas
EPE UPC 59
Percentil
Los percentiles dividen el conjunto de datos en 100 partes porcentualmente iguales.
El percentil k, Pk, es el valor tal que aproximadamente el k% de los datos ordenados es menor o igual
a ese valor y el (100 – k)% de los datos es mayor a ese valor.
Ejercicio 42
Interprete las siguientes afirmaciones.
Según el II Censo Nacional Universitario 2010, el percentil 57 de la edad de los estudiantes de pre-
grado es 22 años.
De acuerdo con un informe publicado en agosto del 2016 por la Oficina de Presupuesto del Congreso
de EEUU, el percentil 90 del ingreso anual de las familias en ese país es 942 000 dólares.
De acuerdo con la Organización Mundial de la Salud (OMS), el percentil 15 del peso de una niña de
un año en el mundo es ocho kilos.
Ejercicio 43
Indique, en los siguientes casos, el percentil adecuado:
50% de las observaciones 50% de las observaciones
P…..
Notas
60 CE104 Estadística
Ejercicio 44
Exprese los siguientes valores como percentiles.
Q1 = P......
Q2 = P......
Q3 = P......
Me = P......
D3 = P......
D6 = P......
Ejercicio 45
A continuación, se presentan los ingresos mensuales, en soles, de un grupo de trabajadores de la
empresa A.
2548 3120 1870 2458 3000 2890 1500 4005 1900 2410 2300 2870
2710 2955 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325
Solución
a. Calcule e interprete el valor del percentil 25.
c. Calcule el ingreso mensual mínimo para estar en el 15% de los trabajadores que más ganan.
d. Calcule el ingreso mensual mínimo para estar en el quinto superior de los trabajadores que más
ganan.
Notas
EPE UPC 61
Con las medidas de tendencia central es posible determinar el valor central de una distribución, pero
no indican qué tan cercanos o lejanos están los datos de dicho valor central.
Las medidas de dispersión o variabilidad indican cuán alejados están los valores de una variable del
valor que los representa y por lo tanto permiten evaluar la confiabilidad de ese valor central.
Cuando la medida de dispersión tiene un valor pequeño, los datos están concentrados alrededor de
la medida de tendencia central, en cambio si la medida de dispersión tiene un valor grande, los datos
no están concentrados alrededor de la medida de tendencia central.
Rango Es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central
intercuartil de los datos.
Notas
62 CE104 Estadística
Rango
El rango (r) de un conjunto de datos observados es la diferencia entre el dato mayor y el dato menor.
También se le denomina amplitud o recorrido.
Rango intercuartil
El rango intercuartil (RIC) es la diferencia entre el tercer y primer cuartil. Es el rango del 50% central
de los datos. El rango intercuartil elimina la influencia de los valores extremos.
Ejercicio 46
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respues-
tas mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1
Solución
El rango R = máximo – mínimo = 5 - 0 = 5. Esto significa, que el rango o amplitud para el número
de hijos por familia en la muestra de 12 hogares es 5 hijos.
El rango intercuartil RIC = 3 – 1= 2. Esto significa que la dispersión en el 50% de los datos centra-
les del número de hijos en las familias es igual a dos hijos.
Notas
EPE UPC 63
Ejercicio 47
La empresa A produce manzanas de la variedad A y de la variedad B. Se ha tomado una muestra de
manzanas. Los datos muestran el peso de las manzanas, en gramos.
Variedad A
203 160 157 181 201 216 183 174 180 204 185 190 184 161 183 184 179 178 210
184 176 189 209 169 181 184 184 203 172 181 186 209 177 184 209 188 174 198
201 165 172 200 162 217 187 176 184 195 194 196 186 199 165 201 179 196 186
Variedad B
212 122 194 185 217 137 198 200 181 184 179 190 218 215 177 180 214 149 196
169 216 168 171 199 175 142 191 192 185 184 168 178 190 168 178 235 186 194
193 157 177 175 177 171 210 181 180 179 193 190 185 198 174 163 200 144 174
191 166 186 162 153 179 185 206 123 183 183 198 181 173 210 162 207 201 211
Solución
a. Calcule e interprete el rango y el rango intercuartil de cada variedad.
b. Indique la variedad de manzana que tiene mayor homogeneidad de sus pesos en el 50% central.
La variedad ……………… es la variedad que tiene mayor homogeneidad de sus pesos en el 50%
central, pues …………………………………………………………………………………..…………………………………………….
…………………………………………………………………………………………………….………………………………………..………
Notas
64 CE104 Estadística
Varianza
La varianza mide el grado de dispersión o variación de los valores de una variable con respecto a su
media aritmética.
x i
2
Varianza poblacional 2 i 1
N
n
x x
i
2
Varianza muestral s2 i 1
n 1
Desviación estándar
Se define como la raíz cuadrada positiva de la varianza.
Ejercicio 48
Ante la pregunta sobre el número de hijos por familia, una muestra de 12 hogares marcó las respues-
tas mostradas en la siguiente tabla:
2 1 2 4 1 3 2 3 2 0 5 1
Notas
EPE UPC 65
Ejercicio 49
FibraTex S.A. es una empresa exportadora de prendas de vestir. Los datos que se presentan a conti-
nuación corresponden a la edad, en años, de todos los trabajadores de esta empresa.
41 45 49 46 52 42 39 49 44 39 47 49 40 43 51 41 58 59 49 44 41 48 50 44 51
40 37 38 40 41 50 54 41 40 45 37 40 36 36 42 39 55 45 44 38 40 37 47 33 48
44 50 51 41 47 56 44 41 59 38 41 44 49 45 37 40 28 49 45 39 59 51 40 43 44
40 38 44 43 39 45 43 44 43 40 42 29 37 48 49 51 46 39 43 56 44 60 57 47 49
Notas
66 CE104 Estadística
Coeficiente de variación
Las medidas de dispersión estudiadas son medidas de variación absolutas, pues se expresan en las
mismas unidades que la variable, excepto la varianza que se expresa en unidades al cuadrado.
Es útil al comparar la variabilidad de dos o más series de datos que se expresan en distintas o iguales
unidades, pero difieren a tal punto que una comparación directa de las respectivas desviaciones es-
tándar no es muy útil, por ejemplo, cuando las medias están muy distantes.
Ejercicio 50
Observe las dos imágenes siguientes.
Tomado de http://gastronomiaycia.republica.com/
Complete los siguientes textos, con respecto a la variabilidad de los tamaños de las manzanas.
Notas
EPE UPC 67
Ejercicio 51
Usando la opción <Análisis de datos> y la función =PERCENTIL.EXC(datos; k/100) de Excel se ha obte-
nido la siguiente tabla de las respuestas obtenidas del tiempo de servicio en una encuesta realizada a
una muestra de 400 empleados de la empresa A realizada el presente año.
Solución
a. ¿En qué estado civil, el tiempo de servicio presenta mayor dispersión?
b. ¿En qué estado civil el tiempo de servicio es más dispersión en el 50% central?
Por lo tanto, el tiempo de servicio es más disperso en el 50% central de los datos es en el estado
civil …………………………….. porque ………………………………………………………………………………………….…………
Notas
68 CE104 Estadística
Ejercicio 52
Los datos presentados a continuación corresponden a los montos y el tipo de pago realizados por
una muestra de 100 clientes de una cadena de supermercados. Los directivos de esta empresa pidie-
ron tomar la muestra para conocer el comportamiento de los pagos de los clientes.
Cheque
5,00 17,87 18,77 21,11 22,67 25,96 30,60 31,07 31,74 34,67
35,38 36,09 36,48 37,20 37,60 37,94 38,58 39,55 40,51 41,10
41,58 42,69 42,83 43,14 48,95 49,21 50,58 51,66 52,04 52,87
54,84 55,40 57,59 58,11 58,64 58,75 59,78 69,22 72,46 78,16
Efectivo
1,09 1,27 1,85 2,44 2,87 2,96 3,31 3,65 4,34 4,75
5,08 5,15 5,91 5,98 6,93 7,02 7,17 7,22 7,40 7,41
7,88 8,81 8,85 9,00 11,17 11,54 11,77 12,07 13,09 14,28
15,07 15,10 15,57 16,28 16,38 16,69 18,09 20,48
Tarjeta
14,44 19,78 22,59 25,57 26,57 26,91 27,66 27,89 33,76 44,53
46,13 46,24 48,11 50,30 52,35 52,63 53,32 54,19 55,21 57,55
69,77 94,36
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?
Solución
a. ¿Cuál de las tres formas de pago presenta mayor homogeneidad?
Para calcular el coeficiente de variación use las funciones:
=PROMEDIO(datos) para calcular la media
=DESVEST.M(datos) para calcular la desviación estándar.
Luego, divida cada desviación estándar entre su respectiva media.
Forma de pago Media Desviación estándar Coeficiente de variación
Cheque
Efectivo
Tarjeta
b. ¿Cuál de las tres formas de pago presenta mayor homogeneidad en el 50% central?
Forma de pago
Cheque
Efectivo
Tarjeta
Por lo tanto, la forma de pago más homogénea en el 50% central es ……………………………….. porque
……………………………………………………………………………………………………………………………………………..
Notas
EPE UPC 69
Ejercicio 53
Los siguientes datos representan resúmenes del número de mediciones de resistencia de cierto ar-
tículo que realizaron dos grupos de técnicos.
Solución
Se usa como indicador el coeficiente de variación:
s1 1,10
CV1 100% 100% 36,67%
x2 3
s 1,66
CV2 2 100% 100% 33,207%
x2 5
Notas
70 CE104 Estadística
Medidas de asimetría
Además de las medidas de tendencia central y dispersión, podemos estar interesados en saber la
forma que presenta un conjunto unimodal de datos.
Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la me-
dia, se dice que la distribución es simétrica.
Si los datos que son menores a la media son más frecuentes que aquellos por encima de la media
o viceversa, se dice que la distribución es asimétrica.
Se tiene que:
Ejercicio 54
Complete los siguientes textos:
Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una con-
centración de datos en los valores …………………………………………
Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una con-
centración de datos en los valores …………………………………………
En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asi-
metría …………………..…….., porque ………………………………..…………………………………………
En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente
tienen un coeficiente de asimetría ……………………………………….………….., porque
………………………………..…………………………………………………………………………………………………
Notas
EPE UPC 71
Ejercicio 55
La empresa A desea saber si la capacitación en una tarea ha reducido el tiempo en que se fabrica un
cierto producto. Para lo cual ha tomado una muestra de productos realizados por personas capacita-
das y no capacitadas, encontrando el mismo tiempo medio de fabricación del producto para ambos
grupos, sin embargo, el coeficiente de asimetría de los tiempos de las personas capacitadas es positi-
vo, mientras que, el coeficiente de asimetría de los tiempos de las personas no capacitadas es nega-
tivo. ¿Parecen indicar los datos que la capacitación sirve para reducir el tiempo de fabricación?
Solución
Ejercicio 56
Los datos presentados corresponden a la cantidad de dinero gastado, en soles, para comprar regalos
navideños entre un grupo de hombres y de mujeres durante el mes de diciembre pasado en Lima
Metropolitana. Calcule e interprete el coeficiente de asimetría de Fisher en ambos grupos.
Mujeres
460 507 575 420 568 558 581 334 400 426 434 290 468 546 419 726 364 432 519 503
470 519 430 250 514 447 504 543 350 473 614 441 630 432 417 421 531 523 321 405
450 393 553 430 421 461 320 930 290 718 361 383 477 280 385 416 398 503 431 406
407 558 313 387 585 503 527 511 383 402 453 429 499 179 600 373 459 410 850 847
Hombres
498 349 185 80 324 616 680 355 352 648 696 308 581 481 297 205 285 175 447 603
626 368 275 149 100 254 540 279 275 200 538 604 575 600 137 734 436 284 198 610
767 80 266 537 358 624 120 244 341 724 425 305 75 688 253 514 236 475 606 475
271 230 466 120 398 60 429 517 268 580 431 173 612 317 529 647 542 544 464 610
Solución
Usando la función =COEFICIENTE.ASIMETRIA(datos), tendremos los siguientes resultados.
Masculino
Por lo tanto,
el gasto de las mujeres presenta asimetría ……………………………………, sus valores están concentra-
dos en los valores ………………………….…………………..…
el gasto de los hombres presenta asimetría ……………………………………, sus valores están concentra-
dos en los valores ………………………….…………………..…
Notas
72 CE104 Estadística
Definiciones básicas
1. Complete la información solicitada, indique:
Población
Muestra
Unidad elemental
2. Complete los espacios en la tabla considerando la información del estudio:
Notas
EPE UPC 73
Objetivo 1: Determinar el producto comprado con más preferencia por los clientes al mes.
Complete los datos faltantes en el gráfico y responda a los enunciados solicitados.
Fuente: …………………………………………
Notas
74 CE104 Estadística
Objetivo 2: Identificar el tipo de pago de mayor preferencia entre los clientes para evaluar una estra-
tegia promocional por tipo de producto.
A continuación, se muestra la siguiente información obtenidas de los 200 clientes al momento de
analizar el tipo de suplemento y el turno de pago.
Tipo de pago
Total
Tipo de suplemento Efectivo Tarjeta de crédito Tarjeta de débito
Proteína 3,75% 12,50% 7,50% 23,75%
Quemador de grasa 6,25% 10,00% 3,75% 20,00%
Ganador de masa 5,00% 8,75% 11,25% 25,00%
Preentreno 7,50% 5,63% 3,12% 16,25%
Aminoácidos 2,50% 7,50% 5,00% 15,00%
Total 25,00% 44,38% 30,62% 100,00%
Fuente: Natural Power Nutrition
Notas
EPE UPC 75
Objetivo 3: Determinar el número de productos comprados menos frecuente por los clientes al mes
Complete el valor faltante en el gráfico y responda los enunciados solicitados.
a. Responda al objetivo.
b. El número de productos mínimo comprados por la mitad de sus clientes es: …………….
c. Interpretar h3%.
d. El porcentaje de clientes que compran más de tres productos es: ………………………………
e. Interprete F2.
Objetivo 4: Determinar la distribución de los clientes respecto al tiempo de demora que llega el pro-
ducto a su casa.
El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto se extrajo una muestra al azar y se registró los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
a. Construya la tabla de distribución de frecuencias, use la regla de Sturges.
b. Interprete h2%.
c. Interprete F4.
Notas
76 CE104 Estadística
Objetivo 6: Identificar la concentración de los clientes respecto al tiempo de demora que llega el
producto a su casa.
El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
a. A partir de los datos, calcule el indicador pertinente que permita responder al objetivo.
b. Responda al objetivo.
c. La empresa contratará más motorizados si se tardan mucho en enviar sus productos, ¿deben
contratar más motorizados?
Objetivo 7: Comparar el monto de compra entre los clientes de sexo femenino y los de sexo mascu-
lino.
Femenino Masculino
Media Media 153,606
Mediana 154,000 Mediana 168,000
Moda 153,000 Moda 149,000
Desviación estándar 37,527 Desviación estándar
Varianza de la muestra Varianza de la muestra 1921,955
Coeficiente de asimetría -0,609 Coeficiente de asimetría -0,612
Rango 139 Rango 165
Suma 15436 Suma
Cuenta 101 Cuenta 99
Notas
EPE UPC 77
Ejercicios propuestos
28.Todos los vehículos que circulan en Lima Metropolitana deben pasar las revisiones técnicas. Ini-
cialmente la empresa encargada de dichas revisiones contaba con dos plantas: Cono Norte y Cono
Sur. Se desea investigar si se necesitaba abrir más plantas, analizando el tiempo de atención por
vehículo. Los tiempos, en minutos, en ser atendidos a una muestra aleatoria de vehículos particu-
lares que asistieron a cada una de las plantas se presenta a continuación:
Cono Norte
12,6 12,6 12,6 12,8 12,9 12,9 13,1 13,1 13,5 13,5 13,7 13,8 13,8 14,1 14,1 14,3 15,1
Cono Sur
10,9 10,9 10,9 11,2 11,6 11,8 11,8 11,8 12,2 12,2 12,3 13,3 13,3 13,4 13,4 13,4 21,3
29.Los gastos semanales en transporte urbano (soles) que efectúan los habitantes de las ciudades en
A y B han sido estudiados mediante muestras aleatorias independientes. Los datos fueron:
30.Un agente de compras puso a prueba una muestra de 20 baterías de calculadoras de bolsillo de
un fabricante. Cada batería se probó en una calculadora programada para llevar a cabo un ciclo de
cálculos ordinarios. El tiempo de vida, en horas, de las baterías se muestra a continuación:
11,9 11,9 12,0 12,0 12,0 12,4 12,3 12,1 12,5 12,0 12,0 12,0 12,1 12,1 12,1 12,2 12,2 12,2 12,2 12,2
Si el agente de compras quiere encontrar un tiempo máximo para el 18% de las baterías que du-
ran menos y un tiempo mínimo para el 23% de los que duran más, ¿cuál serían esos tiempos de
vida? Justifique numéricamente su respuesta.
Notas
78 CE104 Estadística
31.Un fabricante desea adquirir una máquina para el llenado de bolsas de 150 gramos. Se realizan 20
ensayos con la máquina obteniéndose los siguientes pesos, en gramos:
143 145 146 148 149 150 150 150 150 150 150 150 150 150 150 151 152 154 155 155
a. Calcule e interprete la media, mediana y moda del peso de las bolsas empaquetadas.
b. Si el equipo de medición que se empleó para medir los pesos de las bolsas producidas por la
máquina estaba descalibrada y los verdaderos pesos serían 10% menores a los pesos medidos
y, además, con una constante de menos dos gramos, ¿cuál es el peso promedio verdadero de
bolsas de la máquina?
32.Un profesor de matemáticas tuvo a su cargo dos secciones el ciclo pasado. En la primera sección,
donde tuvo 40 alumnos, la media de las notas del examen parcial fue 13 y en la segunda sección,
con 35 alumnos, la media de dicho examen fue 12,5. Hallar la media de las notas de todos los es-
tudiantes que tuvo a su cargo.
34.El sueldo promedio de la empresa A es 4000 soles. Se proponen dos alternativas de aumento:
a. 275 soles a cada uno
b. 5% de su sueldo más 80 soles a cada uno.
Si los empleados quieren obtener el sueldo medio mayor, ¿cuál alternativa es más conveniente?
35.La empresa A tiene sucursales en dos países. En el primer país, el sueldo medio mensual es de
2500 dólares, con una desviación estándar de 500 dólares, mientras que, en el otro país, el sueldo
medio es de 2500 soles y una varianza de 10500 soles2. ¿En qué país los sueldos presentan mayor
variabilidad?
36.En la Bolsa de Valores de Lima se analiza la cotización de las acciones de dos empresas. Las accio-
nes de la empresa A se cotizan en promedio a 4,50 soles con una desviación estándar de 0,50 so-
les, mientras que las acciones de la empresa B se cotizan en promedio a 15 soles con una varianza
de 0,85 soles2. ¿Qué empresa tiene las acciones más riesgosas, es decir, con mayor variabilidad?
37.La siguiente información corresponde al tiempo de servicio, en meses, de una muestra de publi-
cistas que laboran en dos conocidas agencias de la capital.
Agencia A Agencia B
Media 18,93 Media 19,64
Mediana 14,00 Mediana 15,00
Moda 6,00 Moda 11,00
Desviación estándar 15,78 Varianza 94,2841
Muestra 15 Muestra 25
a. ¿Qué tipo de asimetría presenta la distribución del tiempo de servicio de la agencia A?
b. ¿En cuál de las agencias publicitarias el tiempo de servicio (en meses) es más homogéneo?
Notas
EPE UPC 79
39.Un conjunto de 20 valores tiene una media igual a 50; otro conjunto de 20 valores tiene una me-
dia igual a 30, la desviación estándar de los 40 valores considerados conjuntamente es igual a 10.
Calcular el coeficiente de variación de los 40 números.
40. La constructora A está evaluando la posibilidad de expandir sus servicios de construcción de blo-
ques de departamentos en el norte (Piura, Tumbes). Para tal fin, realizó un estudio de las cons-
trucciones realizadas por otras constructoras respecto a la ganancia obtenida en 300 departa-
mentos construidos en cada lugar. Asimismo, se detalló la ganancia según nivel socioeconómico
del lugar. Los datos se encuentran en miles de soles.
Notas
80 CE104 Estadística
41. La siguiente base de datos muestra las respuestas obtenidas de una encuesta realizada a una
muestra de 40 empleados de una empresa de servicios.
a. Calcule e interprete el valor de la mediana del tiempo de servicio para el grupo de hombres y
para el grupo de mujeres.
b. Calcule e interprete el valor de la moda del número de hijos para el grupo de hombres y para
el grupo de mujeres.
c. Calcule e interprete el valor de las medidas de tendencia central para el tiempo de servicio
por categoría laboral.
Notas
EPE UPC 81
1. Para hacer una tabla de distribución de frecuencias para variables cualitativas, copie los nombres
de las categorías que desee contar. Tenga mucho cuidado al escribir los nombres de las catego-
rías; si no están bien escritos, la función no contará adecuadamente y aparecerá un cero.
2. Escriba en la celda al costado de la primera categoría la función =CONTAR.SI(rango;criterios).
o En Rango indique las celdas donde están los datos.
o En Criterio indique la celda que contiene el nombre de la categoría que desee contar.
3. Luego, copie la celda con la función =CONTAR.SI() a las demás celdas correspondientes.
4. Calcule las frecuencias relativas (hi) o porcentuales (pi).
Notas
82 CE104 Estadística
1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.
Notas
EPE UPC 83
7. Arrastre la variable de la cual desea el cuadro al área Etiquetas de fila (Filas) y también al área ∑
Valores.
Notas
84 CE104 Estadística
Gráfico de barras
En el eje horizontal se representa las categorías de la variable y en el eje de ordenadas las frecuen-
cias absolutas, relativas o porcentuales.
Para hacer gráficos de barras o columnas en Excel, usted tiene dos posibilidades:
2. Seleccione las celdas de la variable y las celdas de las frecuencias absoluta o relativa. Seleccione
también el título. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
3. Haga clic en la opción Insertar de la barra de menú y active el icono Columna. Seleccione la op-
ción Columna 2-D y haga clic sobre Columna agrupada.
Notas
EPE UPC 85
5. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.
En Excel 2010, seleccione Presentación, luego escoja los botones Título de gráfico, Rótulo del eje
o Etiquetas de datos para darle el formato deseado a su gráfico. Además, registre la fuente me-
diante un cuadro de texto.
En Excel 2013 y 2016, seleccione Diseño, luego escoja la opción Agregar elementos de gráfico o
la opción + para darle el formato deseado a su gráfico.
Notas
86 CE104 Estadística
6. Para mostrar las frecuencias porcentuales, use las frecuencias relativas para hacer el gráfico y
haga doble clic en el eje vertical. Luego, seleccione la opción Número y haga clic en Porcentaje.
Notas
EPE UPC 87
1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.
7. Arrastre la variable de la cual desea el cuadro al área Campos de eje y también al área ∑ Valores.
8. Para mostrar las frecuencias porcentuales, haga clic derecho en Cuenta. Luego elija Mostrar valo-
res como del menú desplegable. A continuación, elija % del total general.
Notas
88 CE104 Estadística
6. Para mostrar las frecuencias porcentuales, haga clic derecho en Cuenta. Luego elija Mostrar va-
lores como del menú desplegable. A continuación, elija % del total general.
7. En todas las versiones de Excel, usted puede poner título, rótulos de ejes, etiquetas de datos,
fuente de la misma manera. Debe quedar un gráfico parecido a este o de frecuencias porcentua-
les.
Notas
EPE UPC 89
2. Seleccione las celdas de la variable y las celdas de la de frecuencia absoluta o relativa. Seleccione
también el título. Use la tecla Ctrl si necesita seleccionar celdas no contiguas.
3. Haga clic en la opción Insertar de la barra de menú y active el icono Columna. Seleccione la op-
ción Columna 2-D y haga clic sobre Columna agrupada.
Notas
90 CE104 Estadística
5. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.
En Excel 2010
Seleccione Presentación, luego escoja los botones Título de gráfico, Etiquetas de datos para dar-
le el formato deseado a su gráfico. Además, registre la fuente mediante un cuadro de texto.
En Formato de etiquetas de datos, elija las opciones Nombre de categoría, Porcentaje y Extre-
mo externo.
Notas
EPE UPC 91
En Formato de etiquetas de datos, elija las opciones Nombre de categoría, Porcentaje y Extre-
mo externo.
Notas
92 CE104 Estadística
1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.
7. Arrastre la variable de la cual desea el cuadro al área Campos de eje y también al área ∑ Valores.
Notas
EPE UPC 93
Notas
94 CE104 Estadística
3. Para mostrar el gráfico circular seleccione en el menú Diseño y luego la opción Cambiar tipo de
gráfico.
Notas
EPE UPC 95
Hay varias formas en Excel de hacer una tabla de frecuencias para variables discretas, dos de ellas
son:
1. Para hacer una tabla de distribución de frecuencias para variables cualitativas, copie los valores
de la variable que desee contar. Tenga mucho cuidado al escribir los valores; si no están bien es-
critos, la función no contará adecuadamente y aparecerá un cero.
2. Escriba en la celda al costado de la primera categoría la función =CONTAR.SI(rango;criterios).
o En Rango indique las celdas donde están los datos.
o En Criterio indique la celda que contiene el valor de la variable que desee contar.
3. Luego, copie la celda con la función =CONTAR.SI() a las demás celdas correspondientes.
4. Calcule las frecuencias relativas (hi) o porcentuales (pi).
Un inconveniente de este método es que se debe saber previamente todos los valores del rango
de la variable.
Notas
96 CE104 Estadística
1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.
Notas
EPE UPC 97
7. Arrastre la variable de la cual desea hacer el cuadro al área Etiquetas de fila (Filas) y también al
área ∑ Valores.
8. Coloque el cursor en la opción Suma de la variable y haga clic derecho, haga clic en Resumir va-
lor por cambie Recuento en vez de Suma.
Notas
98 CE104 Estadística
Notas
EPE UPC 99
2. Seleccione las columnas Número de capacitaciones y frecuencia absoluta (fi) o relativa (hi).
3. En la barra de menú, elija la opción Insertar, seleccione el tipo Dispersión.
En Excel 2010 aparecerá este menú.
Notas
100 CE104 Estadística
4. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.
En Excel 2010
5. Seleccione el gráfico, elija la opción Presentación y elija la opción Barras de error. En esa opción
seleccione Más opciones de las barras de error…
6. En Barras de error verticales seleccione la opción Menos. Luego en Cuantía de error, elija Por-
centaje y coloque el valor 100%. Borre las barras de error horizontales que aparecen automáti-
camente.
4. Si lo desea puede cambiar algunas características al gráfico. De ser necesario, coloque los valores
del eje Y en formato Porcentaje.
Notas
EPE UPC 101
7. Si lo desea puede cambiar algunas características al gráfico. De ser necesario, coloque los valores
del eje Y en formato Porcentaje.
Notas
102 CE104 Estadística
4. Haga doble clic en el área del gráfico, aparecerá una pestaña de Herramientas de gráficos con las
opciones:
En Excel 2010: Diseño, Presentación y Formato.
En Excel 2013 y 2016: Diseño y Formato.
Notas
EPE UPC 103
5. Seleccione el gráfico, elija la opción Diseño y elija la opción Diseño rápido. Haga clic en Diseño 7.
En Excel 2010 aparecerá el siguiente menú, haciendo clic en Diseños de gráficos.
En Excel 2013 y 2016 aparecerá el siguiente menú, haciendo clic en Diseño rápido.
8. Para quitar la línea, haga clic sobre ella, seleccione Formato de punto de datos... Luego, presione
el botón derecho del mouse. Elija Color de línea y marque Sin línea.
Notas
104 CE104 Estadística
9. Luego, haga clic derecho en cualquier parte del gráfico y elija Seleccionar datos.
10. Haga clic en Editar y escoja como Rango de rótulos del eje: a las celdas que tienen los valores de
la variable discreta.
Obtendrá el siguiente gráfico. Si es necesario debe poner frecuencia cero a los valores sin datos.
11. Si lo desea puede cambiar algunas características al gráfico. De ser necesario, coloque los valores
del eje Y en formato Porcentaje.
Notas
EPE UPC 105
Hay varias formas en Excel de hacer una tabla de frecuencias para variables por intervalos, dos de
ellas son:
1. Use las funciones del Excel para realizar los siguientes cálculos.
A B
Máximo 351.1 =MAX(datos)
Mínimo 145.1 =MIN(datos)
Rango 206 =B6-B7
Cantidad de datos (n) 48 =CONTAR(datos)
k (por regla de Sturges) 6.58508 =1+3.322*LOG(n)
k (entero) 7 =REDONDEAR(k; 0)
w (Amplitud) 29.4286 =B8/B11
Número de decimales de los datos 1
w (redondeada) 29.5 =REDONDEAR.MAS(w; decimales)
2. Ahora, calcule los límites de los intervalos. Comience con el mínimo y aumente una amplitud
cada vez. Además, calcule las marcas de clase, como la semisuma de los límites.
3. Para calcular las frecuencias absolutas, seleccione el rango en el cual aparecerán las frecuencias
absolutas. Haga clic en el icono de Insertar función, seleccione Frecuencia y de Aceptar.
Notas
106 CE104 Estadística
Notas
EPE UPC 107
Copie los datos en la columna A del Excel y en la fila 1 agregue el nombre de la variable.
En el menú principal elija la opción Datos. Luego seleccione Análisis de datos.
Notas
108 CE104 Estadística
Completamos los siguientes cálculos:
6. Ahora, calcule los límites de los intervalos. Comience con el mínimo y aumente una amplitud
cada vez. Además, calcule las marcas de clase, como la semisuma de los límites.
7. Para calcular las frecuencias absolutas, seleccione en el menú principal la opción Datos. Luego,
haga clic en Análisis de datos. Luego haga clic en Histograma.
En Rango de entrada seleccione las celdas que contenga los datos a contar.
En Rango de clases seleccione los límites superiores de los intervalos.
Tener cuidado con la opción Rótulos. Si la elige debe elegir los encabezados tanto en Rango de
entrada como en Rango de clases.
Obtendrá las frecuencias correspondientes, con las cuales puede completar la tabla de distribución.
Clase Frecuencia
174.6 3
204.1 3
233.6 10
263.1 12
292.6 7
322.1 7
351.6 6
y mayor... 0
Notas
EPE UPC 109
Notas
110 CE104 Estadística
Histograma de frecuencias
Hay varias formas en Excel de hacer una tabla de frecuencias para variables por intervalos, dos de
ellas son:
1. Lo primero es poner los datos en una columna. Es conveniente poner el nombre de la variable en
la primera fila.
2. Luego, en el menú principal haga clic en Insertar, luego haga clic en Histograma.
Obtendrá el siguiente gráfico. Observe que Excel decide automáticamente la cantidad de interva-
los y no usa la regla de Sturges (k = 1 + 3,322 log(n)). Excel usa la regla de Scott, en la que el an-
3,5×𝜎
cho del intervalo se calcula como 𝑤 = 3 , donde es la desviación estándar de los datos y n
√𝑛
es el tamaño de muestra.
3. Si desea cambiar el ancho de los intervalos, haga clic derecho sobre el eje. Elija Dar formato al
eje… Seleccione Ancho del rango y escriba el ancho del intervalo que desee.
Notas
EPE UPC 111
Notas
112 CE104 Estadística
Notas
EPE UPC 113
5. Para cambiar los valores del eje X debe crear un grupo de celdas donde estén los intervalos. Puede usar la
función =CONCATENAR()
6. Luego, seleccione el gráfico, haga clic en Diseño y seleccione Seleccionar datos. Haga clic en Editar.
7. Si lo desea puede cambiar algunas características al gráfico. Con este método solo se puede hacer histo-
gramas de frecuencias absolutas y porcentuales.
Notas
114 CE104 Estadística
Tabulación cruzada
1. Cada variable debe estar en una columna. Los nombres de las variables estarán en la primera fila.
2. Ubique el cursor en cualquier celda de los datos.
3. Haga clic en la opción Insertar de la barra de menú.
En Excel 2010 aparecerá este menú
Notas
EPE UPC 115
9. Copie la tabla, como valores, en otras celdas y dele el formato que desee.
Notas
116 CE104 Estadística
1. Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los
totales.
2. Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna agrupada.
3. Haga clic a cualquier línea horizontal del gráfico y observará que todas las líneas horizontales se
seleccionan. Presione la tecla Supr de su teclado para eliminarlas.
4. Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opciones:
Diseño, Presentación y Formato.
5. Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26
(segunda columna fila 4) es el que se presenta como modelo en este material.
6. Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo
del eje y Etiqueta de datos para darle el formato deseado.
7. Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje…
/Número/Porcentaje/Posiciones decimales: 0/Cerrar.
8. Elimine los valores porcentuales iguales a cero para una mejor presentación.
Notas
EPE UPC 117
1. Seleccione solo las celdas correspondientes a las categorías de ambas variables. No incluya los
totales.
2. Haga clic en la opción Insertar de la barra de menú y elija Columna/Columna 100% apilada.
3. Haga clic en el área del gráfico y aparecerá la pestaña Herramientas de gráficos con las opciones:
Diseño, Presentación y Formato.
4. Seleccione Diseño y elija el estilo que desee haciendo clic en el menú despegable. El estilo 26
(segunda columna fila 4) es el que se presenta como modelo en este material.
5. Seleccione ahora la pestaña Presentación, y de ahí escoja los botones Título de gráfico, Rótulo
del eje y Etiqueta de datos para darle el formato deseado.
6. Haga clic derecho sobre cualquier valor del eje Y y del menú elija Dar formato al eje…
/Número/Porcentaje/Posiciones decimales: 0/Cerrar.
7. Elimine los valores porcentuales iguales a cero para una mejor presentación.
Notas
118 CE104 Estadística
Medidas de resumen
Mediana =MEDIANA(datos)
Rango intercuartil Excel no calcula directamente el rango intercuartil, por lo que use las fun-
ciones:
=PERCENTIL.EXC(datos,0.75) para calcular el valor del percentil 75,
=PERCENTIL.EXC(datos,0.25) para calcular el valor del percentil 25,
Luego el valor del rango intercuartil es P75 – P25.
Desviación estándar =DESVEST.M para calcular la desviación estándar muestral.
=DESVEST.P para calcular la desviación estándar poblacional.
Coeficiente de varia- Excel no calcula el coeficiente de variación, por lo que use las funciones:
ción =PROMEDIO(datos) para calcular la media
=DESVEST.M(datos) para calcular la desviación estándar
Para luego, dividir la desviación estándar entre su respectiva media.
Notas
EPE UPC 119
Unidad 3. Probabilidades
Experimento Es un proceso que al ser realizado repetidas veces, bajo las mismas
aleatorio condiciones, da un resultado que no es previsible con certeza.
Notas
120 CE104 Estadística
Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones, genera
más de un posible resultado que no puede ser determinado de antemano. Se denota por ε.
Espacio muestral
Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. Se denota por
Ω o S.
Cada elemento del espacio muestral se denomina punto muestral.
Evento
Es todo subconjunto de un espacio muestral. Se denota mediante letras mayúsculas, por ejemplo, A,
B, C, … o X1, X2, X3.
Probabilidad
Es una medida de la posibilidad de ocurrencia de un evento.
Ejercicio 58
Marque con un aspa, asignando una opción a la situación descrita de acuerdo con su posibilidad de
ocurrencia.
Muy poco Poco Igualmente proba- Bastante Muy
Situación
probable probable ble que ocurra o no probable probable
Aprobaré este curso
Lanzo un dado y sale un número par
El PBI del Perú crecerá 4% este año
Perú se clasificará al Mundial 2018
Probabilidad
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto, la pro-
babilidad es una medida del grado de incertidumbre asociado con un evento.
Los valores de la probabilidad siempre se asignan en una escala de 0 a 1.
Una probabilidad cercana a 0 indica que es difícil que el evento ocurra, mientras que, una probabili-
dad cercana a 1 indica que es casi seguro que el evento ocurra.
Ejercicio 59
Complete el siguiente cuadro asignando probabilidades según su parecer.
Experimento aleatorio Un evento Probabilidad
Michelle Obama postula a la presidencia de EEUU A = Gana P(A) = ……………….
El expresidente Toledo es juzgado B = Va a la cárcel P(B) = ……………….
Alianza Lima juega el campeonato descentralizado C = Sale campeón P(C) = ……………….
Se lanzan dos dados y se suman las caras D = La suma es 7 P(D) = ……………….
Notas
EPE UPC 121
Ejercicio 60
Experimento aleatorio Lanzar un dado y registrar lo que sale en la cara superior
Espacio muestral Ω = {1, 2, 3, 4, 5, 6}
Eventos A = {1}
B = {1, 2, 3}
nA
Probabilidad P A =………………………..……
n
nB
P B =………………………..……
n
Experimento aleatorio Lanzar dos monedas y registrar lo que sale en la cara superior
Espacio muestral Ω = {(……. , …….), (……. , …….), (……. , …….), (……. , …….)}
Evento A = {que salgan dos caras} = {(……., …….)}
nA
Probabilidad P A =………………………..……
n
Experimento aleatorio Sacar una bola y anotar su color de una urna que contiene tres bolas
rojas y cuatro negras
Evento: A = {que salga una bola roja}
nA
Probabilidad P A =………………………..……
n
Ejercicio 61
Sea el experimento aleatorio ε: lanzar dos dados simultáneamente y anotar el número de la cara
superior de cada dado. ¿Por qué se considera es aleatorio?
Notas
122 CE104 Estadística
Álgebra de eventos
Sea un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos definidos
en Ω, se define:
Complemento de un evento
Unión de eventos
Para dos eventos A y B, la unión del evento A con el evento B (A B) es
el evento que contienen todos los puntos de S que pertenecen a A o a B
o a ambos.
Intersección de eventos
Para dos eventos A y B, la intersección de los eventos A y B (A B) es el
evento que contienen todos los puntos de S que pertenecen tanto a A
como a B.
Diferencia de eventos
Para dos eventos A y B, la diferencia de los eventos A y B (A - B) es el
evento que contienen todos los puntos de S que pertenecen a A y no
pertenecen a B.
Notas
EPE UPC 123
Ejercicio 62
Una inversionista compra acciones de la empresa A y de la empresa B.
Escriba los siguientes eventos en función de los eventos A y B. Además, grafique dicho evento en un
diagrama de Venn.
Solución
Notas
124 CE104 Estadística
Axiomas de la probabilidad
Un axioma es una proposición o enunciado tan evidente
que se considera que no requiere demostración.
Teoremas de probabilidad
P() = 0, donde es el evento imposible.
P(AC) = 1 – P(A)
Si A y B son eventos cualesquiera, entonces:
P(A B) = P(A) + P(B) – P(A B)
Ejercicio 63
Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer trabajo es de
0,7 y que sea aceptado en el segundo es de 0,4. La probabilidad de que no sea aceptado en ninguno
de los trabajos es de 0,2.
Solución
Sean los eventos:
A: …………………………………………………………………………………………………………………………………………………………
B: …………………………………………………………………………………………………………………………………………………………
Pregunta Notación Diagrama de Venn
P(A ………... B)
Calcule la probabilidad de que sea aceptado en al
menos uno de los trabajos.
Notas
EPE UPC 125
Probabilidad condicional
Sea un experimento aleatorio y el espacio muestral asociado. Sean A, B dos eventos definidos
en . La probabilidad de ocurrencia del evento A sabiendo que el evento B ha ocurrido se denota por
P(A/B) y se llama probabilidad condicional de A dado B:
P A B
P AB
PB
PB 0
Ejercicio 64
Se seleccionó una muestra aleatoria de trabajadores de la empresa A para determinar sus planes de
jubilación después de cumplir los 65 años de edad. Los trabajadores en la muestra se dividieron en:
ejecutivos, empleados y obreros. Los resultados obtenidos fueron:
Título: ………………………………………………………………………………………………………………………………………
Planes después de los 65 años
Trabajador Total
Se jubile (D) No se jubile (E) No ha decidido su jubilación (F)
Ejecutivo (A) 8 3 1
Empleado (B) 20 10 5
Obrero (C) 50 22 11
Total 78 35 130
Fuente: Empresa A
Notas
126 CE104 Estadística
Ejercicio 65
En la ciudad A se realizó una encuesta a personas adultas para conocer la opinión que tienen respec-
to a una nueva ley del gobierno local. La siguiente tabla muestra los resultados de la encuesta. Los
entrevistados fueron clasificados según su sexo.
Título: …………………………………………………………………………………………………………………………………………………
Opinión
Total
Sexo A favor En contra Ni a favor no en contra
Masculino 110 290 90 490
Femenino 140 170 150 460
Total 250 460 240 950
Fuente: Municipalidad de la ciudad A
b. Si se eligió a una persona a favor de la nueva ley, calcule la probabilidad que sea hombre.
c. Si se eligió a una mujer, calcule la probabilidad que no esté en contra de la nueva ley.
Notas
EPE UPC 127
Ejercicio 66
Tarjeta A, es el sistema de lealtad que implementó la cadena de supermercados A, que cuenta con
sucursales en Arequipa, Ica y Trujillo. Gracias al uso de la tarjeta A, la cadena de supermercados A
recibe la información detallada de las compras de sus clientes, creando de esta manera una base de
datos con sus perfiles.
Se desea mejorar el sistema de lealtad, para lo cual se entrevistó a 170 clientes de la cadena de su-
permercados A que poseen la tarjeta A. Se obtuvo la siguiente información.
Sucursal
Total
Nivel de educación Arequipa Ica Trujillo
Escolar 33 26 23 82
Superior 35 20 12 67
Posgrado 12 4 5 21
Total 80 50 40 170
Se elige un cliente al azar.
a. ¿Cuál es la probabilidad de que tenga nivel educativo superior y sea de Trujillo?
d. Calcule la probabilidad de que tenga un nivel educativo superior, si se sabe que es de Trujillo.
Notas
128 CE104 Estadística
Ejercicio 67
Un instituto de investigaciones académicas desea determinar si existe relación entre el interés de un
estudiante en finanzas, su habilidad en matemáticas y su género. Se selecciona una muestra de 200
estudiantes y mediante una prueba se mide su habilidad matemática y su interés en finanzas. Los
resultados fueron los siguientes:
Género
Interés Femenino (A1) Masculino (A2)
Total
en finanzas Habilidad en matemáticas Habilidad en matemáticas
Baja (C1) Media (C2) Alta (C3) Baja (C1) Media (C2) Alta (C3)
Bajo (B1) 25 9 6 35 6 10 91
Medio (B2) 4 22 7 11 21 3 68
Alto (B3) 2 5 15 3 7 9 41
Total 31 36 28 49 34 22 200
Solución
b. ¿Cuál es la probabilidad de que no tenga una alta habilidad en matemáticas y tenga un interés
medio en finanzas?
Notas
EPE UPC 129
Eventos independientes
Dos eventos cualesquiera A y B son independientes si y solo si
Ejercicio 68
Si dos eventos A y B son independientes, indique el diagrama de Venn correspondiente.
Ejercicio 69
Una empresa desea establecer dos negocios adicionales, una juguería y una heladería, en dos locales
diferentes. Por experiencias pasadas, se sabe que la probabilidad de que tenga éxito en la juguería es
del 60%, mientras que tenga éxito en la heladería es del 70%. Si podemos considerar a los dos nego-
cios como independientes.
a. Calcule la probabilidad de que tenga éxito solo en un negocio adicional.
b. Calcule la probabilidad de que tenga éxito solo en la juguería.
c. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.
d. Calcule la probabilidad de que tenga éxito en al menos uno de los negocios.
Solución
Sean los eventos:
……. : ...……………………………………………………………………….. luego, P(……………) = …………………..
……. : ...……………………………………………………………...……….. luego, P(……………) = …………………..
Se pide:
a. Calcule la probabilidad de que tenga éxito solo en un negocio adicional.
P(……………………) = ……………………………………………………………………………………………………………..
b. Calcule la probabilidad de que tenga éxito solo en la juguería.
P(……………………) = ……………………………………………………………………………………………………………..
Notas
130 CE104 Estadística
Ejercicio 70
Un tipo de celular falla por tres causas: humedad, caídas y por software. Antes del primer año, la
probabilidad de que falle por humedad es del 8%, por caídas del 13% y por software 5%. Considere
que cada fallo ocurre de manera independiente uno del otro.
a. Calcule la probabilidad de que un celular falle por las tres causas.
b. Calcule la probabilidad de que falle por, como máximo, dos causas
Solución
Sean los eventos:
H: ………………………………………………………………………………………………………………………………………………….
C: ………………………………………………………………………………………………………………………………………………….
S: ………………………………………………………………………………………………………………………………………………….
Ejercicio 71
Se seleccionó una muestra de 500 personas para determinar información respecto al comportamien-
to de los consumidores. Entre las preguntas formuladas estaba “¿Disfruta comprar ropa?” De 240
hombres, 136 respondieron que sí, mientras que, de las 260 mujeres, 244 respondieron que sí.
Se definen los eventos:
A = El consumidor disfruta comprar ropa
B = El consumidor es hombre
¿Son los eventos A y B independientes?
Solución
Para que los eventos A y B sean independientes se debe cumplir que:
PA B PA PB
De acuerdo con los datos, se tiene que:
Sexo Sí No Total
Hombre 136 104 240
Mujer 244 16 260
Total 380 120 500
Calculamos:
136 380 240
P A B 0,272 PA PB 0,3648
500 500 500
Por lo tanto, como PA B PA PB entonces A y B no son eventos independientes.
Notas
EPE UPC 131
Ejercicio 72
Se quiere lanzar un nuevo producto para la limpieza del hogar, el departamento de marketing tiene
una propuesta de tres productos A, B y C; las compañías fabricantes de estos tres productos indican
que las probabilidades de que los productos presenten algún defecto en su envase es:
para el producto A de 2%,
para el producto B de 4%,
para el producto C es de 3%.
La presencia de defectos es independiente para cada uno de los productos.
Notas
132 CE104 Estadística
Diagrama de árbol
Es la representación gráfica de los resultados posibles de la realización de un experimento aleatorio.
Cada parte terminal representa un resultado posible del experimento aleatorio y las probabilidades
se indican en las ramas.
Teorema de Bayes
Sea un experimento aleatorio, A un evento cualquiera definido sobre Ω y E1, E2, ... , Ek una parti-
ción del espacio muestral Ω, entonces:
P A / E j P E j
P E j /A k
para j = 1, 2,…, k
PA / E PE
i 1
i i
Notas
EPE UPC 133
Ejercicio 73
El departamento de créditos de una tienda comercial sabe que sus ventas se pagan con dinero en
efectivo, con cheque o al crédito, con probabilidades respectivas de 0,35; 0,25 y 0,4. La probabilidad
de que una venta sea por más de 50 dólares, es igual a 0,2 si ésta es en efectivo, es igual a 0,9 si ésta
es con cheque y es igual a 0,6 si ésta es al crédito.
a. Calcule la probabilidad de que una persona compre por más de 50 dólares.
b. Si compra por más de 50 dólares, calcule la probabilidad que la compra se realizó en efectivo.
Solución
Sean los eventos:
E: La compra se realiza con dinero en efectivo
CH: La compra se realiza con cheque
C: La compra se realiza al crédito
M: La compra es por más de 50 dólares
b. Si compra por más de 50 dólares, ¿cuál es la probabilidad de que la compra se haya realizado en
efectivo?
P......./ ...... ............................................................ ............................................
Ejercicio 74
El banco A ha estimado por experiencias anteriores, que el 15% de clientes a los que se les hizo prés-
tamo resultaron morosos. Además, se sabe que:
el 27% de los clientes morosos utilizaron el préstamo para financiar ampliaciones en la vivienda
el 68% de los préstamos pagados a tiempo se hicieron para realizar ampliaciones en la vivienda.
Si el día de hoy se hizo préstamo a un cliente, determine:
a. La probabilidad de que dicho préstamo no se utilice para realizar ampliar la vivienda.
b. Si el préstamo se usó para ampliar la vivienda, calcule la probabilidad que el cliente sea moroso.
c. Si el préstamo no se utilizó para ampliar la vivienda, ¿cuál es la probabilidad de que el cliente no
sea moroso?
Solución
Sean los eventos:
……….... : ………………………………………………………………………………………………………….………..
……….... : …………………………………………………………………………………………………………….……..
……….... : …………………………………………………………………………………………………….……………..
……….... : ………………………………………………………………………………………………….………………..
Notas
134 CE104 Estadística
Se pide calcular:
a. P............... ...........................................................................................................
b. P......./ ...... ............................................................ ............................................
c. P......./ ...... ............................................................ ............................................
Ejercicio 75
En un estudio, se afirma que el seguro vehicular es el más importante en términos de facturación
anual en el mercado asegurador de riesgos generales. Las participaciones de las empresas del mer-
cado asegurador de vehículos son: Seguros A con 40%, Seguros B con 35%; y otros seguros con 25%.
Se sabe que el porcentaje de siniestros vehiculares (S) registrados el año pasado de cada aseguradora
es: Seguros A es 5%, Seguros B es 8% y otros es 10%.
a. Calcule la probabilidad de que el seguro vehicular registre siniestro el año pasado.
b. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.
Solución
b. Si se tiene un siniestro vehicular del año pasado, calcule la probabilidad de que sea de Seguros A.
Notas
EPE UPC 135
Ejercicio 76
Una empresa de manufactura recibe embarques de una determinada pieza de dos proveedores. Ac-
tualmente el 65% de las piezas adquiridas por la empresa provienen del proveedor 1 y 35% restante
del proveedor 2. La calidad de las piezas adquiridas varía con la fuente de suministro. Con base a los
datos históricos se sabe que la probabilidad que una pieza del proveedor 1 sea defectuosa es 0,02 y
la probabilidad de que una pieza del proveedor 2 sea defectuosa es 0,05.
Si seleccionamos al azar una de las piezas adquiridas por la empresa, ¿cuál es la probabilidad de que
sea defectuosa?
Solución
Sean los eventos:
E1 = La pieza proviene del proveedor 1, luego se tiene que P(E1) = 0,65
E2 = La pieza proviene del proveedor 2, luego se tiene que P(E2) = 0,35
A = Pieza defectuosa.
Ac = Pieza no defectuosa.
P(A/E1) = 0,02 y consecuentemente P(Ac/E1) = 0,98.
P(A/E2) = 0,05 y consecuentemente P(Ac/E2) = 0,95.
Entonces, P(A) = P(A/E1) P(E1) + P(A/E2) P(E2) = 0,02 × 0,65 + 0,05 × 0,35 = 0,0305
Ejercicio 77
La empresa de tejidos A se dedica a la fabricación de tejidos de lana de primera calidad. Para la pró-
xima temporada de invierno está elaborando un producto exclusivo que se espera sea todo un éxito.
La empresa A cuenta con tres tipos de máquinas tejedoras A, B y C:
el tipo A produce el 40% de la producción y un 3% de piezas defectuosas,
el tipo B produce el 35% de la producción y un 1% de piezas defectuosas,
el tipo C produce el 25% de la producción y un 2% de piezas defectuosas.
El departamento de control de calidad selecciona un artículo de toda la producción y lo analiza.
a. ¿Cuál es la probabilidad de que un artículo seleccionado al azar sea defectuoso?
b. Si el producto seleccionado no fue defectuoso, ¿cuál es la probabilidad de que no haya sido pro-
ducido por las máquinas tipo B o C?
Solución
Se definen los siguientes eventos.
A: un artículo es producido por la máquina tipo A
B: un artículo es producido por la máquina tipo B
C: un artículo es producido por la máquina tipo C
D: Un artículo es defectuoso.
Se tiene que:
P(A) = 0,40; P(B) = 0,35; P(C) = 0,25; P(D/A) = 0,03; P(D/B) = 0,01; P(D/C) = 0,02
Notas
136 CE104 Estadística
P(B ∪ C /D ) = P(A/D ) =
P A DC
0 ,4 0 ,97
0 ,39612
C C C C
PD C
1 0 ,0205
Ejercicio 78
Para la empresa tecnológica A, se estima que la probabilidad de hacer un servicio en Lima es de 0,60
y en el interior del país es de 0,40.
Si el servicio es en Lima, la probabilidad de que sea:
para instalación de equipos es 0,3
para help desk es 0,6
para reparación de equipos es 0,1.
Si el servicio es en el interior del país, la probabilidad de que sea:
para instalación de equipos es 0,5
para help desk es 0,15
para reparación de equipos es 0,35.
a. Calcule la probabilidad de que el próximo servicio de la empresa A sea de help desk.
b. Si el servicio contratado no fue de help desk, calcule la probabilidad de que haya sido para Lima.
Solución
Se define los eventos:
L:= Contratan a la empresa para un servicio en Lima
Lc:= Contratan a la empresa para un servicio en el interior del país
I:= Contratan a la empresa para un servicio de instalación de equipo
H:= Contratan a la empresa para un servicio de help desk
R:= Contratan a la empresa para un servicio de reparación de equipo
a. Calcule la probabilidad de que el próximo servicio de la empresa A sea de help desk.
Notas
EPE UPC 137
Ejercicio 79
Los clientes acostumbran evaluar en forma preliminar el diseño de sus productos. En el pasado, 95%
de sus productos de gran éxito recibieron críticas favorables, 60% de los productos con éxito mode-
rado recibieron críticas favorables y 10% de los productos sin mucho éxito recibieron críticas favora-
bles. Además, 40% de los productos han sido de gran éxito, 35% han sido de éxito moderado y 25%
han sido productos sin mucho éxito.
a. ¿Cuál es la probabilidad de que un producto obtenga una crítica favorable?
b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño
de gran éxito?
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto
de gran éxito?
Solución
Se define los eventos:
G: El producto ha tenido gran éxito
M: El producto ha tenido éxito moderado
P: El producto ha tenido poco éxito
F: El producto tuvo crítica favorable
b. Si un diseño nuevo obtiene una crítica favorable, ¿cuál es la probabilidad de que sea un diseño
de gran éxito?
PG F 0 ,380
PG F 0 ,618
PF 0 ,615
c. Si un producto no consigue una crítica favorable, ¿cuál es la probabilidad de que sea un producto
de gran éxito?
P G FC
P G FC
PF C
0 ,02
1 0 ,615
0 ,052
Notas
138 CE104 Estadística
Ejercicios propuestos
42. Una importante empresa constructora está financiando la venta de departamentos en una zona
exclusiva de Asia, el 46% de los futuros propietarios solicitaron los servicios de gimnasio y el 54%
los servicios de sauna y el 30% ambos servicios. Con la finalidad de realizar una planificación pa-
ra la provisión de los servicios demandados por los clientes.
a. ¿Cuál es la probabilidad de que un propietario haya solicitado los servicios de gimnasio o
sauna? Rpta: 0,7
b. ¿Cuál es la probabilidad de que un propietario no haya solicitado ni servicio de gimnasio ni
servicio de sauna? Rpta: 0,3
c. ¿Cuál es la probabilidad de que un propietario haya solicitado solo el servicio de gimnasio?
Rpta: 0,16
43. Una empresa de insumos informáticos recibe semanalmente pedidos de uno de sus clientes más
importantes. Se dispone de la siguiente información acerca del tipo de productos que solicita: el
55% de las veces incluye en su pedido el producto A, el 40% de las veces el producto B y en el
30% de los pedidos se solicitan los dos productos. Calcular la probabilidad de que la semana
próxima este cliente solicite:
a. El producto A o el producto B. Rpta: 0,65
b. El producto A y no el B. Rpta: 0,25
44. Debido a la llegada del mundial de futbol, las ventas de televisor plasma han aumentado. Por
ejemplo, en el Cono Norte de Lima, la probabilidad que una familia seleccionada al azar tenga
televisor plasma es 0,8, la probabilidad que tenga televisor LCD es 0,35 y la probabilidad que
tenga ambos tipos de televisores es 0,26.
a. Calcule la probabilidad que tenga televisor plasma o LCD. Rpta: 0,89
b. Calcule la probabilidad de que solo tenga televisor plasma. Rpta: 0,54
c. Calcule la probabilidad que no tenga ni televisor plasma ni LCD. Rpta: 0,11
45. La probabilidad de que la compra de un cliente esté influenciada por alguna red social es de
0,68, la probabilidad de que la compra esté influenciada por la publicidad en televisión es de
0,50 y la probabilidad de su compra esté influenciada por ambos factores es de 0,27.
a. ¿Cuál es la probabilidad de que alguna red social o por la publicidad en televisión?
Rpta: 0,34
b. ¿Qué probabilidad hay de que la próxima compra no esté influenciada por ambos factores?
Rpta: 0,66
46. El jefe de personal de un banco realiza un registro de los accidentes de trabajo en la sucursal
donde se reporta la mayor afluencia de clientes, por lo que los accidentes ocasionados en el
centro de trabajo se presentan en la siguiente tabla:
Notas
EPE UPC 139
47. En una muestra de 2000 hogares de Lima Metropolitana se registró el nivel educativo alcanzado
por el jefe de hogar y el nivel socioeconómico al cual pertenece.
Nivel educativo del jefe Nivel socioeconómico (NSE)
Total
de hogar A B C D E
Ningún nivel alcanzado 0 1 5 120 180 306
Primaria 2 5 200 220 120 547
Secundaria 20 150 300 280 95 845
Superior 78 44 95 80 5 302
Total 100 200 600 700 400 2000
Si se selecciona un hogar al azar, determine la probabilidad de que el jefe de hogar:
a. pertenezca al NSE A o D Rpta: 800/2000
b. tenga como mínimo un nivel educativo primario. Rpta: 1694/2000
c. tenga un nivel educativo secundario y no sea de NSE C. Rpta: 545/2000
d. tenga un nivel educativo primario o pertenezca al NSE D. Rpta: 1027/2000
48. En una encuesta de hogares realizada en la ciudad de Lima se entrevistó 248 hogares. La si-
guiente tabla muestra los hogares clasificados según sus ingresos familiares, tenencia de auto y
tenencia de casa propia.
Hogares con ingresos de $1000 o menos Hogares con ingresos de más de $1000
Con casa propia Sin casa propia Con casa propia Sin casa propia
Con auto 37 14 37 8
Sin auto 48 40 49 15
49. Una encuesta realizada en universidades privadas entre alumnos de maestría presenta los resul-
tados que se muestran en la siguiente tabla:
Notas
140 CE104 Estadística
50. Se han llevado a cabo estudios de la planeación de los consumidores para la compra de bienes
duraderos como televisores, refrigeradores, lavadoras, estufas, y automóviles. En uno de los es-
tudios se le preguntó a 1000 individuos elegidos al azar si planeaban comprar una nueva televi-
sión en los siguientes 12 meses. Un año después, se entrevistó a las mismas personas para ver si
realmente hicieron la compra. La respuesta a ambas entrevistas se muestra en la siguiente tabla.
53. En una empresa el 25% son mujeres y el 75% son hombres. Un día ha llegado tarde a trabajar el
3% de las mujeres y el 5% de los hombres. Si se elige, al azar, a un trabajador que ha llegado tar-
de, calcule la probabilidad de que sea elegida una mujer. Rpta: 0,1667
54. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que en una
chica acepte bailar con él es del 4%. Si en una fiesta saca a bailar a 40 chicas. Asuma indepen-
dencia entre la decisión de una chica y otra. Calcule la probabilidad de que baile por lo menos
con una de ellas. Rpta: 0,8046
Notas
EPE UPC 141
58. Una institución extranjera no gubernamental está pensando invertir en un proyecto en nuestro
país, las opciones son tres, invertir en un proyecto de agricultura en un 40%, invertir en un pro-
yecto minero en un 35% y el resto de probabilidad se desea invertir en un proyecto de ganade-
ría. Se obtendría apoyo del estado peruano en las probabilidades siguientes: 20%, 25% y 15% en
los proyectos respectivos mencionados anteriormente
a. Si se elige un proyecto al azar ¿cuál es la probabilidad de recibir apoyo del estado?
b. Si no se recibió apoyo del estado, ¿cuál es la probabilidad que la institución no gubernamen-
tal invirtió en un proyecto minero?
59. Un estudio indica que el 35% de consumidores de bebidas rehidratantes son mujeres. Además,
el 12% de mujeres no consume Deporade y el 85% de hombres consume Deporade. Si entre las
consumidoras Deporade se elige a una persona al azar, calcule la probabilidad que sea mujer.
60. El administrador de una tienda de ropa de vestir para caballeros ha recopilado la siguiente in-
formación sobre el número de boletas de pago entregadas a sus clientes por la compra de cami-
sas de manga corta, manga larga y manga tres cuartos durante el primer trimestre del año.
Mes evaluado Manga corta Manga larga Manga tres cuartos
Enero 25 45 43
Febrero 35 25 35
Marzo 29 29 12
Si se elige una boleta al azar, ¿cuál es la probabilidad que haya sido entregada por la venta de una
camisa de manga corta?
a. Si se elige una boleta al azar y ésta fue del mes de febrero, ¿cuál es la probabilidad de que
haya sido por la compra de una camisa de manga corta?
b. Si se elige una boleta al azar y ésta fue por la compra de una camisa de manga larga, ¿cuál es
la probabilidad de que haya sido entregada en el mes de enero?
Notas
142 CE104 Estadística
61. A lo largo de los últimos cuatro años, se ha determinado que el 20% de las compras se han reali-
zado en Econo A, el 30% en Plaza B y el 25% en Tienda C. Se sabe además que el porcentaje de
clientes femeninos es del 90% si son de Econo A, 95% si son de Plaza B, 100% si son de Tienda C
y 90% si son de Todo D. Si se elige un cliente al azar y se determina que es de sexo masculino,
¿cuál es la probabilidad que haya comprado en Plaza B?
62. Una aerolínea desea analizar el comportamiento de los clientes considerando el destino de via-
je, el tipo de cliente y el modo de compra. Dentro de su proceso de creación de reportes, para
ello, ha obtenido la siguiente tabla:
a. Calcule la probabilidad de que una persona elegida al azar no compre pasajes por Internet y
tenga un destino de viaje nacional.
b. Si se elige al azar a un cliente ocasional, calcule la probabilidad de que compre pasajes por In-
ternet.
63. La probabilidad que Jorge dispare y de en el blanco es 0,25 y para Luis la probabilidad corres-
pondiente es 0,40. Suponga que Jorge y Luis disparan de forma independiente.
a. ¿Cuál es la probabilidad de que ambos den en el blanco?
b. ¿Cuál es la probabilidad de que solo Jorge de en el blanco?
c. ¿Cuál es la probabilidad de que solo Luis de en el blanco?
d. ¿Cuál es la probabilidad solo uno de en el blanco?
e. ¿Cuál es la probabilidad ninguno de en el blanco?
f. ¿Cuál es la probabilidad al menos uno de en el blanco?
64. Una empresa desea establecer tres negocios adicionales, una juguería, una heladería y una pa-
nadería, en tres locales diferentes. Por experiencias pasadas sabe que la probabilidad de que
tenga éxito en la juguería es del 60%, que tenga éxito en la heladería es del 70% y que fracase en
la panadería es 20%. Si podemos considerar a los tres negocios como independientes.
a. Calcule la probabilidad de que se tenga éxito solo en la juguería.
b. Calcule la probabilidad de que no tenga éxito en ninguno de los negocios.
c. Calcule la probabilidad de que se tenga éxito en al menos uno de los negocios.
Notas
EPE UPC 143
Variable aleatoria
Sea un experimento aleatorio y el espacio muestral asociado.
Una variable aleatoria asocia un valor numérico a cada uno de los resultados experimentales.
El valor numérico de la variable aleatoria depende del resultado del experimento.
Las variables aleatorias se designan por letras mayúsculas (X, Y, Z, etc.), y a sus valores por letras
latinas minúsculas.
Ejercicio 80
Sea el experimento aleatorio consistente en lanzar dos monedas, entonces este experimento
determina el espacio muestral Ω = {C1C2, C1S2, S1C2, S1S2}.
Si se define la variable aleatoria X como número de caras obtenidas, entonces el rango o recorrido es
RX = {0, 1, 2}
Ejercicio 81
Sea el experimento aleatorio consistente en lanzar un dado hasta que salga seis, entonces este
experimento determina el espacio muestral Ω = {(6), (6 C, 6), (6 C, 6C, 6), ...}
Si se define la variable aleatoria X como número de veces que se lanza el dado hasta que salga seis,
entonces el rango o recorrido es RX = {1, 2, 3, …….}
Ejercicio 82
Sea el experimento aleatorio consistente en registrar el tiempo en que se mete el primer gol de
un partido de fútbol durante los 90 minutos de juego, x / 0 x 90 .
Notas
144 CE104 Estadística
Ejercicio 83
La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X:= número de
cuentas de correo que tiene un estudiante universitario.
x 1 2 3 4
f(x) = P(X = x) 2k + 0,03 0,30 0,40 k
a. Determine el valor de k para que f(x) sea función de probabilidad.
b. Calcule la probabilidad de que un estudiante universitario tenga una cuenta de correo.
c. Calcule la probabilidad de que un estudiante universitario tenga menos de dos cuentas de correo.
d. Calcule la probabilidad de que un estudiante universitario tenga más de una cuenta de correo.
Solución
e. Determine el valor de k para que f(x) sea función de probabilidad.
g. Calcule la probabilidad de que un estudiante universitario tenga menos de dos cuentas de correo.
h. Calcule la probabilidad de que un estudiante universitario tenga más de una cuenta de correo.
Notas
EPE UPC 145
Ejercicio 84
Sea el experimento aleatorio : lanzar una moneda dos veces. Sea la variable aleatoria X: número
de caras obtenidas. Determine y grafique la función de probabilidad.
Solución
El espacio muestral es Ω = {(C1 C2), (C1 S2), (S1 C2), (S1 S2)} . El número de elementos del espacio mues-
tral es 4.
Sea la variable aleatoria X: número de caras obtenidas, entonces el rango de X es RX = {0, 1, 2}
La probabilidad de no obtener cara: f(0) = P(X = 0) = ¼ = 0,25
La probabilidad de obtener una cara: f(1) = P(X = 1) = ¼ + ¼ = 2/4 = 0,50
La probabilidad de obtener dos caras: f(2) = P(X = 2) = ¼ = 0,25
La tabla de función de probabilidad sería:
x 0 1 2
f(x) = P(X = x) 0,25 0,50 0,25
Esta tabla cumple con las siguientes condiciones:
f(x) 0 Cada probabilidad es positiva y mayor o igual que cero
n
f x 1
i 1
i La suma de todas las probabilidades es igual a uno
Ejercicio 85
La distribución de probabilidad de la variable aleatoria X definida como el número de defectos por
cada 10 metros de una tela sintética en rollos continuos de ancho uniforme, es:
x 0 1 2 3 4
f(x) = P(X = x) 0,41 0,37 k 0,05 0,01
a. Determine la constante k.
b. Calcule las siguientes probabilidades: PX 3 ; PX 1 X 3 y P1 X 4
Solución
a. Determine la constante k.
4
Para hallar la constante k, usamos la condición que f x 1
i 1
i
Notas
146 CE104 Estadística
E(k) = k
E(aX + b) = a E(X) + b
Propiedades de la varianza
Sean a, b y k constantes numéricas y X una variable aleatoria, entonces:
V(k) = 0
V(aX+b) = a2V(X)
Ejercicio 86
La solicitud de préstamo que presentan los clientes de un banco está compuesta por cinco rubros. El
gerente de préstamos desea realizar un estudio sobre la distribución de la cantidad de rubros recha-
zados por cada solicitud. La siguiente tabla muestra la distribución de probabilidad de la variable
aleatoria X definida como el número de rubros rechazados por solicitud.
x 0 1 2 3 4 5
f(x) 0,79 2k k 0,03 0,02 0,01
Notas
EPE UPC 147
Solución
a. Determine la constante k y grafique la función f(x)
x 0 1 2 3 4 5
f(x) 0,79 0,03 0,02 0,01
1.0
0.8
0.6
f(x)
0.4
0.2
0.0
0 1 2 3 4 5
X
d. Calcule la probabilidad de que tenga más de uno, pero menos de cuatro rubros rechazados.
P(…………………………) = ………………………………………………………………………………………………
e. Calcule la probabilidad de que un cliente tenga a lo más tres rubros rechazados si se sabe que
esta cantidad es mayor a uno.
P(…………………………) = ………………………………………………………………………………………………
f. Calcule el número esperado de rubros rechazados.
Notas
148 CE104 Estadística
Ejercicio 87
El director del diario A está interesado en conocer la distribución del número de errores ortográficos
en el diario. Para lo cual, se seleccionaron diversos textos publicados y se registró el número de erro-
res ortográficos por texto. Se definió la variable aleatoria X:= número de errores ortográficos por
texto y el siguiente cuadro muestra la función de probabilidad de X.
x 0 1 2 3 4
f(x) 0,65 0,25 0,05 0,03 0,02
c. Si en las primeras palabras del texto se encontró un error, calcule la probabilidad de que se en-
cuentre un error ortográfico más en ese texto.
Notas
EPE UPC 149
Ejercicio 88
El año pasado Óleo A entró al mercado peruano de envases para aceites comestibles. El jefe de con-
trol de calidad analiza un lote 500 envases y determinó el número de defectos por envase. En la si-
guiente tabla se muestra la distribución de envases según el número de defectos identificados.
Sea la variable aleatoria X:= número defectos por envase para aceite comestible.
a. Construya la función de distribución de probabilidad para la variable aleatoria X.
b. Si se selecciona un envase al azar, calcule la probabilidad de que presente más de un defecto.
c. Calcule e interprete el valor esperado de la variable aleatoria X.
d. Determine el coeficiente de variación de la variable aleatoria X.
e. Calcule la probabilidad de que al seleccionar un envase al azar este presente por lo menos dos
defectos, si se sabe que al menos tiene un defecto por envase.
Solución
a. Construya la función de distribución de probabilidad para la variable aleatoria X.
e. Calcule la probabilidad de que al seleccionar un envase al azar este presente por lo menos dos
defectos, si se sabe que al menos tiene un defecto por envase.
P X 2 f 2 f 3 f 4 0 ,1
P X 2 / X 1 0 ,278
P X 1 f 1 f 2 f 3 f 4 0 ,36
Notas
150 CE104 Estadística
Ejercicio 89
La empresa de muebles A, para garantizar la calidad y el acabado del mobiliario, decidió analizar un
lote de 900 sillas giratorias y registró el número de fallas por silla giratoria. En el siguiente cuadro, se
muestra la distribución de defectos que presenta las sillas giratorias que pasaron por el control de
calidad.
Solución
a. Construya la función de distribución de probabilidad
d. Calcule la probabilidad de que al seleccionar una silla giratoria al azar ésta presente más de tres
defectos, si se sabe que al menos tiene dos defectos por silla.
P X 3 P X 2 P X 4 f 4
P X 3 / X 2
P X 2 P X 2 f 2 f 3 f 4
0,0222
0,0909
0,1778 0,0444 0,0222
Notas
EPE UPC 151
Ejercicio 90
Cerámicas A comercializa las piezas de cerámicas en cajas de 16 unidades. Luego de la venta y de
acuerdo a las devoluciones realizadas por los propios clientes ha podido determinar el número de
cajas devueltas de las últimas 400 cajas vendidas. La información se muestra a continuación.
x 0 1 2 3 4
f(x) = P(X = x) 0,500 0,250 0,125 0,0625 0,0625
Sea la variable aleatoria X:= número de piezas de cerámicas defectuosas por caja de 16 unidades.
Solución
a. Calcule e interprete el valor esperado de la variable aleatoria.
4
E X xf x 0 0 ,5 1 0 ,25 2 0 ,125 3 0 ,625 4 0 ,625 0 ,9375
x 0
c. Calcule la probabilidad de que al seleccionar una caja al azar, ésta contenga más de dos piezas
defectuosas, si se sabe que al menos tiene una pieza defectuosa por caja.
P A B
Usamos la definición de probabilidad condicional, P A B
PB
Notas
152 CE104 Estadística
Ejercicio 91
Los negocios han de tomar en cuenta que abrir un perfil en las redes sociales no significa solamente
hablar de tu empresa, de tus productos o servicios, es vital la elaboración de una estrategia adecuada
a sus necesidades en la que se determine el público al que se quiere alcanzar mediante estos medios.
Sea la variable aleatoria X:= número de veces que actualiza su perfil a la semana, cuya función de
probabilidades es la siguiente.
0.30
6k
0.25
0.2
Probabilidad
0.20 0.16
0.14
0.15 0.12
0.1
0.10
k
0.05
0.00
1 2 3 4 5 6 7
Número de veces que actualiza su perfil
a. Obtenga el valor de k y complete la tabla de distribución de probabilidades.
b. Calcule PX 2 / X 6
c. Se dice que si el coeficiente de variación de la variable aleatoria X es mayor o igual al 15% enton-
ces la distribución de probabilidades es heterogénea. ¿Esta distribución es heterogénea?
d. Si cada actualización del perfil demora 35 minutos, calcule e interprete el tiempo que se espera
dedicar a la actualización del perfil a la semana.
Solución
a. En base a la información mostrada en el gráfico, obtenga el valor de k y complete la tabla de dis-
tribución de probabilidades.
Como es una función de probabilidad, la suma de todas las f(x) debe ser igual a 1, luego k = 0,05.
Por tanto, la tabla de distribución de probabilidades será:
x 1 2 3 4 5 6 7
f(x) 0,04 0,12 0,2 0,24 0,14 0,16 0,10
b. Calcule PX 2 / X 6
P2 X 6 0 ,12 0 ,2 0 ,24 0 ,14 0 ,70
PX 2 / X 6 0 ,9459
PX 6 0 ,74 0 ,74
c. Se dice que si el coeficiente de variación de la variable aleatoria X es mayor o igual al 15% enton-
ces la distribución de probabilidades es heterogénea. ¿Esta distribución es heterogénea?
1,6371
CV 100% 100% 39,98%
4,2
Como el coeficiente de variación es mayor a 15%, diremos que la distribución es heterogénea.
d. Si cada actualización del perfil demora 35 minutos, calcule e interprete el tiempo que se espera
dedicar a la actualización del perfil a la semana.
x 1 2 3 4 5 6 7
Tiempo, en minutos 35 70 105 140 175 210 245
f(x) = P(X = x) 0,04 0,12 0,2 0,24 0,14 0,16 0,1
E T E 35X 35 E X 35 4 ,2 147 minutos
Notas
EPE UPC 153
Distribución binomial
Se dice que la variable aleatoria X sigue una distribución binomial con parámetros n y p y se denota
por X ~ B (n, p)
Características
Es simétrica si p = 0,5. Para valores de p < 0,5 la distribución tiene sesgo derecho y para valores
p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.
Para valores de n suficientemente grandes (n > 50), y sólo tomando en cuenta los valores rele-
vantes de probabilidad, la distribución es prácticamente simétrica.
Notas
154 CE104 Estadística
Ejercicio 92
La probabilidad de obtener éxito en una tienda de jugos por franquicia es igual a 0,4. Una empresaria
está interesada en invertir en cinco de estas tiendas. El éxito de cada negocio se considera indepen-
diente.
a. Calcule la probabilidad que el empresario tenga éxito en una tienda. Defina la variable necesaria
e indique su distribución, parámetros y rango o recorrido.
b. Calcule la probabilidad que el empresario tenga éxito en, como máximo, una tienda.
c. Calcule la probabilidad que el empresario tenga éxito en más de dos tiendas.
d. Determine el valor esperado (media) del número de tiendas con éxito.
e. Calcule la probabilidad que el número de tiendas con éxito sea mayor a su valor esperado.
Solución
a. Calcule la probabilidad que el empresario tenga éxito en una tienda. Defina la variable necesaria
e indique su distribución, parámetros y rango o recorrido.
b. Calcule la probabilidad que el empresario tenga éxito en, como máximo, una tienda.
e. Calcule la probabilidad que el número de tiendas con éxito sea mayor a su valor esperado.
Notas
EPE UPC 155
Ejercicio 93
La empresa A, especialista en proyectos de inversión, tiene en cartera 10 proyectos elaborados y
expeditos para ser sometidos a la evaluación de concursos de licitación pública. Por su experiencia, el
gerente sabe que el 20% de los proyectos ganan la buena pro. En un concurso de licitación pública se
presentan estos diez proyectos e interesa saber la distribución del número de proyectos ganadores.
a. Calcule la probabilidad de que dos proyectos ganen la licitación.
b. Calcule la probabilidad de que por lo menos ocho proyectos ganen la licitación.
c. Calcule la probabilidad de que a lo más cuatro proyectos ganen la licitación.
d. Si en cierto momento ya han ganado más de dos proyectos, calcule la probabilidad de que a lo
más seis proyectos ganen la licitación.
e. Calcule la media y desviación estándar de X.
Solución
Definamos la variable aleatoria X:= número de ……………….………………..………………………………..
Rango o recorrido RX = {………………………………..………………………………………..}
Distribución y parámetros X B (n = …………..……….……., p = ………….…………..……….)
d. Si en cierto momento ya han ganado más de dos proyectos, calcule la probabilidad de que a lo
más seis proyectos ganen la licitación.
Notas
156 CE104 Estadística
Ejercicio 94
En el proceso de control de calidad se analiza 60 envases de los productos de Expórtame. Por investi-
gaciones anteriores se sabe que la probabilidad de que un envase esté en mal estado es de 0,01.
a. Se rechazarán los 60 productos si la probabilidad de seleccionar más de dos envases en mal esta-
do es mayor al 30%, ¿qué decisión se debe de tomar?
Solución
Lo primero es definir la variable que nos permitirá resolver el problema.
Definamos la variable X:= número de envases en mal estado.
El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,…, 60. Enton-
ces, X B(n = 60; p = 0,01)
𝑃(𝑋 > 2) = 1 − 𝑃(𝑋 ≤ 2)
= 1 − 𝐶060 0,010 0,9960 + 𝐶160 0,011 0,9959 +𝐶260 0,012 0,9958 = 0,0224
Como la probabilidad pedida es menor al 30%, entonces los productos no serán rechazados.
Ejercicio 95
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si elegimos al
azar 80 usuarios.
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexio-
nes. Defina la variable, indique su distribución, parámetros y rango.
Solución
Sea X = cantidad de usuarios del Metropolitano que realizan conexiones de rutas en la muestra
X B(n = 80; p = 0,12)
El rango de X es Rx = {0,1,…,80}
b. Sea la variable Y definida como el número de usuarios que realizan conexiones de los 560 mil
usuarios. Calcule el valor esperado y varianza de Y.
Solución
Y B(n = 560 000; p = 0,12)
E(Y) = np = 560 000 x 0,12 = 67 000.
V(Y) = np(1-p) = 59 136
Notas
EPE UPC 157
Distribución de Poisson
El experimento que El número de resultados que ocurre en un intervalo o región de espacio
origina una cualquiera es independiente del número que ocurre en cualquier otro intervalo o
variable aleatoria región del espacio disjunto.
que sigue una
distribución de
Poisson se
denomina proceso La probabilidad de que ocurra un solo resultado durante el intervalo muy corto o
de Poisson y posee región muy pequeña es proporcional a la longitud del intervalo o al tamaño de la
las siguientes región y no depende del número de resultados que ocurren fuera del intervalo o
propiedades: región.
Se dice que la variable aleatoria X sigue una distribución de Poisson con parámetro .
Se denota X ~ P()
Siempre es una distribución sesgada a la derecha. A medida que aumenta y tomando en cuenta
sólo los valores relevantes de probabilidad, la distribución tiende a hacerse simétrica.
El esperado de una variable Poisson es E X
La varianza de una variable Poisson es 2 V X
Por ejemplo, si X ~ P ( = 6)
P(X = 4) = POISSON.DIST(4, 6, 0) = f(4)
P(X ≤ 4) =POISSON.DIST (4, 6, 1) = f(0) + f(1) + f(2) + f(3) + f(4)
P(X > 4) =1 - POISSON.DIST(4, 6, 1) = f(5) + f(6) + f(7) + … = 1 – (f(0) + f(1) + f(2) + f(3) + f(4))
Notas
158 CE104 Estadística
Ejercicio 96
El número de clientes que llega a una agencia del banco A se modela con una variable Poisson con
una media de tres clientes por minuto.
a. Calcule la probabilidad de que, en un minuto, lleguen exactamente cuatro personas.
b. Calcule la probabilidad de que, en un minuto, lleguen a lo más cuatro personas.
c. Calcule la probabilidad de que, en un minuto, lleguen más de cinco personas.
d. Calcule la probabilidad de que en dos minutos lleguen como mínimo dos y como máximo cuatro
personas a la agencia.
e. Calcule la probabilidad de que en tres minutos lleguen como mínimo cinco personas a la agencia.
Solución
a. Calcule la probabilidad de que, en un minuto, lleguen exactamente cuatro personas. Defina la
variable aleatoria, rango y distribución.
d. Calcule la probabilidad de que en dos minutos lleguen como mínimo dos y como máximo cuatro
personas a la agencia.
e. Calcule la probabilidad de que en tres minutos lleguen como mínimo cinco personas a la agencia.
Notas
EPE UPC 159
Ejercicio 97
El número de llamadas que llegan a una central telefónica se modela con una variable Poisson con
una media de 1,2 llamadas por segundo.
a. Calcule la probabilidad de que, en un segundo, llegue exactamente una llamada.
b. Calcule la probabilidad de que, en un segundo, lleguen a lo más dos llamadas.
c. Calcule la probabilidad de que, en un segundo, lleguen más de tres llamadas.
d. Calcule la probabilidad de que, en dos segundos, llegue alguna llamada.
e. Si en los primeros instantes de un segundo llegó una llamada, calcule la probabilidad de que, den-
tro de ese segundo, lleguen una llamada más.
Solución
a. Calcule la probabilidad de que, en un segundo, llegue exactamente una llamada. Defina la varia-
ble aleatoria, rango y distribución.
e. Si en los primeros instantes de un segundo llegó una llamada, calcule la probabilidad de que, den-
tro de ese segundo, lleguen una llamada más.
f.
Notas
160 CE104 Estadística
Ejercicio 98
Entre las 10:00 am. y 11:00 am. en promedio ocho personas hacen uso de un cajero automático,
ubicado al lado de la puerta de entrada de un banco. Asimismo, el número de clientes que ingresan
al banco entre las 10:00 am. y 11:00 am. en promedio es 15 clientes. Considere que el número de
clientes que hacen uso del cajero es independiente del número de clientes que ingresan al banco y
ambos siguen un proceso de Poisson.
a. ¿Cuál es la probabilidad de que más de 8 pero menos de 10 usen el cajero en ese horario?
b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de
tres clientes?
Solución
a. ¿Cuál es la probabilidad de que menos de 10 pero más de 8 usen el cajero en ese horario?
b. ¿Cuál es la probabilidad de que entre las 10:00 am y las 10:30 am, ingresen al banco menos de
tres clientes?
Notas
EPE UPC 161
Distribución normal
Es la distribución más importante de probabilidad para describir una variable aleatoria continua. Esta
tiene una gran variedad de aplicaciones prácticas en las que las variables aleatorias son altura y peso
de personas, puntuaciones de exámenes, mediciones científicas, etc.
La distribución normal fue desarrollada por primera vez por el matemático francés Abraham de Moi-
vre en un artículo del año 1733 y sus resultados fueron ampliados por Laplace (1812). Algunos auto-
res atribuyen un descubrimiento independiente al matemático alemán Gauss.
Función de densidad
2
1 x
1
f x e 2
2
Características
La variable aleatoria X sigue una distribución normal con parámetros: media y varianza 2.
Se denota X N (, 2)
La función de densidad tiene forma de campana y es simétrica, por lo que las medidas de tendencia
central coinciden.
Estandarización
Se toma como referencia una distribución normal estándar ( = 0 y 2 = 1).
Se trabaja con la distancia entre x y en función de la desviación estándar, tal como se muestra.
X
Z
Notas
162 CE104 Estadística
Ejercicio 99
El consumo mensual de energía eléctrica, en kilowatts, de una ciudad tiene distribución normal con
media de 140 KW, con una varianza de 400 KW2.
Solución
La variable en estudio es …...……………………………………………………………………………………………………….……..
P(……….……….……………) = …………………………………………………..
d. Calcule el consumo mínimo de energía eléctrica para pertenecer al 15% de los mayores consumi-
dores.
e. Calcule el consumo máximo de energía eléctrica para pertenecer al 25% de los menores consumi-
dores.
Notas
EPE UPC 163
Ejercicio 100
La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una variable alea-
toria que tiene una distribución normal con una media igual a 460 soles y una desviación estándar
igual a 50 soles.
Solución
La variable en estudio es …...…………………………………………………………………….……..
La distribución de X N( = ……………………… ; 2 = ……………………….)
c. Calcule la probabilidad que el ahorro mensual de un cliente esté entre 460 y 520 soles.
d. Si se sabe que una persona está en el grupo de los que ahorró más de 450, calcule la probabilidad
que su ahorro mensual sea menor a 600 soles.
e. ¿Cuál es el ahorro mínimo para estar en el 10% de los clientes que más ahorran?
f. ¿Cuál es el ahorro máximo para estar en el 25% de los clientes que menos ahorran?
Notas
164 CE104 Estadística
Ejercicio 101
Una máquina que expende bebidas ligeras está regulada de modo que descarga un promedio de 200
ml por vaso. Si la cantidad descargada por esta máquina tiene distribución normal con desviación
estándar 15 ml.
a. ¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?
b. ¿Cuál es la probabilidad que un vaso contenga entre 191 y 209 ml?
c. ¿Cuál es la cantidad máxima descargada por esta máquina en un vaso para poder considerarlo
dentro del grupo del 30% con menores contenidos?
Solución
Sea X:= cantidad descargada por la máquina de bebidas (en ml), entonces:
X ~ N 200 ; 2 152
a. ¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?
P X 224 1 P X 224 =1 - 0,9452 = 0,0548. El 5,48% de los vasos contendrá más de 224 ml.
c. ¿Cuál es la cantidad máxima descargada por esta máquina en un vaso para poder considerarlo
dentro del grupo del 30% con menores contenidos?
Notas
EPE UPC 165
Z -0,09 -0,08 -0,07 -0,06 -0,05 -0,04 -0,03 -0,02 -0,01 -0,00
-3,9 0,000033 0,000034 0,000036 0,000037 0,000039 0,000041 0,000042 0,000044 0,000046 0,000048
-3,8 0,000050 0,000052 0,000054 0,000057 0,000059 0,000062 0,000064 0,000067 0,000069 0,000072
-3,7 0,000075 0,000078 0,000082 0,000085 0,000088 0,000092 0,000096 0,000100 0,000104 0,000108
-3,6 0,000112 0,000117 0,000121 0,000126 0,000131 0,000136 0,000142 0,000147 0,000153 0,000159
-3,5 0,000165 0,000172 0,000178 0,000185 0,000193 0,000200 0,000208 0,000216 0,000224 0,000233
-3,4 0,000242 0,000251 0,000260 0,000270 0,000280 0,000291 0,000302 0,000313 0,000325 0,000337
-3,3 0,000349 0,000362 0,000376 0,000390 0,000404 0,000419 0,000434 0,000450 0,000466 0,000483
-3,2 0,000501 0,000519 0,000538 0,000557 0,000577 0,000598 0,000619 0,000641 0,000664 0,000687
-3,1 0,000711 0,000736 0,000762 0,000789 0,000816 0,000845 0,000874 0,000904 0,000935 0,000968
-3,0 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350
-2,9 0,00139 0,00144 0,00149 0,00154 0,00159 0,00164 0,00169 0,00175 0,00181 0,00187
-2,8 0,00193 0,00199 0,00205 0,00212 0,00219 0,00226 0,00233 0,00240 0,00248 0,00256
-2,7 0,00264 0,00272 0,00280 0,00289 0,00298 0,00307 0,00317 0,00326 0,00336 0,00347
-2,6 0,00357 0,00368 0,00379 0,00391 0,00402 0,00415 0,00427 0,00440 0,00453 0,00466
-2,5 0,00480 0,00494 0,00508 0,00523 0,00539 0,00554 0,00570 0,00587 0,00604 0,00621
-2,4 0,00639 0,00657 0,00676 0,00695 0,00714 0,00734 0,00755 0,00776 0,00798 0,00820
-2,3 0,00842 0,00866 0,00889 0,00914 0,00939 0,00964 0,00990 0,01017 0,01044 0,01072
-2,2 0,01101 0,01130 0,01160 0,01191 0,01222 0,01255 0,01287 0,01321 0,01355 0,01390
-2,1 0,01426 0,01463 0,01500 0,01539 0,01578 0,01618 0,01659 0,01700 0,01743 0,01786
-2,0 0,01831 0,01876 0,01923 0,01970 0,02018 0,02068 0,02118 0,02169 0,02222 0,02275
-1,9 0,02330 0,02385 0,02442 0,02500 0,02559 0,02619 0,02680 0,02743 0,02807 0,02872
-1,8 0,02938 0,03005 0,03074 0,03144 0,03216 0,03288 0,03362 0,03438 0,03515 0,03593
-1,7 0,03673 0,03754 0,03836 0,03920 0,04006 0,04093 0,04182 0,04272 0,04363 0,04457
-1,6 0,04551 0,04648 0,04746 0,04846 0,04947 0,05050 0,05155 0,05262 0,05370 0,05480
-1,5 0,05592 0,05705 0,05821 0,05938 0,06057 0,06178 0,06301 0,06426 0,06552 0,06681
-1,4 0,06811 0,06944 0,07078 0,07215 0,07353 0,07493 0,07636 0,07780 0,07927 0,08076
-1,3 0,08226 0,08379 0,08534 0,08691 0,08851 0,09012 0,09176 0,09342 0,09510 0,09680
-1,2 0,09853 0,10027 0,10204 0,10383 0,10565 0,10749 0,10935 0,11123 0,11314 0,11507
-1,1 0,11702 0,11900 0,12100 0,12302 0,12507 0,12714 0,12924 0,13136 0,13350 0,13567
-1,0 0,13786 0,14007 0,14231 0,14457 0,14686 0,14917 0,15151 0,15386 0,15625 0,15866
-0,9 0,16109 0,16354 0,16602 0,16853 0,17106 0,17361 0,17619 0,17879 0,18141 0,18406
-0,8 0,18673 0,18943 0,19215 0,19489 0,19766 0,20045 0,20327 0,20611 0,20897 0,21186
-0,7 0,21476 0,21770 0,22065 0,22363 0,22663 0,22965 0,23270 0,23576 0,23885 0,24196
-0,6 0,24510 0,24825 0,25143 0,25463 0,25785 0,26109 0,26435 0,26763 0,27093 0,27425
-0,5 0,27760 0,28096 0,28434 0,28774 0,29116 0,29460 0,29806 0,30153 0,30503 0,30854
-0,4 0,31207 0,31561 0,31918 0,32276 0,32636 0,32997 0,33360 0,33724 0,34090 0,34458
-0,3 0,34827 0,35197 0,35569 0,35942 0,36317 0,36693 0,37070 0,37448 0,37828 0,38209
-0,2 0,38591 0,38974 0,39358 0,39743 0,40129 0,40517 0,40905 0,41294 0,41683 0,42074
-0,1 0,42465 0,42858 0,43251 0,43644 0,44038 0,44433 0,44828 0,45224 0,45620 0,46017
-0,0 0,46414 0,46812 0,47210 0,47608 0,48006 0,48405 0,48803 0,49202 0,49601 0,50000
Notas
166 CE104 Estadística
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,50000 0,50399 0,50798 0,51197 0,51595 0,51994 0,52392 0,52790 0,53188 0,53586
0,1 0,53983 0,54380 0,54776 0,55172 0,55567 0,55962 0,56356 0,56749 0,57142 0,57535
0,2 0,57926 0,58317 0,58706 0,59095 0,59483 0,59871 0,60257 0,60642 0,61026 0,61409
0,3 0,61791 0,62172 0,62552 0,62930 0,63307 0,63683 0,64058 0,64431 0,64803 0,65173
0,4 0,65542 0,65910 0,66276 0,66640 0,67003 0,67364 0,67724 0,68082 0,68439 0,68793
0,5 0,69146 0,69497 0,69847 0,70194 0,70540 0,70884 0,71226 0,71566 0,71904 0,72240
0,6 0,72575 0,72907 0,73237 0,73565 0,73891 0,74215 0,74537 0,74857 0,75175 0,75490
0,7 0,75804 0,76115 0,76424 0,76730 0,77035 0,77337 0,77637 0,77935 0,78230 0,78524
0,8 0,78814 0,79103 0,79389 0,79673 0,79955 0,80234 0,80511 0,80785 0,81057 0,81327
0,9 0,81594 0,81859 0,82121 0,82381 0,82639 0,82894 0,83147 0,83398 0,83646 0,83891
1,0 0,84134 0,84375 0,84614 0,84849 0,85083 0,85314 0,85543 0,85769 0,85993 0,86214
1,1 0,86433 0,86650 0,86864 0,87076 0,87286 0,87493 0,87698 0,87900 0,88100 0,88298
1,2 0,88493 0,88686 0,88877 0,89065 0,89251 0,89435 0,89617 0,89796 0,89973 0,90147
1,3 0,90320 0,90490 0,90658 0,90824 0,90988 0,91149 0,91309 0,91466 0,91621 0,91774
1,4 0,91924 0,92073 0,92220 0,92364 0,92507 0,92647 0,92785 0,92922 0,93056 0,93189
1,5 0,93319 0,93448 0,93574 0,93699 0,93822 0,93943 0,94062 0,94179 0,94295 0,94408
1,6 0,94520 0,94630 0,94738 0,94845 0,94950 0,95053 0,95154 0,95254 0,95352 0,95449
1,7 0,95543 0,95637 0,95728 0,95818 0,95907 0,95994 0,96080 0,96164 0,96246 0,96327
1,8 0,96407 0,96485 0,96562 0,96638 0,96712 0,96784 0,96856 0,96926 0,96995 0,97062
1,9 0,97128 0,97193 0,97257 0,97320 0,97381 0,97441 0,97500 0,97558 0,97615 0,97670
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
3,0 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
3,1 0,999032 0,999065 0,999096 0,999126 0,999155 0,999184 0,999211 0,999238 0,999264 0,999289
3,2 0,999313 0,999336 0,999359 0,999381 0,999402 0,999423 0,999443 0,999462 0,999481 0,999499
3,3 0,999517 0,999534 0,999550 0,999566 0,999581 0,999596 0,999610 0,999624 0,999638 0,999651
3,4 0,999663 0,999675 0,999687 0,999698 0,999709 0,999720 0,999730 0,999740 0,999749 0,999758
3,5 0,999767 0,999776 0,999784 0,999792 0,999800 0,999807 0,999815 0,999822 0,999828 0,999835
3,6 0,999841 0,999847 0,999853 0,999858 0,999864 0,999869 0,999874 0,999879 0,999883 0,999888
3,7 0,999892 0,999896 0,999900 0,999904 0,999908 0,999912 0,999915 0,999918 0,999922 0,999925
3,8 0,999928 0,999931 0,999933 0,999936 0,999938 0,999941 0,999943 0,999946 0,999948 0,999950
3,9 0,999952 0,999954 0,999956 0,999958 0,999959 0,999961 0,999963 0,999964 0,999966 0,999967
Notas
EPE UPC 167
Ejercicio 102
Si Z ~ N 0, 2 1 , calcular:
Notas
168 CE104 Estadística
Distribución exponencial
Se dice que una variable aleatoria continua X se distribuye exponencialmente con parámetro si su
función densidad de probabilidad está dada por:
x
1 β donde x0
f( x) e
β
Es una distribución continua de probabilidad que es útil para describir el tiempo necesario para reali-
zar alguna actividad.
Ejercicio 103
El tiempo de duración de cierto componente para computadora se modela con una variable con dis-
tribución exponencial con media de seis años.
a. Calcule la probabilidad que el componente funcione por lo menos cinco años.
b. ¿Cuánto debe ser la duración mínima para considerar este componente para computadora
dentro del grupo del 20% de los más durables?
Solución
a. Calcule la probabilidad que el componente funcione por lo menos
cinco años.
Notas
EPE UPC 169
Ejercicio 104
La vida útil de la batería de iones de litio para un celular se modela con una variable aleatoria con
distribución exponencial, cuya media es tres años.
Calcule la probabilidad de que una batería de ese tipo tenga una vida útil de tres años o menos.
Calcule la probabilidad de que una batería de ese tipo tenga una vida útil de más de dos años.
Si una batería de ese tipo tiene un año funcionando, ¿cuál es la probabilidad de que funcione como
mínimo un año más?
Si se seleccionan al azar y de forma independiente seis de estas baterías, calcule la probabilidad que
en por lo menos cinco de ellas se observe una vida útil mayor a dos años.
Notas
170 CE104 Estadística
Ejercicio 105
El tiempo de duración (en horas) de un dispositivo electrónico es una variable aleatoria que tiene la
siguiente función de densidad:
x
1 50 ,
f x e x0
50
a. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure menos de 60 horas?
b. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure más de 80 horas?
c. ¿Cuánto debe ser la duración mínima para considerar este dispositivo del grupo del 10% de los
más durables?
Solución
Si X = tiempo de duración (en horas) de un dispositivo electrónico, entonces X ~ Exp 50
a. ¿Cuál es la probabilidad que un dispositivo elegido al azar dure menos de 60 horas?
60
Nos piden, P X 60 1 e 50 0 ,6988
c. ¿Cuánto debe ser la duración mínima para considerar este dispositivo del grupo del 10% de los
más durables?
k
Nos piden, hallar k para que PX k 0,9 . P X k 1 e 50 0 ,9 : despejando y tomando lo-
garitmos a ambos lados, se tiene que k = 115,13 horas.
Notas
EPE UPC 171
Ejercicios propuestos
65. El número de minutos necesario para que un obrero procese cierta pieza se modela con una
variable aleatoria X con la siguiente función de probabilidad:
a. Calcule el tiempo medio de procesamiento de una pieza y la varianza. Rpta: 4,6 y 2,04
b. Para cada pieza procesada el obrero gana una cantidad fija de S/.5, pero si utiliza menos de
seis minutos gana S/.1,20 por cada minuto ahorrado. Determinar la media y la varianza de
la variable aleatoria <ganancia obtenida por pieza ensamblada>. Rpta: 6,8 y 2,376
66. La siguiente tabla muestra la distribución de probabilidad de la variable aleatoria X:= número de
papeletas impuestas a un taxista por exceso de velocidad en las zonas restringidas de una ciudad
durante el último año.
X:= número de papeletas 0 1 2 3 4
Probabilidad f(x) 0,40 b 2b 0,07 0,08
a. Determine el valor de b para que f(x) sea función de probabilidad. Rpta: 0,15
b. Calcule la probabilidad que un taxista tenga por lo menos una papeleta pero menos de cua-
tro papeletas por exceso de velocidad. Rpta: 0,52
c. Si el costo de una papeleta por exceso de velocidad es de 430 soles, calcule el valor espera-
do que paga un taxista por este tipo de papeletas durante el último año.
Rpta: 550,40 soles
d. Si a la municipalidad le genera una utilidad por papeleta impuesta por exceso de velocidad
con la siguiente función U(x) 150 x 20x 2 . Obtenga la utilidad que espera tener la municipa-
lidad por taxista. Rpta: 126,80 soles
a. Determine el valor de k para que f(x) sea función de probabilidad Rpta: 0,09
b. Calcule la probabilidad que un estudiante universitario tenga al menos uno pero menos de
cuatro cuentas de correo. Rpta: 0,91
c. Determine e interprete el valor esperado del número de cuentas de correo.
Rpta: 2,37 cuentas
d. Si por cada cuenta de correo le demanda al alumno15 minutos diarios revisar cada cuenta
¿cuántos minutos espera un estudiante dedicar a sus cuentas de correo diariamente?
Rpta: 35,55
68. La solicitud de préstamo que presentan los clientes de un banco puede ser aceptada o negada.
Se desea estudiar la distribución de la cantidad de solicitudes aceptadas. La tabla muestra la dis-
tribución de probabilidad de la variable aleatoria X:= número de solicitudes aceptadas por día.
Notas
172 CE104 Estadística
a. Determine el valor de k para que f(x) sea función de probabilidad. Rpta: 0,20
b. Si se sabe que el gerente puede aceptar al menos una solicitud al día, ¿cuál sería la probabi-
lidad que tenga que aceptar a lo más cuatro solicitudes al día? Rpta: 0,7895
c. Determine e interprete el valor esperado de la variable X. Rpta: 3,05 solicitudes
d. Calcule el coeficiente de variación de X. Rpta: CV(X)= 46,915%
e. Para la revisión de cada solicitud de crédito, el gerente de préstamos demora 30 minutos.
Determine el tiempo esperado que le demanda diariamente este proceso. Rpta: 91,5 min.
69. La gerencia de ventas tiene información sobre el número de bebidas que consumen las mujeres
a la semana. Esta información se muestra en la tabla de distribución de probabilidades:
X: número de bebidas 0 1 2 3 4 5 6 7
f(x) 0,05 k + 0,02 0,13 0,35 5k 0,08 k 0,02
a. ¿Cuál es la probabilidad de que una mujer, elegida al azar, consuma por lo menos tres be-
bidas a la semana? Rpta: 0,75
b. Calcule el coeficiente variación de la variable X. Rpta: 45,55%
c. Si por cada bebida consumida la empresa obtiene una utilidad de 0,65 soles, determine e
interprete el valor esperado de la utilidad para esta semana. Rpta: 2,093 soles
70. La empresa textil A sabe por experiencias previas que el porcentaje de pedidos que cumple con
la entrega en el plazo establecido con sus clientes del exterior es del 92%.
a. Si se eligen al azar cinco pedidos, calcule la probabilidad de tres pedidos se entreguen en el
plazo establecido. Rpta: 0,0498
b. Si se eligen al azar cinco pedidos, calcule la probabilidad de que por lo menos cuatro pedi-
dos no se entreguen en el plazo establecido. Rpta: 0,0002
71. Un fabricante de piezas garantiza que una caja de sus piezas contendrá como máximo un defec-
tuoso. Si la caja contiene 10 piezas, y la experiencia ha demostrado que ese proceso de fabrica-
ción produce 5% de piezas defectuosas, ¿cuál es la probabilidad de que una caja elegida al azar
satisfaga la garantía? Rpta: 0,9139
72. A una garita de peaje, en promedio, llegan 240 autos por hora según un proceso de Poisson. El
administrador de la garita ordena atender inicialmente con una caseta, pero si en el lapso de
dos minutos llegan como mínimo 10 autos (considera que se produce una congestión), entonces
ordena inmediatamente atender en otra caseta más hasta que se produzca el descongestiona-
miento. Calcule la probabilidad que se tenga que atender en otra caseta. Rpta: 0,2834
73. La llegada de reclamos a una oficina reguladora sigue un proceso Poisson con media de dos re-
clamos cada cuatro minutos.
a. Calcule la probabilidad que en un minuto se reciba dos reclamos. Rpta: 0,0758
b. Determine la probabilidad que en 10 minutos se presenten por lo menos dos reclamos.
Rpta: 0,9596
c. Calcule la probabilidad de que en una hora se reciba exactamente 28 reclamos.
Rpta: 0,0702
74. Al pintar planchas de acero con cierto tipo de pintura ocurren pequeños defectos que se distri-
buyen aleatoriamente en la superficie según una distribución de Poisson con un promedio de
2,5 defectos por cada 100 cm2. Calcule la probabilidad de que presente por lo menos dos defec-
tos en una plancha de acero de 20 cm2. Rpta: 0,0902
75. Un equipo de fútbol ha ganado diecisiete partidos de los veinte disputados durante la tempora-
da. En la liga de ascenso se necesitan ganar al menos tres partidos, de cinco que se disputan, pa-
ra subir de categoría. Calcula la probabilidad de que dicho equipo consiga competir en una cate-
goría superior. Rpta: 0,9734
Notas
EPE UPC 173
76. La probabilidad de éxito de una determinada vacuna es 0,92. Calcula la probabilidad de que una
vez administrada a 15 pacientes:
a. Ninguno sufra la enfermedad. Rpta: 0,2863
b. Todos sufran la enfermedad. Rpta: 3,51844 E-17
c. Dos de ellos contraigan la enfermedad. Rpta: 0,3403
77. Un examen tipo test consta de 10 preguntas, cada una con cuatro respuestas, de las cuales sólo
una es correcta. Si un alumno contesta al azar:
a. ¿Cuál es la probabilidad de que conteste bien cuatro preguntas? Rpta: 0,1460
b. Calcule la probabilidad de que conteste correctamente más de dos preguntas. Rpta: 0,4744
c. Calcule la probabilidad de que conteste mal a todas las preguntas. Rpta: 0,0563
78. En la realización de un programa, el número de errores cometidos por página se modela con una
distribución de Poisson de varianza igual a 2. ¿Cuál sería la probabilidad de no cometerlos en un
programa de 20 páginas? Rpta: 4,2484 E-18
79. Un estacionamiento tiene dos entradas. Los autos llegan a la entrada I según una distribución
Poisson con tres autos por hora y a la entrada II con cuatro autos por hora. Si el número de au-
tos que llega a cada entrada son independientes, ¿cuál es la probabilidad de que en una hora
lleguen 3 autos al estacionamiento? Rpta: 0,0575
80. Se ha determinado que los depósitos bancarios del banco A tienen distribución normal con me-
dia de 3000 dólares y varianza 3240000 dólares2 por mes. Se elige un depósito al azar.
a. Determine la probabilidad de que dicho depósito exceda los 3500 dólares.
Rpta: 0,3906
b. Si el depósito bancario elegido excede los 3500 dólares, determine la probabilidad de que
dicho depósito sea menor a los 4000 dólares. Rpta: 0,2594
81. Una máquina llena recipientes con determinado producto. Se sabe que la media y desviación
estándar para los pesos de llenado, de acuerdo con datos históricos, son 18,123 onzas y 0,6 on-
zas. El peso de llenado se modelo mediante una variable aleatoria normal.
a. Si se selecciona un recipiente al azar, ¿cuál es la probabilidad que su peso sea mayor a 16
onzas pero menor o igual que 20 onzas? Rpta: 0,9989
b. ¿Cuál es el peso máximo de un recipiente para estar considerado dentro del 25% de los re-
cipientes menos pesados? Rpta: 17,72 onzas
82. El salario semanal que percibe un trabajador de una empresa dedicada a la construcción civil se
distribuye normalmente con una media de 900 soles y desviación estándar de 100 soles.
a. ¿Cuál es la probabilidad de que un trabajador elegido al azar tenga un salario semanal menor
de 910 soles? Rpta: 0,5398
b. El 10% de los trabajadores de esta empresa son jefes de cuadrillas y son los mejores pagados.
¿Cuál es salario mínimo de un jefe de cuadrilla? Rpta: 1028,16 soles
83. Perubank, es una institución bancaria que proporciona una amplia gama de servicios financie-
ros, que comprende todo tipo de depósitos, prestamos, hipotecas, seguros, entre otros servicios
de inversión, todos dentro del marco de una estrategia única. Se ha determinado que un cliente
de Perubank con una buena historia crediticia tiene una deuda que se distribuye normalmente
con promedio de 15015 soles y una desviación estándar de 3540 soles.
a. Si se selecciona a un cliente con buena historia crediticia, ¿cuál es la probabilidad de que el
monto de su deuda se encuentre entre 12000 y 18000 soles? Rpta: 0,6033
b. La gerencia de Perubank ha determinado amonestar a los clientes que hayan alcanzado
deudas muy altas al final del mes. Determine el valor de la deuda mínima a partir del cual
se amoneste al 11% de los clientes con deudas muy altas. Rpta: 19357
Notas
174 CE104 Estadística
84. Suponga que el tiempo utilizado en revisar sugerencias y comentarios de los clientes tiene dis-
tribución normal con media de 8,5 horas y una desviación estándar de 2,5 horas.
a. Calcule la probabilidad de que el tiempo sea mayor a 7,5 horas Rpta: 0,65542
b. Determine el tiempo mínimo que emplea un ejecutivo para atender al 15,38% de los clientes
que tienen muchas dudas, lo que implica que dedican más tiempo en consultas.
Rpta: 11,05 minutos
85. Las notas de los 200 alumnos del curso de Estadística de la universidad A se modelan con una
distribución normal con una media de 13 y una varianza igual a 4.
a. Calcule la probabilidad de que un alumno tenga menos de 14. Rpta: 0,6915
b. Calcule la probabilidad de que a lo más tenga 11. Rpta: 0,1587
c. Calcule la probabilidad de que consiga por lo menos 15. Rpta: 0,1587
d. Calcule la probabilidad de que tenga menos de 11 o más de 15. Rpta: 0,3173
e. Calcule la probabilidad de que tenga entre 7 y 14. Rpta: 0,6901
f. ¿Cuántos alumnos se espera que tengan entre 8 y 12? Rpta: 64,5
86. El tiempo necesario para que una ambulancia llegue a un centro deportivo se distribuye nor-
malmente con una media de 17 minutos y desviación estándar de tres minutos.
a. Calcule la probabilidad que el tiempo de llegada esté comprendido entre 13 y 21 minutos.
Rpta: 0,8176
b. ¿Para qué valor t, la probabilidad de que la ambulancia emplee más de t minutos en llegar
es el 5 %? Rpta: 21,9345
87. Una compañía telefónica ha determinado que el tiempo total de duración de las llamadas rea-
lizadas mensualmente por sus clientes menores de 35 años, medidos en minutos, sigue una
distribución normal de media 100 y desviación estándar 25.
a. Calcula la probabilidad de que un cliente facture menos de dos horas en llamadas.
Rpta: 0,7881
b. ¿Cuál es la probabilidad de que un cliente facture entre 80 y 110 minutos?
Rpta: 0,4436
c. La empresa decide iniciar una campaña para premiar a aquellos clientes que acumulen en
llamadas más del doble de los minutos esperados. ¿Qué porcentaje de los usuarios se bene-
ficiarán en dicha campaña? Rpta: 0,003%
d. Para los clientes que facturan poco, se piensa en incentivarlos con un sistema de retribu-
ciones. Si se quiere incluir en ese programa al 1% de los clientes, ¿cuál es la duración total
en minutos que debe acumular como máximo un cliente para ser incluido en la promoción?
Rpta: 41,8413
88. La distribución de la demanda (en número de unidades por unidad de tiempo) de un producto
a menudo puede aproximarse con una distribución de probabilidad Normal. Por ejemplo, una
compañía de comunicación por cable ha determinado que el número de interruptores termi-
nales de botón solicitados diariamente tiene una distribución Normal, con una media de 200 y
una desviación estándar de 50.
a. ¿En qué porcentaje de los días la demanda será de menos de 90 interruptores?
Rpta: 1,39%
b. ¿En qué porcentaje de los días la demanda estará entre 225 y 275 interruptores?
Rpta: 24,173%
c. La compañía ha determinado que su mejor estrategia consiste en producir una cantidad de
interruptores suficiente para atender plenamente la demanda en 94% de todos los días.
¿Cuantos interruptores terminales deberá producir la compañía cada día?
Rpta: 278
Notas
EPE UPC 175
89. La duración (en minutos) de una conversación telefónica de larga distancia nacional tiene dis-
tribución exponencial con promedio ocho minutos.
a. ¿Cuál es la probabilidad que una llamada dure entre tres y diez minutos? Rpta: 0,4008
b. ¿Cuál es la probabilidad que una llamada dure más de nueve minutos? Rpta: 0,3247
c. ¿Cuánto debe durar como mínimo una llamada para estar considerada dentro del 10% de
las de mayor duración? Rpta: 18,4207
d. Si ya pasaron cinco minutos, ¿cuál es la probabilidad de que la llamada dure al menos cua-
tro minutos más? Rpta: 0,6065
90. El tiempo entre dos pedidos consecutivos tiene distribución exponencial con media 20 segun-
dos.
a. ¿Cuál es la probabilidad de que el tiempo entre dos pedidos consecutivos sea como máxi-
mo 20 segundos? Rpta: 0,6321
b. Si del último pedido ya pasaron 15 segundos, calcule la probabilidad de que el siguiente pe-
dido demore al menos otros cinco segundos más. Rpta: 0,7788
91. La duración (en minutos) de una conversación telefónica de larga distancia nacional tiene dis-
tribución exponencial con una media de 5 minutos.
a. Calcule la probabilidad de que una llamada dure entre cuatro y diez minutos. Rpta: 0,3140
b. Si ya pasaron 4 minutos, ¿cuál es la probabilidad de que la llamada dure por lo menos cinco
minutos más? Rpta: 0,3679
92. En un proceso fotográfico, el tiempo de revelado de las impresiones de las fotos puede consi-
derarse una variable aleatoria con distribución normal con media 16,28 segundos y desviación
estándar de 0,12 segundos. Si se elige una impresión al azar:
a. Calcule la probabilidad de que el tiempo de revelado sea menor de 16,55 segundos.
Rpta: 0,9878
b. Calcule la probabilidad de que el tiempo de revelado sea menor de 15,96 segundos.
Rpta: 0,0038
c. Calcule la probabilidad de que el tiempo de revelado sea mayor de 16 segundos.
Rpta: 0,9902
d. Calcule la probabilidad de que el tiempo de revelado sea mayor de 16,12 segundos.
Rpta: 0,9088
e. Calcule la probabilidad de que el tiempo de revelado se encuentre comprendido entre
15,96 y 16,55 segundos. Rpta: 0,9839
f. Calcule el tiempo máximo de impresión para ser considerada en el grupo del 10% con los
menores tiempos de revelados. Rpta: 16,1262
Notas
176 CE104 Estadística
Hipótesis estadística
Es una afirmación que se hace acerca de la distribución o parámetros de una o más poblaciones.
Por ejemplo:
El ingreso mensual medio de una familia es de 1920 soles, es decir, µ = 1920.
El porcentaje de artículos defectuosos producidos en una fábrica por una máquina es menor al
2%, es decir, p < 0,02.
Hipótesis a establecer
El hecho de no rechazar la hipótesis nula no implica que ésta sea cierta. Significa simplemente que
los datos de la muestra son insuficientes para inducir un rechazo de la hipótesis nula.
Ejercicio 106
H………...: Tomar una siesta de 20 a 30 minutos después del almuerzo, mejora el rendimiento
de los trabajadores, aumenta la productividad y el desarrollo de la creatividad.
H……..….: Tomar una siesta de 20 a 30 minutos después del almuerzo, no mejora el rendimien-
to de los trabajadores, aumenta la productividad y el desarrollo de la creatividad.
Notas
EPE UPC 177
Ejercicio 107
Defina los parámetros de interés y las hipótesis nula y alterna a partir de las siguientes situaciones.
a. Se desea probar que el gasto medio diario de un alumno de EPE en la cafetería es menor a siete
soles.
b. Se desea probar que el porcentaje de personas que están a favor de que el presidente Kuczynski
otorgue un indulto humanitario al expresidente Alberto Fujimori es mayor al 50%.
c. Se desea probar que el sueldo medio de los hombres en Lima es mayor al sueldo medio de las
mujeres en Lima.
d. Se desea probar que los sueldos de hombres y los sueldos de las mujeres en Lima tienen varian-
zas diferentes.
Solución
a. Se desea probar que el gasto medio diario de un alumno de EPE en la cafetería es menor a siete
soles.
Parámetro: ……………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………
b. Se desea probar que el porcentaje de personas que están a favor de que el presidente Kuczynski
otorgue un indulto humanitario al expresidente Alberto Fujimori es mayor al 50%.
Parámetro: …………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………
c. Se desea probar que el sueldo medio de los hombres en Lima es mayor al sueldo medio de las
mujeres en Lima.
Parámetro 1: …..……………………………………………………………………………………………………………………………
Parámetro2: .…………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………
d. Se desea probar que los sueldos de hombres y los sueldos de las mujeres en Lima tienen varian-
zas diferentes.
Parámetro 1: …..……………………………………………………………………………………………………………………………
Parámetro2: .…………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………
Notas
178 CE104 Estadística
Tipos de errores
Cuando usamos los datos de una muestra para tomar decisiones acerca de un parámetro existe el
riesgo de llegar a una conclusión incorrecta. De hecho, se pueden presentar dos tipos diferentes de
error cuando se aplica la metodología de la prueba de hipótesis.
Decisión estadística
Situación
No rechazar H0 Rechazar H0
H0 verdadera No hay error Error tipo I ()
H0 falsa Error tipo II () No hay error
Error tipo I
Ocurre cuando se rechaza la hipótesis H0 que es verdadera.
A la probabilidad de cometer un error de tipo I se le conoce como nivel de significación o significa-
ción y es denotada por . Es fijado por la persona que realiza la investigación, por lo general, en 5% y
es el valor que ese usará si algún ejercicio de este curso no menciona el nivel de significación.
Error tipo II
Ocurre cuando no se rechaza la hipótesis H0 que es falsa. La probabilidad de cometer un error de tipo
II es denotada por .
Ejercicio 108
Se desea probar que poner un aditivo a un tipo de gasolina aumenta el rendimiento medio por galón,
que es de 43 kilómetros por galón. Indique el parámetro de interés, las hipótesis nula y alterna, los
errores tipo I y II y las consecuencias de cometer cada error.
Parámetro: ……………………………………………………………………………………………………………………………………
H0: ……………………………………………………………………………………………………………………………………
H1: ……………………………………………………………………………………………………………………………………
Consecuencia ……………………………………………………………………………………………………………………………………
del error tipo I: ……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
Consecuencia ……………………………………………………………………………………………………………………………………
del error tipo II: ……………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………
Notas
EPE UPC 179
Pasos Ejemplo
1. hipótesis alterna
H1: μ > 10
2. significación.
Notas
180 CE104 Estadística
Para calcular los valores críticos en Excel, use la función =INV.T (área a la izquierda, n -1)
Notas
EPE UPC 181
Ejercicio 109
El jefe de control de calidad la empresa Cereales A desea determinar si la máquina con la que embol-
san un cereal pone, en promedio, mayor cantidad de los 500 gramos que dice la etiqueta. Para ello,
tomó una muestra aleatoria de 60 bolsas y encontró una media muestral de 503,5 gramos y una des-
viación estándar muestral de 4,3 gramos. Si el jefe de control de calidad usa un nivel de significancia
del 5%, ¿a qué conclusión llegará?
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….
………………………
Para calcular el valor crítico en Excel, usamos la función =INV.T(……………, …………..) = …………………………
Con un 5% de nivel de significancia, …………….. (sí o no) existe evidencia estadística para afirmar que
…..……………………………………………………………………………………………………………………………………………………….
…..……………………………………………………………………………………………………………………………………………………….
Notas
182 CE104 Estadística
Ejercicio 110
Según la empresa A, exportadora de productos agrícolas, la media del peso de sus manzanas es 200
gramos. Para contrastar dicha afirmación, se tomó una muestra aleatoria de 30 manzanas. Los datos
de la muestra se muestran a continuación.
204 201 198 195 197 198 189 205 207 199
195 197 192 197 196 203 195 210 197 197
210 190 207 202 185 203 198 194 196 193
A un nivel de significancia del 5%, ¿los datos confirman la afirmación de la empresa? Asuma que el
peso de las manzanas es una variable aleatoria normal.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación
= …………………….
Paso 3: Elegir y calcular el estadístico de prueba
La media muestral es 198,333 y la desviación estándar muestral es 5,985.
Notas
EPE UPC 183
Ejercicio 111
Por datos históricos se sabe que la media de la edad de los huéspedes del hotel A es 36 años. La ge-
rencia cree que la media de la edad de sus huéspedes ha aumentado; para esto se seleccionó al azar
una muestra aleatoria de 20 pasajeros. Las edades de los huéspedes en la muestra se presentan en la
siguiente tabla.
41 43 36 17 62 50 48 39 44 32
45 46 22 48 40 37 25 28 64 25
Con la información presentada y usando un nivel de significación del 4%, contraste la hipótesis de la
gerencia. Asuma que la edad sigue una distribución normal.
Solución
La unidad elemental es un huésped del hotel A
La variable en estudio es la edad del huésped.
El parámetro de interés es la media poblacional de la edad de los huéspedes (μ)
1,8495
Con un 4% de significancia, no existe evidencia estadística para afirmar que la edad promedio de los
huéspedes del hotel sea mayor de 36 años.
Notas
184 CE104 Estadística
Ejercicio 112
INDECOPI ha recibido la queja de un grupo de personas que compraron tetra pack de leche de un
litro de la empresa A indicando que este producto tiene menor contenido al establecido. De ser cier-
tas esas quejas, la empresa recibiría una multa. Para corroborar ello, la persona encargada de realizar
la sanción a la empresa A, seleccionó ocho tetra packs y midió su contenido. Con los datos y un nivel
de significación de 1%, ¿cuál será la decisión de la persona encargada por INDECOPI? Asuma que el
contenido de los tetra packs de leche se distribuye normalmente.
Solución
La unidad elemental es un tetra pack de leche de un litro de la empresa A
La variable en estudio es el contenido de un tetra pack de leche de la empresa A
El parámetro de interés es la media poblacional del contenido de leche por tetra pack (μ)
X 0 0,897 1
TC 3,0894
S 0,0943
n 8
Paso 4: Especificar los supuestos para la validez de la prueba
La muestra es aleatoria.
La muestra proviene de una distribución normal.
Paso 5. Establecer los valores críticos para la región de rechazo
-2,9980
Con un 1% de significancia, existe evidencia estadística para afirmar que el contenido medio de los
tetra packs es menor a un litro, es decir la empresa A debe ser sancionada por INDECOPI.
Notas
EPE UPC 185
Ejercicio 113
El gerente del Banco A plantea que uno de los factores de morosidad en la sucursal del centro de
Lima se debe a que la edad promedio de los clientes del banco, en esta zona, es inferior a 33 años,
por lo que debería declarárseles como clientes de alto riesgo. Realice la prueba de hipótesis adecua-
da para responder a lo siguiente: ¿debe declararse a los clientes de la sucursal Centro de Lima, clien-
tes de alto riesgo”? Use un nivel de significación del 3%. Los datos se muestran a continuación:
34 39 27 36 36 29 32 29 40 36 40 36 27 27 38
29 31 40 35 39 33 27 27 31 35 28 27 29 26 40
Solución
La unidad elemental es un cliente de la sucursal Centro de Lima
La variable en estudio es edad de un cliente de la sucursal Centro de Lima
El parámetro de interés es la media poblacional de edad de los clientes de la sucursal Centro de Lima
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µ ≥ 33
H1: µ < 33
Paso 2: Determinar el nivel de significación
= 0,03
Paso 3: Elegir y calcular el estadístico de prueba
X 0 32,7667 33
TC 0,2602
S 4 ,9108
n 30
Paso 4: Especificar los supuestos para la validez de la prueba
La muestra es aleatoria.
La muestra proviene de una distribución normal.
Paso 5. Establecer los valores críticos para la región de rechazo
-1,9573
Con un 3% de significancia, no existe evidencia estadística para afirmar que la edad promedio de los
clientes de la sucursal Centro de Lima es inferior a 33 años. Por lo tanto, no debería declararse a los
clientes como de alto riesgo.
Notas
186 CE104 Estadística
P̂ p0
Z N(0,1)
p0 1 p0
n
P̂ : proporción muestral
p0 : valor supuesto de la media poblacional en la hipótesis nula
Z : distribución normal estándar
α : nivel de significación de la prueba
Para calcular los valores críticos en Excel, use la función =INV.NORM.ESTAND(área a la izquierda)
Notas
EPE UPC 187
Ejercicio 114
La aprobación de la gestión de un presidente de un país que lleva casi un año de gobierno es del 40%.
Un analista político, luego de destaparse recientes casos de corrupción e interpelaciones, afirma que
dicha aprobación ha bajado. Para probar dicha afirmación, se tomó una encuesta de 1240, encon-
trándose que 485 personas aprueban la gestión presidencial. Use un nivel de significancia del 5%,
para contrastar la opinión del analista.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….
………………
Con un nivel de significancia del 5%, …………….. (sí o no) existe evidencia estadística para afirmar que
…..……………………………………………………………………………………………………………………………………………………….
…..……………………………………………………………………………………………………………………………………………………….
Notas
188 CE104 Estadística
Ejercicio 115
El porcentaje de aceptación de cierta marca de detergente es 20%, se realiza una intensa campaña
de publicidad por radio y televisión. Luego de esta campaña, se evaluó si hubo un cambio en la acep-
tación. Para esto se seleccionó una muestra aleatoria de 450 consumidores de detergente y se en-
contró que 105 usaban el detergente en mención. Usando un nivel de significancia del 1%, ¿cuál es la
conclusión?
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
El parámetro de interés es ………………………………………………………………………………….…………………………….
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación
= …………………….
Paso 3: Elegir y calcular el estadístico de prueba
Notas
EPE UPC 189
Ejercicio 116
En la dirección de correos se implementaron nuevos procedimientos para reducir el porcentaje de
cartas extraviadas. Anteriormente, el porcentaje de cartas extraviadas era del 0,3 %. Recientemente
en una investigación en la que 8 000 cartas fueron enviadas se extraviaron 18 cartas. Al nivel de signi-
ficación del 10%, ¿se puede aceptar que los nuevos procedimientos consiguieron su objetivo?
Solución
La unidad elemental es una carta enviada
La variable en estudio es condición de la carta (extraviada o no extraviada)
El parámetro de interés es proporción de cartas extraviadas
-1,28
Notas
190 CE104 Estadística
S12
F Fn1 1 ,n2 1
S22
En donde:
n1 : tamaño de muestra proveniente de la población 1
n2 : tamaño de muestra proveniente de la población 2
S12
: varianza de la muestra de la población 1
S22
: varianza de la muestra de la población 2
F : distribución F con n1 – 1 y n2 – 1 grados de libertad
α : nivel de significación de la prueba
Se rechaza Ho si el valor calculado del estadístico de prueba cae en la zona de rechazo. El valor crítico
divide la gráfica en zona de rechazo y no rechazo.
Para calcular los valores críticos en Excel, use la función =INV.F(área a la izquierda, n1 - 1, n2 - 1)
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.
Notas
EPE UPC 191
Ejercicio 117
Se quiere probar si las varianzas reales de los sueldos de hombres y mujeres en Lima son iguales.
Para ello se ha tomado una muestra aleatoria de 120 hombres y 150 mujeres, encontrándose una
desviación estándar muestral de los sueldos de los hombres de 840 soles y una desviación estándar
muestral de los sueldos de las mujeres de 723 soles. Contraste dicha hipótesis, usando un nivel de
significancia del 5%.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación
= …………………….
Paso 3: Elegir y calcular el estadístico de prueba
Notas
192 CE104 Estadística
Ejercicio 118
El gerente del hotel A desea conocer los perfiles de los huéspedes que se encuentran en el hotel.
Para esto, se seleccionaron al azar una muestra aleatoria e independiente del registro del hotel, al-
gunas de las características que desea conocer se muestran en la siguiente tabla:
Edad 41 43 36 17 62 50 48 39 44 32
Sexo Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre
Edad 45 46 22 48 40 37 25 28 64 25
Sexo Hombre Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Mujer
Con la información presentada, responda lo siguiente: ¿Las edades de los huéspedes por género pre-
sentan la misma variabilidad? Use un nivel de significación del 3%.
Solución
La unidad elemental es un huésped del hotel A
La variable en estudio es edad de un huésped.
Los parámetros de interés son las varianzas poblacionales de las edades de cada sexo.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0 : 12 = 22 (Varianzas homogéneas)
H1: 12 ≠ 22 (Varianzas heterogéneas)
Paso 2: Determinar el nivel de significación
= 0,03
Paso 3: Elegir y calcular el estadístico de prueba
S12 196,7636
FC 1 ,7396
S22 113,1111
0,2223 5,1005
El valor crítico F1 se calcula usando la función de Excel = INV.F(0.015,10,8) = 0,2223
El valor crítico F2 se calcula usando la función de Excel = INV.F(0.985,10,8) = 5,1005
Notas
EPE UPC 193
T
X1 X2 0 tn n 2
1 2
Sp2 Sp2
n1 n2
SP2
n1 1S12 n2 1S22
n1 n2 2
X1 y X 2 : medias muestrales de la población 1 y 2, respectivamente.
S12 y S22 : varianzas muestrales de la población 1 y 2, respectivamente.
SP2 : varianza muestral ponderada
n1 : tamaño de muestra proveniente de la población 1
n2 : tamaño de muestra proveniente de la población 2
tn1 n2 2 : distribución t de Student con n1 + n2 – 2 grados de libertad.
α : nivel de significación de la prueba
μ0 : diferencia hipotética entre las medias poblacionales
Paso 4: Especificar los supuestos para la validez de la prueba
Las muestras son aleatorias y provienen de distribuciones normales.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo
El valor crítico divide la gráfica en zona de rechazo y no rechazo.
La región de rechazo está representada por la zona sombreada.
Notas
194 CE104 Estadística
Ejercicio 119
Se piensa que, para acelerar el pago de cuentas atrasadas, una llamada telefónica es más efectiva
que una carta. Se contactaron dos grupos con cuentas atrasadas y se registró el tiempo, en días, en-
tre el envío de la carta o la llamada y el pago. ¿Se pude concluir que las cuentas atrasadas son paga-
das, en promedio, más rápido con una llamada que con una carta? Use α=5%. Asuma varianzas ho-
mogéneas. Se muestra los resultados de las muestras.
Prueba t para dos muestras suponiendo varianzas iguales
Llamada telefónica Envío de carta
Media 4,4350 5,9473
Varianza 2,6135 2,5667
Observaciones 120 100
Varianza agrupada 2,5922
Diferencia hipotética de las medias 0
Grados de libertad 218
Estadístico t -6,9372
P(T<=t) una cola 0,0000
Valor crítico de t (una cola) 1,6519
P(T<=t) dos colas 0,0000
Valor crítico de t (dos colas) 1,9709
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación = …………………….
Paso 3: Elegir y calcular el estadístico de prueba
Notas
EPE UPC 195
Ejercicio 120
El gerente del hotel A desea conocer los perfiles de los huéspedes que se encuentran en el hotel.
Para esto, se seleccionaron al azar una muestra aleatoria e independiente del registro del hotel, al-
gunas de las características que desea conocer se muestran en la siguiente tabla:
Edad 41 43 36 17 62 50 48 39 44 32
Sexo Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre
Edad 45 46 22 48 40 37 25 28 64 25
Sexo Hombre Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Mujer
Con la información presentada, responda lo siguiente: ¿La media de la edad de los huéspedes hom-
bres es mayor que la media de la edad de las mujeres? Use un nivel de significación del 3%. Asuma
varianzas homogéneas.
Solución
La unidad elemental es un huésped del hotel A. La variable en estudio es edad de un huésped.
Los parámetros de interés son las medias poblacionales de las edades de cada sexo, μ1 para los hom-
bres y μ2 para las mujeres.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µ1 ≤ µ2
H1: µ1 > µ2
Paso 2: Determinar el nivel de significación
= 0,03
Paso 3: Elegir y calcular el estadístico de prueba
Como las varianzas se consideran iguales, de un ejercicio anterior, usamos este estadístico.
SP2
11 1 196,7636 9 1 113,1111 159,5847
11 9 2
TC
40,8182 38,1111 0 0 ,4768
159,5847 159,5847
11 9
Paso 4: Especificar los supuestos para la validez de la prueba
Las muestras son aleatorias y provienen de distribuciones normales.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo
2,0071
El valor crítico se calcula usando la función de Excel =INV.T(0,97;11+9 - 2) = 2,0071
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Como Tc = 0,4768 < t = 2,0071, entonces, no se rechaza H0. Con un 3% de significancia, no existe evi-
dencia estadística para afirmar que la media de la edad de los huéspedes hombres es mayor a la me-
dia de la edad de las mujeres.
Notas
196 CE104 Estadística
X1 X 2 0 t v
S12
n1
S22
n2
2
T v S12
2
S22
2
S12 S22
n n
1 2
n1 n2 n1 1
n2 1
Notas
EPE UPC 197
Ejercicio 121
Una compañía quiere reducir el tiempo de secado de una pintura. Se pintaron placas con dos fórmu-
las de pintura: la fórmula 1 con contenido químico estándar y la fórmula 2 con un nuevo ingrediente
secante que debe reducir el tiempo de secado. ¿A qué conclusión se puede llegar sobre la eficacia del
nuevo ingrediente? Use α = 0,01. Asuma varianzas desiguales. Los datos se muestran a continuación.
Prueba t para dos muestras suponiendo varianzas desiguales
Fórmula 1 Fórmula 2
Media 115,5058 103,9342
Varianza 34,5993 263,2995
Observaciones 50 70
Diferencia hipotética de las medias 0
Grados de libertad 92
Estadístico t 5,4834
P(T<=t) una cola 0,0000
Valor crítico de t (una cola) 2,3676
P(T<=t) dos colas 0,0000
Valor crítico de t (dos colas) 2,6303
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación = …………………….
Paso 3: Elegir y calcular el estadístico de prueba
Notas
198 CE104 Estadística
Ejercicio 122
El gerente del hotel A desea conocer los perfiles de los huéspedes que se encuentran en el hotel.
Para esto, se seleccionaron al azar una muestra aleatoria e independiente del registro del hotel, al-
gunas de las características que desea conocer se muestran en la siguiente tabla:
Edad 41 43 36 17 62 50 48 39 44 32
Sexo Hombre Mujer Hombre Mujer Hombre Hombre Mujer Mujer Hombre Hombre
Edad 45 46 22 48 40 37 25 28 64 25
Sexo Hombre Mujer Hombre Mujer Mujer Mujer Hombre Hombre Hombre Mujer
Con la información presentada y considerando que las varianzas de las edades de cada grupo son
diferentes entre sí, responda lo siguiente: ¿La media de la edad de los huéspedes hombres es mayor
que la media de la edad de las mujeres? Use un nivel de significación del 3%.
Solución
La unidad elemental es un huésped del hotel A
La variable en estudio es edad de un huésped.
Los parámetros de interés son las medias poblacionales de las edades de cada sexo, μ1 para los hom-
bres y μ2 para las mujeres.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µ1 ≤ µ2
H1: µ1 > µ2
Paso 2: Determinar el nivel de significación
= 0,03
Paso 3: Elegir y calcular el estadístico de prueba
Como las varianzas se consideran iguales, de un ejercicio anterior, usamos este estadístico.
40,8182 38,1111 0 v
196,7636
11 113,91111
2
18
TC 0,4905 2
196,7636 113,1111
2
196,7636 113,11111
11
9
11 9 111 9 1
2,0071
El valor crítico se calcula usando la función de Excel =INV.T(0,97; 18) = 2,0071
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Como Tc = 0,4905 < t = 2,0071; entonces, no se rechaza H0. Con un 3% de significancia, no existe evi-
dencia estadística para afirmar que la media de la edad de los huéspedes hombres es mayor a la me-
dia de la edad de las mujeres.
Notas
EPE UPC 199
H0 : 𝜇𝑑 ≥ 0 H0 : 𝜇𝑑 = 0 H0 : 𝜇𝑑 ≤ 0
H1 : 𝜇𝑑 < 0 H1 : 𝜇𝑑 ≠ 0 H1 : 𝜇𝑑 > 0
Notas
200 CE104 Estadística
Ejercicio 123
Un analista de sistemas quiere usar un nuevo sistema de cómputo, y decide que cambiará de sistema
si tiene evidencia de que el nuevo sistema utiliza menos tiempo de procesamiento. Para esto tomó
de siete trabajadores elegidos al azar, los que realizaron un trabajo usando el nuevo sistema y el sis-
tema antiguo. Si α = 5%, ¿qué se decide al respecto? Los tiempos, en minutos, son los siguientes.
Trabajadores 1 2 3 4 5 6 7
Con sistema antiguo 8 4 10 9 8 7 12
Con sistema nuevo 6 3 7 9 5 8 9
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación = …………………….
Paso 3: Elegir y calcular el estadístico de prueba
Notas
EPE UPC 201
Ejercicio 124
El gerente de una gasolinera cree que el nuevo aditivo A+ en la gasolina disminuye su consumo. Para
corroborar esto el jefe de mantenimiento de la gasolinera toma una muestra de seis autos en los
cuales evalúa el consumo de gasolina en los autos, antes y después de añadir el nuevo aditivo, en el
mismo tramo de carretera, estos resultados se presentan en la siguiente tabla:
¿La sospecha del gerente es válida al nivel de significación de 5%? Suponga que la distribución de las
diferencias del consumo de gasolina por día antes y después de añadir el aditivo es normal.
Solución
Las variables en estudio son:
X1:= consumo de gasolina antes del aditivo, en galones
X2:= consumo de gasolina después del aditivo, en galones
D = X1 – X2
El parámetro de interés es la media poblacional de las diferencias de los consumos antes y después
del aditivo.
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: µd ≤ 0
H1: µd > 0
Paso 2: Determinar el nivel de significación
= 0,05
Paso 3: Elegir y calcular el estadístico de prueba
d 0 6 ,0 0
TC 3 ,3968
sD 4 ,3266
n 6
Paso 4: Especificar los supuestos para la validez de la prueba
Las muestras son aleatorias y provienen de distribuciones normales.
Las poblaciones son independientes.
Paso 5. Establecer los valores críticos para la región de rechazo
2,015
El valor crítico se calcula usando la función de Excel =INV.T(0,95; 6 - 1) = 2,015
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Como Tc = 3,3968 < t = 2,015; entonces, se rechaza H0. Con un 5% de significancia, se puede afirmar
que el nuevo aditivo A+ disminuye el consumo medio de gasolina.
Notas
202 CE104 Estadística
H0 : 𝑝1 ≥ 𝑝2 H0 : 𝑝1 = 𝑝2 H0 : 𝑝1 ≤ 𝑝2
H1 : 𝑝1 < 𝑝2 H1 : 𝑝1 ≠ 𝑝2 H1 : 𝑝1 > 𝑝2
P1 P2 ~ n1P1 n2P2 a1 a2
Z N(0,1)
p 1 ~
p ~ p 1 ~
p
~ P
n1 n2 n1 n2
n1 n2
Si la hipótesis nula propone alguna diferencia específica entre las proporciones poblacionales some-
tidas a prueba, y denotamos esta diferencia por 0, entonces el estadístico de prueba será:
Z
P1 P2 0 N(0,1)
P1 1 P1 P2 1 P2
n1 n2
Para calcular los valores críticos en Excel, use la función =INV.NORM.ESTAND(área a la izquierda)
Paso 6. Tomar la decisión estadística y expresar la conclusión en términos del problema
Se rechaza H0 si el valor calculado del estadístico de prueba cae en la zona de rechazo.
Notas
EPE UPC 203
Ejercicio 125
Se seleccionó una muestra aleatoria de 150 personas capacitadas y 180 personas no capacitadas; se
halló que 11 de las personas capacitadas cometieron errores en cierta tarea y 16 de las personas
capacitadas cometieron errores en la misma tarea. Con base en esta información, ¿es posible afirmar
que la proporción de capacitadas que comete errores es menor a la proporción de personas no capa-
citadas que comete errores en dicha tarea? Use un nivel de significancia del 6%.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación = …………………….
Paso 3: Elegir y calcular el estadístico de prueba
Notas
204 CE104 Estadística
Ejercicio 126
Un patrocinador de un programa especial de televisión afirma que el programa representa un atrac-
tivo mayor para los televidentes hombres que para las mujeres. Si una muestra aleatoria de 300
hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres estaban viendo el programa
especial de televisión. Al nivel de significación del 5%, ¿se podría decir que el patrocinador tiene la
razón?
Solución
La unidad elemental es un televidente del programa especial.
Las variables en estudio son:
X1:= número de hombres a los que les agrada el programa especial.
X2:= número de mujeres a los que les agrada el programa especial.
Los parámetros son las proporciones de hombres y mujeres a los que les agrada el programa espe-
cial, p1 y p2, respectivamente.
1,645
Notas
EPE UPC 205
Ejercicio 127
En una prueba de dos comerciales de televisión se pasó cada uno en un área varias veces, durante
una semana. La semana siguiente se llevó a cabo una encuesta entre los quienes habían visto los dos
comerciales. Se les pidió recordaran los mensajes principales. Se obtuvo siguientes resultados.
Comercial Personas que lo vieron Personas que recordaron el mensaje principal
A 150 63
B 200 60
Use = 0,02 para probar si hay diferencia en las proporciones de personas que recuerdan el mensaje
principal de los dos comerciales.
Solución
La unidad elemental es ………………………………………………………………………………………………..…………………..
La variable en estudio es ……………………………………………………………………………………………….………………….
Los parámetros de interés son ……………………………………………………………………………….………………………..
……………………………………………………………………………….…………………………………………………………………………
Paso 1. Establecer la hipótesis nula y la hipótesis alterna
H0: …………………………...
H1: …………………………...
Paso 2: Determinar el nivel de significación = …………………….
Paso 3: Elegir y calcular el estadístico de prueba
Notas
206 CE104 Estadística
Prueba de hipótesis para una media poblacional (µ) con varianza desconocida
Para calcular los valores críticos, usaremos la función: =INV.T (área a la izquierda, grados de liber-
tad)
Para calcular los valores críticos, usaremos la función: INV.NORM. ESTAND(área a la izquierda)
Notas
EPE UPC 207
1. Ordene los datos por la variable que requerida (en este ejemplo: género) para los cual seleccione
la opción Datos del menú principal, seleccione Ordenar.
Notas
208 CE104 Estadística
6. Obtendrá lo siguiente:
….
Notas
EPE UPC 209
Prueba de hipótesis para la diferencia de medias con varianzas desconocidas supuestas iguales
1. Seleccione la opción Datos del menú principal, seleccione Análisis de Datos.
2. Seleccione Prueba t para dos muestras suponiendo varianzas iguales, y haga clic en Aceptar.
4. Obteniendo lo siguiente:
Prueba t para dos muestras suponiendo varianzas iguales
Variable 1 Variable 2
Media 40,8182 38,1111
Varianza 196,7636 113,1111
Observaciones 11 9
Varianza agrupada 159,5847
Diferencia hipotética de las medias 0
Grados de libertad 18
Estadístico t 0,4768
P(T<=t) una cola 0,3196
Valor crítico de t (una cola) 2,0071
P(T<=t) dos colas 0,6393
Valor crítico de t (dos colas) 2,3562
5. Luego, obtendrá en Excel el punto crítico a emplear en la prueba de hipótesis:
Puntos críticos
INV.T(0.015,18) = -2.3562
INV.T(0.03,18) = -2.0071
INV.T(0.97,18) = 2.0071
INV.T(0.985,18) = 2.3562
Notas
210 CE104 Estadística
Prueba de hipótesis para la diferencia de medias con varianzas desconocidas supuestas desiguales
2. Seleccione Prueba t para dos muestras suponiendo varianzas desiguales, y haga clic en Aceptar.
4. Obtendrá lo siguiente:
Prueba t para dos muestras suponiendo varianzas desiguales
Variable 1 Variable 2
Media 3.9091 2.2222
Varianza 2.8909 0.9444
Observaciones 11 9
Diferencia hipotética de las medias 0
Grados de libertad 16
Estadístico t 2.7817
P(T<=t) una cola 0.0067
Valor crítico de t (una cola) 1.5529
P(T<=t) dos colas 0.0133
Valor crítico de t (dos colas) 1.9417
Hombre Mujer
5. Luego, obtener en Excel el punto crítico a emplear en la prueba de hipótesis:
Puntos críticos
INV.T(0.035,16) = -1,9417
INV.T(0.07,16) = -1,5529
INV.T(0.93,16) = 1,5529
INV.T(0.965,16) = 1,9417
Notas
EPE UPC 211
2. Seleccione Prueba t para medias de dos muestras emparejadas, y haga clic en Aceptar.
4. Obteniendo lo siguiente:
Notas
212 CE104 Estadística
Ejercicios propuestos
93. La directora de marketing de Cola A está preocupada porque el producto no atrae a suficientes
consumidores jóvenes. Para probar su hipótesis, encuesta aleatoriamente a 200 consumidores
de Cola A. Se obtuvo como resultado una media de 30 años con una desviación estándar de 9
años. Al nivel de significación del 3%, ¿estos hechos son suficientes para concluir que los consu-
midores de Cola A poseen una edad promedio menor a 29 años?
Rpta: Prueba unilateral izquierda, Tc = 1,5713, Decisión: No rechazar H0
94. El fabricante de las motocicletas A anuncia en una propaganda de televisión que su vehículo po-
see un rendimiento promedio de 90 millas por galón en viajes largos. El recorrido (en millas) ob-
servado en ocho viajes prolongados fueron: 88, 82, 81, 87, 80, 78, 79, y 89. Al nivel de significa-
ción del 1% ¿el recorrido medio es menor que el anunciado?
Rpta: Prueba unilateral izquierda, Tc = -4,5593, Decisión: Rechazar H0
95. El gerente de una agencia bancaria tiene como objetivo que el número promedio de clientes
atendidos, entre las 13 y 14 horas, debe ser mayor a 45 clientes. La siguiente muestra aleatoria
registra el número de clientes que se atendieron entre ese periodo de tiempo durante 14 días:
45 47 42 42 46 44 46
43 44 46 48 45 46 47
Si el gerente encuentra que se atiende, en promedio, más de 45 clientes en ese horario, se verá
obligado a abrir una ventanilla adicional. Utilice un nivel de significación del 3% y asuma que el
número de clientes atendidos en ese horario tienen una distribución normal.
El gerente, ¿se verá obligado a abrir una nueva ventanilla?
Rpta: Prueba unilateral derecha, Tc = 0,1437, Decisión: No rechazar H0
96. En una encuesta de 900 hogares en Lima, se encontró que 100 de los hogares tenían al menos un
miembro de familia con educación superior. ¿Este resultado refuta la aseveración de que en los
hogares de Lima este porcentaje es menor a 15%? Use un nivel de significación del 4%.
Rpta: Prueba unilateral izquierda, Zc = -3,2673, Decisión: Rechazar H0
97. Se realizó una investigación de mercadotecnia para estimar la proporción de amas de casa que
pueden reconocer la marca de un producto de limpieza con base a la forma y color del recipien-
te. De las 1500 amas de casa, 620 fueron capaces de identificar la marca del producto. ¿Se puede
afirmar, a un nivel de significación del 2%, que la proporción de amas de casa que reconocen la
marca del producto es superior a 0.37?
Rpta: Prueba unilateral derecha, Zc = 3,4761, Decisión: Rechazar H0
98. Una compañía dedicada a la fabricación de muebles para armar está analizando las ventas de
esos productos realizadas vía telefónica. El gerente de la compañía continuará con dicha modali-
dad de ventas, si en más del 80% de las llamadas, la venta se logra concretar con éxito. Si al ana-
lizar una muestra de 100 llamadas encuentra que 85 resultaron cerrar la venta con éxito, ¿la
compañía deberá continuar con las ventas de su producto por teléfono? Use un nivel de signifi-
cación del 1%.
Rpta: Prueba unilateral derecha, Zc = 1,2500, Decisión: No rechazar H0
Notas
EPE UPC 213
99. Una política del Organismo Supervisor de Entidades del Estado Peruano (OSEEP) es de uniformi-
zar el tiempo de atención (en días) de los expedientes presentados, pero lamentablemente por
burocracias administrativas se sospecha que los expedientes de la zona norte (1) son atendidos
en promedio en menos tiempo que los presentados en la zona sur (2). Si se llegase a demostrar
tal sospecha se comprobaría el fracaso del plan de mejora. ¿Los datos confirman la sospecha a
un nivel de significación de 2%? Asuma heterogeneidad de varianzas poblacionales y distribución
normal de la variable en estudio.
Norte Sur
n 70 65
μi 25.2 22.6
𝜎𝑖2 12 15
100. Se llevó a cabo una encuesta entre los miembros del Club del libro del mes, para determinar si
pasan más tiempo viendo televisión que leyendo. Suponga que en una muestra de 12 encues-
tados se obtuvieron las horas semanales que se dedican a ver televisión y las que se dedican a
la lectura. Con un nivel de significación del 5%, ¿se puede llegar a la conclusión de que los
miembros del Club del libro del mes pasan más tiempo, en promedio, viendo televisión que le-
yendo? Asuma normalidad de las variables en estudio.
Encuestado 1 2 3 4 5 6 7 8 9 10 11 12
Televisión 11 19 8 5 16 8 4 12 10 14 15 18
Leyendo 6 10 3 10 5 8 7 14 14 8 10 10
101. Se realiza un estudio en la Universidad A para medir el efecto del cambio ambiental en estu-
diantes. Uno de los aspectos del estudio es una comparación del peso de los alumnos al ingre-
sar a esa universidad, un año después se midió el peso de los mismos estudiantes pues se sos-
pecha que los alimentos más consumidos provocan aumento de peso.
Los datos para una muestra de estudiantes se dan a continuación.
Alumno 1 2 3 4 5 6
Peso al inicio 74 67 98 90 103 75
Peso un año después 82 67 96 102 116 84
Con 1% de nivel de significación, ¿los alimentos más consumidos provocan aumento de peso?
Rpta: Prueba unilateral izquierda, Tc = -2,6126, Decisión: No rechazar H0
102. El jefe de personal de la OSEEP desea determinar si el ambiente laboral influye en el rendi-
miento de los trabajadores. A sugerencia de la supervisora de producción, quien afirmaba que
la música mejorará la producción promedio diaria, se realizó un estudio en la cual se seleccio-
naron seis trabajadores y se les hizo un seguimiento a la producción semanal de los trabajado-
res antes y después de trabajar con música ambiental, obteniéndose la siguiente producción
semanal (en unidades):
Notas
214 CE104 Estadística
Empleado 1 2 3 4 5 6
Semana sin música 219 203 226 198 209 216
Semana con música 235 200 240 210 223 217
¿La producción obtenida sugiere que la música ambiental logró aumentar la producción prome-
dio diaria como afirma la supervisora de producción? Realice la prueba estadística respectiva a
un nivel de significación del 5%.
Rpta: Prueba unilateral izquierda, Tc = -2,7731, Decisión: Rechazar H0
103. En una agencia bancaria se capacitan a diez empleados para mejorar la atención al cliente. El
jefe del área contabiliza el tiempo de atención en ventanilla de estos empleados, antes y des-
pués de la capacitación, para determinar la eficiencia.
La siguiente tabla muestra el tiempo de atención (en minutos) que demora un empleado en
atender al reclamo de un cliente.
Empleado 1 2 3 4 5 6 7 8 9 10
Antes 44 70 40 73 50 54 40 58 67 67
Después 26 59 38 67 45 47 42 49 61 41
A un nivel de significación del 4%, ¿el jefe de la oficina de atención al personal puede afirmar
que la atención al cliente es más eficiente?
Rpta: Prueba unilateral derecha, Tc = 3,4617, Decisión: Rechazar H0
104. Una empresa realiza un estudio para determinar si el ausentismo de los trabajadores en el turno
diurno es diferente al de los trabajadores en el turno nocturno. Se realiza una comparación de
150 trabajadores de cada turno. Los resultados muestran que 28 trabajadores diurnos han falta-
do por lo menos cinco veces durante el año anterior, mientras que 50 trabajadores nocturnos
han faltado por lo menos cinco veces. Con un nivel de significación del 3%, ¿existen diferencias
significativas entre las proporciones de trabajadores de los turnos que faltaron cinco veces o
más al año.
Rpta: Prueba bilateral, Zc = -2,8957, Decisión: Rechazar H0
105. Los expedientes atendidos por la OSEEP tienen un plazo de atención máximo y dependiendo de
su complejidad, éste podría ser atendido en un plazo mayor. Se han puesto en marcha acciones
de mejora para brindar una atención eficiente y se quiere verificar si las acciones implementa-
das resultaron ser más efectivas en la zona sur que en la zona norte, debido a que se han repor-
tado un porcentaje mayor de quejas de los clientes de la zona sur.
Los datos registrados a partir de una muestra de clientes de ambas zonas son los siguientes:
Notas
EPE UPC 215
106. El gerente de comercio ha incluido una promoción para incentivar los créditos orientados a capi-
tal de trabajo. Orientará su campaña, principalmente a las microempresas si encuentra que la
proporción de pequeñas empresas que solicitan crédito para capital de trabajo es mayor que en
las microempresas. Con un nivel de significación del 2% ¿deberá orientar la campaña publicitaria
a las microempresas?
Crédito Pequeña empresa Microempresa
Capital 22 20
Otros 18 13
Rpta: Prueba unilateral derecha, Zc = -0,4823, Decisión: No rechazar H0
107. Star A es una línea aérea de capital compartido (peruano-americano) que tiene más de 10 años
laborando en el Perú. El gerente de marketing de aerolíneas Star A desea realizar un estudio
considerando como segmentos de interés a los pasajeros nacionales y extranjeros. Para realizar
dicho estudio se seleccionan al azar muestras aleatorias e independientes de los registros de pa-
sajeros peruanos y extranjeros. Algunas de las características que desea analizar el gerente son
las siguientes: Origen del pasajero: peruano o extranjero, género, opinión sobre el servicio, edad
del pasajero (en años), peso del equipaje en el último viaje (en kg).
Origen Género Opinión Edad Peso
Extranjero Mujer Regular 17 18.1
Extranjero Hombre Regular 62 17.9
Extranjero Hombre Regular 50 21.2
Extranjero Mujer Regular 48 19.1
Extranjero Mujer Regular 39 19.7
Extranjero Hombre Mala 44 21.3
Extranjero Mujer Regular 40 19.3
Extranjero Mujer Mala 37 18.8
Extranjero Mujer Muy buena 25 17.8
Extranjero Hombre Muy buena 7 16.3
Extranjero Hombre Regular 7 22.5
Peruano Mujer Mala 29 24
Peruano Hombre Buena 56 16.2
Peruano Hombre Muy buena 44 19.4
Peruano Hombre Buena 7 20.6
Peruano Hombre Regular 51 22.2
Peruano Hombre Mala 41 18
Peruano Hombre Regular 46 20.6
Peruano Hombre Buena 41 19
Peruano Mujer Regular 30 18
Peruano Hombre Buena 45 23.5
Peruano Mujer Regular 46 21.7
Peruano Hombre Regular 22 17.2
Peruano Mujer Muy buena 8 20.7
Peruano Hombre Regular 64 19.4
Peruano Mujer Mala 16 17.9
Peruano Hombre Muy buena 41 16.4
Peruano Mujer Buena 43 21.3
Peruano Hombre Buena 12 22.5
Notas
216 CE104 Estadística
Con la información que se muestra y usando un nivel de significación del 6% responda lo si-
guiente:
b. ¿Se podría afirmar que las mujeres, en promedio, son mayores que los hombres?
Rpta: Prueba unilateral derecha, Tc = -0,9629, Decisión: No rechazar H0
c. ¿Existen diferencias significativas entre los pesos medios de los equipajes por género?
Rpta: Prueba bilateral, Fc = 0,6376, Decisión: No rechazar H0;
Prueba bilateral, Tc = 0,0497, Decisión: No rechazar H0
108. La cadena de librerías A está realizando una investigación sobre el funcionamiento del negocio.
En cada una de sus sucursales aplicó, este año 2017, una pequeña encuesta entre sus clientes y
se les preguntó sobre las siguientes variables:
a. Si se sostuviera que las varianzas poblacionales de los ingresos de los clientes de las
sucursales de San Miguel y Breña son iguales, ¿cuál sería su conclusión? Use α=0.04
Asuma que las muestras de clientes en cada sucursal son independientes y que provienen de
poblaciones normales.
b. Se piensa que los clientes de San Miguel ganan, en promedio, menos que los clientes de
Breña.
Pruebe esta hipótesis usando un nivel de significancia del 4%. Asuma que las muestras de
clientes en cada sucursal son independientes y que provienen de poblaciones normales.
c. En el distrito de Los Olivos, ¿hubo un mayor gasto el 2017 con respecto al 2016?
Pruebe esta hipótesis usando un nivel de significancia del 6%. Asuma que las muestras de
clientes en cada sucursal son independientes y que las diferencias de las observaciones de los
gastos del 2016 y 2017 provienen de una distribución normal.
Notas
EPE UPC 217
Notas
218 CE104 Estadística
El objetivo principal del análisis de regresión es estimar el valor de la variable dependiente, sabiendo
que el valor de la variable independiente, es conocido.
Diagrama de dispersión
Es una gráfica en la que cada punto representa un par de valores observados (xi,yi) de las variables
dependientes e independientes. El valor de la variable independiente, X se grafica en el eje horizon-
tal, mientras que el valor de la variable dependiente, Y en el eje vertical.
El tipo de la relación observada en el diagrama de dispersión puede ser curvilínea (relación no lineal),
puede ser lineal o ninguna de las anteriores.
Si el diagrama de dispersión indica una relación de tipo lineal, entonces se estima una línea recta a
los datos.
La relación que se proponga entre estas variables no es exacta. Es decir, a un valor dado de X no co-
rresponde un valor exacto de Y. No es un modelo determinístico. Para una relación lineal, la ecuación
propuesta tiene la forma:
Y 01 X
El término es denominado “término aleatorio” o “error”.
El modelo propuesto se denomina modelo de regresión lineal simple. La linealidad se expresa por
que la función es lineal en los parámetros, pero no necesariamente es lineal en X.
Supuestos
• Las variables independiente y dependiente se asocian linealmente y la relación funcional entre
ellas puede ser expresada mediante el modelo lineal:
y i o 1 xi i
• Los términos aleatorio i son independientes y tienen una distribución normal con media 0 y
varianza 2
• Los valores de X son fijados y se miden sin error.
• Las distribuciones de Y para los diferentes valores de X, tienen igual varianza.
• Los valores de Y, para cada valor de X, son obtenidos mediante una muestra aleatoria.
Notas
EPE UPC 219
Ejercicio 128
El gerente de un banco ha observado que la atención en ventanilla es lenta, preocupado por las cons-
tantes quejas de los clientes del banco. Por tal razón, ha decidido observar las diez últimas visitas al
banco. Se ha registrado el número clientes que encontró haciendo cola y el tiempo que tuvo que
esperar hasta ser atendido, en minutos.
Clientes en cola 7 8 2 4 4 12 15 10 12 5
Tiempo de espera 10 8 3 4 6 15 18 10 14 5
Solución
a. Identifique la variable independiente y la variable dependiente. Justifique.
b. Realice el diagrama de dispersión y trace, aproximadamente, una recta que se ajuste a la nube de
puntos.
c. A partir del gráfico, estime el tiempo que José esperaría en ser atendido, si al llegar al banco en-
cuentra seis clientes haciendo cola.
Notas
220 CE104 Estadística
S S
x y
i 1
i i nx y
b1 r Y XY
SX S X2 n
x
i 1
i nx 2
b0 y b1 x
Ejercicio 129
En los siguientes casos, determine la ecuación de regresión e indica cuál es el coeficiente de regre-
sión e interprete.
Coeficientes
Intercepción 62,4604
Demanda -0,3512
Solución
La ecuación de regresión es: ………………………………………………………………………………………………………………..
El valor del coeficiente de regresión es: ………………………………………………………………………….…………………..
Interpretación: ………………………………………………………………………………………………………………..…………………..
…………………………………………………………………………………………………………………………………………………………….
Coeficiente de correlación
El coeficiente de correlación mide el grado de asociación lineal que existe entre dos variables.
El coeficiente de correlación se denota por r y se encuentra dentro del intervalo cerrado de [-1 y 1].
Si r está cerca de cero entonces indicará que no existe relación lineal significativa entre las varia-
bles.
Si r está cerca de -1, indicará que existe una relación lineal fuerte e inversa.
Si r está cerca de 1, indicará que existe una relación lineal fuerte y directa
x y nx y
i 1
i i
r
n n
i 1
i 1
x i nx 2 y i ny 2
Notas
EPE UPC 221
Coeficiente de determinación
Es una medida de la bondad del ajuste para una ecuación de regresión.
(y
i 1
i y )2
SCT
V (Y )
n 1 n 1
V Yˆ es la varianza de los valores estimados con la recta de regresión
n
(yˆ y )2
i
SCR
V Yˆ i 1
n 1 n 1
Ejercicio 130
Para las variables X e Y se tiene la recta de regresión y = 1,0926 + 14,009.
La varianza de la variable Y es 12,278 y la varianza de los valores estimados es 11,290. Luego, el coe-
ficiente de determinación es 0,9195. Es decir, el 91,95% de la varianza de Y es explicado por el mode-
lo de regresión.
Notas
222 CE104 Estadística
Ejercicio 131
En los siguientes casos, indica cuál de las variables independientes presentadas es la que más explica
la variabilidad de la variable dependiente e interprete dicho valor.
Ejercicio 132
En los siguientes casos, indica cuál de las variables independientes presentadas es la que presenta
una mayor asociación con la variable dependiente. Indique el tipo de asociación, directa o inversa.
Notas
EPE UPC 223
La prueba es bilateral.
La región crítica o de rechazo se determina a partir de una distribución t de Student con n – 2 grados
de libertad.
Con el Excel, se observa el valor p de la siguiente tabla y se rechaza H0 si el valor p es menor que α.
Para el caso de regresión lineal simple también se puede realizar esta prueba usando el análisis de
varianza de la regresión.
ANÁLISIS DE VARIANZA
Fuente de variación Grados de libertad Suma de cuadrados Cuadrado medio Fc Ftab
Regresión 1 SCR CMR Fcal F(1; n-2)
Error n-2 SCE CME
Total n -1 CST
En Excel, se puede obtener este reporte de regresión mediante la opción en Datos. Luego se hace clic
en Análisis de Datos y finalmente en Regresión.
Cabe mencionar, que Excel presenta un error en el texto “Valor crítico de F” en la tabla Análisis de
varianza, el texto correcto es “Probabilidad”, que se refiere al valor p de la prueba.
Notas
224 CE104 Estadística
Ejercicio 133
En una empresa aérea se desea establecer un modelo de regresión entre la cantidad de agua necesa-
ria, en litros, en un vuelo y el número de pasajeros en ese vuelo. Se tiene la siguiente información.
Cantidad de agua 91 91 93 97 97 99 99 101 101 101 104 105 105 107 107
Cantidad de pasajeros 80 82 82 85 85 86 87 87 90 93 93 95 95 97 98
Solución
a. Indique la variable independiente y la dependiente. Complete los valores en la tabla.
Variable dependiente: …..…..…..….…..…...…..…..….…..…..…..…..….…..…..…..…..….…..…..…..…..….…..….
Variable independiente: …..…..…..….…..…...…..…...…..…..…..…..….…..…..…..…..….…..…..…..…..….…..….
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple
Coeficiente de determinación R^2
Notas
EPE UPC 225
Ejercicio 134
Se llevó a cabo un estudio para determinar la relación entre el número de años de experiencia (X) y el
salario mensual, en cientos de soles (Y) entre los administradores de cierta ciudad. Para ello, se tomó
una muestra aleatoria de 16 administradores y se obtuvieron los siguientes datos:
b. Calcule la recta de regresión de mínimos cuadrados. Interprete los coeficientes del modelo.
En Excel use Análisis de datos en Excel es Herramientas > Análisis de datos > Regresión
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,939884642
Coeficiente de determinación R^2 0,883383141
R^2 ajustado 0,875053365
Error típico 4,325046117
Observaciones 16
Notas
226 CE104 Estadística
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,939884642
Coeficiente de determinación R^2 0,883383141
R^2 ajustado 0,875053365
Error típico 4,325046117
Observaciones 16
El coeficiente de correlación es 0,93988, es decir, existe una relación fuerte y directa entre los
años de experiencia del administrador y el salario que percibe.
H 0: 1 0
H1: 1 0
El valor p es 6,48427E-08 < 0,05. Por lo tanto, se rechaza H0, es decir, bajo un nivel de significa-
ción del 5% podemos afirmar que existe una relación funcional lineal entre los años de expe-
riencia y el salario del administrador.
Notas
EPE UPC 227
Ejercicios propuestos
109. Un economista del Departamento de Recursos Humanos del estado de Florida está preparan-
do un estudio sobre el comportamiento del consumidor. Él recolectó los datos que aparecen
en miles de dólares para determinar si existe una relación entre el ingreso del consumidor y los
niveles de consumo. Determine cuál es la variable dependiente.
Consumidor 1 2 3 4 5 6 7 8 9 10 11
Ingreso 24,3 12,5 31,2 28 35,1 10,5 23,2 10 8,5 15,9 14,7
Consumo 16,2 8,5 15 17 24,2 11,2 15 7,1 3,5 11,5 10,7
a. Elabore el diagrama de dispersión para los datos.
b. Calcule e interprete el modelo de regresión. ¿Qué le dice este modelo sobre la relación entre
el consumo y el ingreso?
c. ¿Qué proporción de cada dólar adicional que se gana se invierte en consumo?
110. Se reúne datos acerca de la cantidad de familias que ven programas donde se pasan determina-
do anuncio. Esta observación es de utilidad para los publicistas. porque les dice a cuantos con-
sumidores llegan. Los datos siguientes muestran la cantidad de familias espectadoras. en miles.
y la cantidad de veces que salió al aire el anuncio en una semana.
Veces que salió el anuncio 95 46 41 38 29 32 25 21 21 16
Familias espectadoras 758,8 323,0 275,3 241,8 219,9 198,5 193,8 189,7 161,9 160,0
a. Determine la ecuación de regresión para predecir la cantidad de familias espectadoras a
partir de la cantidad de veces que apareció el anuncio. Suponga que existe una relación en-
tre la cantidad de familias espectadoras y la cantidad de veces que apareció el anuncio.
b. Interprete los coeficientes de regresión de la ecuación de la parte a)
c. Validar el modelo de la parte a). Use un nivel de significación del 5%.
d. ¿Se puede afirmar que por cada anuncio adicional que se realice el número de familias es-
pectadoras se incrementa en 6000? Use un nivel de significación del 5%.
e. ¿Qué porcentaje de la variabilidad total del número de familias espectadoras es explicado
por el modelo determinado en la parte a)?
Talla (cm.) 160 165 168 170 171 175 175 180 180 182
Peso (kg.) 55 58 58 61 67 62 66 74 79 83
Notas
228 CE104 Estadística
112. Los siguientes datos corresponden al cloro residual en una piscina en diversos momentos des-
pués de haberse tratado con químicos.
113. El propietario de una empresa de mudanzas desea desarrollar un modelo de regresión que le
permita estimar el tiempo total (horas) empleado para realizar una mudanza en función de la
carga transportada (pies cúbicos). Para lograr su propósito recolectó la información que a usted
se muestra a continuación.
Notas
EPE UPC 229
2. En el menú principal seleccione Insertar, luego Dispersión y después Dispersión solo con marcadores.
2. Botón Dis-
1. Menú Inser- persión
tar
3. Dispersión solo
con marcadores
4. Clic derecho
en uno de los
puntos
5. Agregar línea
de tendencia
Notas
230 CE104 Estadística
6. Haga clic en
Lineal.
7. Clic en Ce-
rrar.
70
60
50
Salario
40
30
20
10
0
0 10 20 30 40
Años de experiencia
1. Elija Datos
2. Haga clic en
Análisis de Datos
4. Haga clic en
Aceptar
3. Elija Regresión
Notas
EPE UPC 231
1. Seleccione X 2. Seleccione Y
5.Clic en Aceptar
Estadísticas de la regresión
Coeficiente de
correlación múltiple 0.93988
Coeficiente de
determinación R^2 0.88338
R^2 ajustado 0.87505
Error típico 4.32505
Observaciones 16
ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
libertad cuadrados cuadrados F crítico de F
Regresión 1 1983.8 1983.8 106.1 6E-08
Residuos 14 261.884 18.706
Total 15 2245.68
Notas
232 CE104 Estadística
Definiciones básicas
5. Complete la información solicitada, indique:
Población Todos los clientes de la empresa Natural Power Nutrition
Muestra Algunos clientes de la empresa Natural Power Nutrition
Unidad elemental Un cliente de la empresa Natural Power Nutrition
6. Complete los espacios en la tabla considerando la información del estudio:
Objetivo 1: Determinar el producto comprado con más preferencia por los clientes al mes.
Complete los elementos faltantes y responda a los enunciados solicitados.
Distribución porcentual de los clientes según tipo de suplemento
30.00%
24.50%
Porcentaje de clientes
24.00%
25.00%
19.50%
20.00% 18.00%
14.00%
15.00%
10.00%
5.00%
0.00%
Aminoácidos Ganador de masa Pre Proteina Quemador de
entrenamiento grasa
Tipo de suplemento
Fuente: Natural Power Nutrición
e. Responda al objetivo: Pre entrenamiento, pues su porcentaje (25,5%) es el mayor de todos.
f. El número de clientes que ha comprado quemador de grasa es: 39
g. Interprete h2%: De total de clientes, el 18% de los clientes compran el suplemento ganador de
grasa
h. Construye la tabla de frecuencia usando el gráfico de columnas.
Notas
234 CE104 Estadística
Objetivo 2: Identificar el tipo de pago de mayor preferencia entre los clientes para evaluar una estra-
tegia promocional por tipo de producto.
A continuación, se muestra la siguiente información obtenidas de los 200 clientes al momento de
analizar el tipo de suplemento y el turno de pago.
Tipo de pago
Total
Tipo de suplemento Efectivo Tarjeta de crédito Tarjeta de débito
Proteína 3,75% 12,50% 7,50% 23,75%
Quemador de grasa 6,25% 10,00% 3,75% 20,00%
Ganador de masa 5,00% 8,75% 11,25% 25,00%
Preentreno 7,50% 5,63% 3,12% 16,25%
Aminoácidos 2,50% 7,50% 5,00% 15,00%
Total 25,00% 44,38% 30,62% 100,00%
Fuente: Natural Power Nutrition
a) Complete los elementos faltantes de la tabla y el gráfico mostrado.
Título de la tabla: Distribución porcentual de clientes según tipo de pago y tipo
de suplemento
Valor faltante del gráfico: 33,33%
Valor faltante de la tabla: 3,12%
El tipo de gráfico mostrado es: Agrupado
c) Responda al objetivo: Para los productos proteína, quemador de grasa y aminoácidos es con
tarjeta de crédito, mientras que; ganador de grasa es tarjeta de débito y pre-entrenamiento paga
con efectivo.
Notas
EPE UPC 235
Objetivo 3: Determinar el número de productos comprados menos frecuente por los clientes al mes.
Complete el valor faltante y responda los enunciados solicitados.
Objetivo 4: Determinar la distribución de los clientes respecto al tiempo de demora que llega el pro-
ducto a su casa.
El gerente ha decidido crear una tabla que permita conocer la distribución porcentual de la variable
estudiada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
b. Interprete h2%: Del total de clientes, el 13,46% de clientes su tiempo en que demora que llegue
su producto es más de 83 minutos hasta 98 minutos,
c. Interprete F4: Son 36 clientes su tiempo de demora que llegue su producto es a lo más 69,23%.
Notas
236 CE104 Estadística
a. Complete los elementos faltantes del histograma de frecuencias del monto de compra al mes.
20%
17.5%
18%
16% 14.5%
14% 13.0% 12.5% 12.0%
12%
10.0%
10%
7.5% 8.0%
8%
6% 5.0%
4%
2%
0%
81.4 102.7 124 145.3 166.6 187.9 209.2 230.5 251.8 273.1
Fuente: Natural Power Nutrition
Objetivo 6: Identificar la concentración de los clientes respecto al tiempo de demora que llega el
producto a su casa.
Jorge ha decidido crear una tabla que permita conocer la distribución porcentual de la variable estu-
diada en su objetivo. Para esto extrae una muestra al azar y registra los siguientes datos:
68 76 78 83 85 86 88 90 91 94 98 100 103
105 105 106 107 109 110 110 112 112 113 113 113 113
114 114 115 116 118 118 119 121 123 125 131 134 135
137 138 142 144 146 147 149 153 155 158 159 164 168
Notas
EPE UPC 237
d. A partir de los datos, calcule el indicador pertinente que permita responder al objetivo.
Mediana 113,5 Media 117,519231 Desviación 24,2717381 As 0,4967791
e. Responda al objetivo
Presenta una asimetría positiva, los tiempos de demora se concentran en valores bajos es decir
se demoran poco al llevar los productos a la casa de los clientes
f. La empresa contratará más motorizados si se tardan mucho en enviar sus productos, ¿Deben
contratar más motorizados?
No, porque los tiempos de envío se concentran en valores bajos.
Objetivo 7: Comparar el monto de compra entre los clientes de sexo masculino y los de sexo feme-
nino.
Femenino Masculino
Media 152,832 Media 153,606
Mediana 154,000 Mediana 168,000
Moda 153,000 Moda 149,000
Desviación estándar 37,527 Desviación estándar 43,840
Varianza de la muestra 1408,261 Varianza de la muestra 1921,955
Coeficiente de asimetría -0,609 Coeficiente de asimetría -0,612
Rango 139 Rango 165
Suma 15436 Suma 15207
Cuenta 101 Cuenta 99
a. Encuentre los valores faltantes de los clientes de sexo femenino: 152,832, 1408,261 y 101
b. Encuentre los valores faltantes de los clientes de sexo masculino: 43,840 y 15207
c. Encuentre el valor del coeficiente de variación para el sexo masculino: 28,58%
d. Encuentre el valor del coeficiente de variación para el sexo femenino: 24,54%
e. Indique el sexo con los montos de compra más homogéneos: Femenino
f. La empresa emprenderá una campaña promocional al sexo que presente mayor dispersión, ¿cuál
es el sexo que debe emprender la campaña? Masculino
Notas
238 CE104 Estadística
Índice
Axiomas de la probabilidad, 124 Mediana, 55
Coeficiente de asimetría Medidas de asimetría, 70
de Fisher, 70 Medidas de dispersión, 61
Coeficiente de variación, 66 Medidas de tendencia central, 53
Cuantiles, 58 Moda, 56
Desviación estándar, 64 Probabilidad
de una variable aleatoria, 148 condicional, 125
Distribución Teoremas básicos de, 124
binomial, 155 Rango
de frecuencias, 26, 29 de una variable, 62
normal, 163 Rango intercuartil, 62
Poisson, 159 Tabulaciones cruzadas, 34
Espacio muestral, 120 Teorema de Bayes, 132
Partición de un, 132 Teorema de la probabilidad total, 132
Evento, 120 Valor esperado
Complemento, 122 de una variable aleatoria discreta, 148
Eventos Variable aleatoria
independientes, 129 definición, 144
Intersección de, 122 discreta, 145
Unión de, 122 Función de probabilidad, 145
Gráfico Varianza, 64
circular, 22 de una variable aleatoria discreta, 148
de barras, 22
Notas