Professional Documents
Culture Documents
EST-103
Presentacin
La presente gua resume la teora necesaria para llevar el curso Estadstica
de Estudios Generales Letras de la Pontificia Universidad Catlica del Per. Se ha
realizado con la finalidad de brindar a los alumnos una ayuda en su proceso educativo y una herramienta que colabore en el dictado de las clases.
Es muy importante resaltar que este material no sustituye la clase del profesor y ni tampoco equivale a un libro de texto.
Esta gua est basada en el trabajo de los profesores: Ana Valdivia, Sergio
Pavletich y Walter Luna.
Se agradece que los usuarios de esta gua hagan llegar sus crticas y comentarios a esta publicacin.
Maria Teresa Villalobos.
Pando, marzo del 2016
Contenido
Captulo 1. Nociones de Estadstica Descriptiva ................................................................. 3
1.1. Conceptos bsicos .............................................................................................................. 3
1.2. Organizacin y tratamiento de datos ................................................................................ 14
1.3. Grficos y tablas estadsticas ............................................................................................ 16
1.4. Tablas de contingencia ..................................................................................................... 26
1.5. Grficos a partir de tablas de contingencia ........................................................................ 27
1.6. Estadsticos de posicin .................................................................................................... 31
1.7. Medidas de tendencia central .......................................................................................... 36
1.8. Medidas de dispersin ..................................................................................................... 44
1.9. Indicadores de asimetra .................................................................................................. 52
1.10. Estadstica descriptiva bidimensional: Regresin lineal simple ......................................... 61
Estadstica EEGGLL
Recoleccin
Organizacin
Presentacin
Anlisis
Subdivisin de la Estadstica
Estadstica
Descriptiva
Estadstica
Inferencial
Ejercicio 1
Indique si las siguientes afirmaciones son de tipo descriptiva o inferencial.
Afirmacin
El 32% de los encuestados cuenta con servicio de Internet en
casa.
El 46% de todos los alumnos de EEGGLL son hombres.
La edad media de los estudiantes seleccionados es 19 aos.
El 47% de las personas encuestadas es de sexo femenino.
El 23% de los peruanos ha visitado Machu Picchu por lo menos una vez.
Notas
Tipo de afirmacin
Poblacin
Es el conjunto de todos los elementos de inters en determinado estudio.
Los elementos que forman la poblacin pueden ser personas, cosas, animales, instituciones, etc.
A cada elemento de la poblacin se le llama unidad estadstica.
Muestra
Es un subconjunto de elementos de la poblacin.
Poblacin
Conjunto de todos
los elementos de
inters en
determinado
estudio.
Muestra
Un subconjunto de
elementos de la
poblacin.
Cuando el objetivo es hacer inferencia estadstica es necesario que la muestra sea seleccionada de
acuerdo a un diseo aleatorio, es decir, que sus elementos sean escogidos al azar.
Ejemplo 1
Cada ao, el Departamento de Salud y Servicios Humanos de Estados Unidos examina a miles de estadounidenses. Mdicos, dentistas, nutricionistas y tcnicos de salud realizan la Encuesta Nacional de
Examen de Salud y Nutricin (NHANES). Cada participante representa unos 50.000 personas.
1.
2.
3.
4.
5.
6.
Ejercicio 2
En el Per, se desea determinar el porcentaje de mujeres en edad frtil que usa algn mtodo anticonceptivo. Defina la poblacin.
Notas
Estadstica EEGGLL
Ejercicio 3
En el Per se desea determinar la media de las edades de las mujeres en edad frtil que usan algn
mtodo anticonceptivo. Defina la poblacin.
Ejercicio 4
Se desea determinar el porcentaje de agencias del Banco de Crdito con menos de 25 trabajadores.
Defina la poblacin.
Ejercicio 5
Tomado del folleto Lo que debes saber de Pisa 2015 Ministerio de Educacin.
1
2
3
4
Notas
Pas
Shanghai-China
Singapur
Hong Kong-China
Taipei
Comprensin lectora
Matemtica
Ciencias
613
573
561
560
570
542
545
523
580
551
555
523
65
66
Indonesia
Per
Notas
375
368
396
384
382
373
Estadstica EEGGLL
Variable estadstica
Una variable es una caracterstica que interesa observar o medir en las unidades estadsticas y que
puede asumir al menos dos valores diferentes.
Una variable estadstica es una funcin que a cada elemento de la poblacin le asigna un nmero.
Los nmeros se asignan de acuerdo con una escala y representan la medicin de una determinada
caracterstica en cada unidad estadstica.
En una poblacin se pueden definir muchas variables estadsticas.
Dato
Es el valor de la medicin de una variable, realizada en una unidad estadstica.
Variable
Rango
Caracterstica a
medir
Conjunto de
todos los valores
que puede
asumir
Dato
Valor de la
medicin
Ejercicio 6
Indique la poblacin, variables a medir y rangos y un posible dato de las siguientes investigaciones:
Se quiere estimar el porcentaje de personas, por sexo y por grupos de edades, que votaran por cierto
candidato a la presidencia del Per.
Poblacin: ..
Variable
Rango
Un dato posible
Rango
Un dato posible
Ejercicio 7
En una investigacin, se quiere estimar el ingreso promedio semanal de la fotocopiadora que est en
EEGGLL
Poblacin: ..
Variable
Notas
Rango
Un dato posible
Parmetro
Es un valor que describe una caracterstica de la poblacin. Para calcular un parmetro se requiere
medir la caracterstica de inters en todos los elementos que conforman la poblacin.
Estadstico
Es un valor que describe una caracterstica de la muestra. Para calcular el estadstico se usan las mediciones de la caracterstica de inters en los elementos que conforman la muestra de estudio.
Poblacin
Parmetro
Muestra
Estadstico
Ejercicio 8
Poblacin: Alumnos regulares
matriculados en la Facultad de
Ciencias e Ingeniera en el semestre
2016 01.
Ejercicio 9
El 13 de marzo del 2016, la empresa Ipsos, para el diario El Comercio, present los resultados de una
encuesta sobre intencin de voto. Indique si estos valores son parmetros o estadsticos.
(Fuente: El Comercio)
Notas
Estadstica EEGGLL
Ejercicio 10
Poblacin: Vacas en la regin
Cajamarca.
Parmetro:
..................................................................................................
..................................................................................................
Muestra:
..........................................................
..........................................................
..........................................................
Estadstico:
.................................................................................................
.................................................................................................
Ejercicio 11
Poblacin: Das de los meses
enero, febrero y marzo de 2016.
Parmetro:
..................................................................................................
..................................................................................................
Muestra:
..........................................................
..........................................................
..........................................................
Estadstico:
.................................................................................................
.................................................................................................
Ejercicio 12
Segn los Censos Nacionales X de Poblacin y V de Vivienda 2007 ejecutados por el INEI, el 50,06% de
los peruanos es mujer. Indique si este valor es un parmetro o un estadstico.
Ejercicio 13
En octubre del 2011, Ipsos Apoyo present los resultados de una encuesta sobre sexualidad, reproduccin y desigualdades de gnero, en la cual se indica que el 55% de los entrevistados afirma que la
violencia fsica es el principal problema de la mujer peruana. Indique si este valor es un parmetro o
un estadstico.
Ejercicio 14
En una muestra de viviendas del rea urbana de Ica se observ que en el 35% de los casos, el material
predominante de las paredes era adobe. Indique si este valor es un parmetro o un estadstico.
Notas
10
Tipos de variables
Las variables se pueden clasificar en cualitativas o cuantitativas.
Variables
cualitativas
Variables
cuantitativas
Variable cuantitativa
discreta
Variable cuantitativa
continua
Tipo de variable
Estadstica EEGGLL
11
Escala de medicin
Asigna nmeros a las mediciones realizadas en las unidades estadsticas. Los nmeros asignados por
las escalas deben informar lo ms precisamente posible acerca de las caractersticas de cada unidad
observada.
Las variables de tipo cualitativo se miden en escalas nominal u ordinal; las variables de tipo cuantitativo
se miden en escalas de intervalo y de razn.
Nominal
Una variable est medida en escala nominal cuando los valores de la variable clasifican a las unidades
estadsticas en iguales o diferentes.
Por ejemplo:
- Sexo:
1 = femenino; 2 = masculino
- Estado civil:
1 = casado; 2 = soltero; 3 = viudo; 4 = otro
- Especialidad de un alumno de Psicologa: social = 1; educacional = 2; clnica = 3
Ordinal
Una escala ordinal es una escala nominal cuyos valores reflejan el orden existente entre los valores de
la variable, segn el mayor o menor grado en el que se encuentre presente la caracterstica.
Por ejemplo:
- Escala de pagos de un alumno de la PUCP: 1, 2, 3, 4, 5
- Grado de instruccin: 1 = primaria completa; 2 = secundaria completa; 3 = superior completa
- Grado de satisfaccin de un cliente: 1 = muy insatisfecho; 2 = insatisfecho; 3 = satisfecho; 4 = muy
satisfecho.
Notas
12
Intervalo
Una escala de intervalo es una escala ordinal en la que, adems, las diferencias entre los valores asignados proporcionan informacin acerca de la diferencia en el grado en que se presenta la caracterstica
observada.
Esta escala no tiene un cero real sino un cero relativo, definido arbitrariamente y que no indica ausencia de la caracterstica medida.
Por ejemplo:
- Temperatura, en grados centgrados.
Razn
Es una escala de intervalos en la que adems los nmeros asignados representan las cantidades de la
caracterstica que se mide.
La proporcin entre dos nmeros corresponde a la misma proporcin entre las cantidades de la caracterstica medida.
El cero es real e indica ausencia total de la caracterstica que mide la variable.
Por ejemplo:
- Sueldo bruto mensual, en nuevos soles, de los empleados de una empresa.
- Tiempo, en minutos, que tarda un alumno en terminar una prueba de agilidad mental.
- Peso, en kilogramos, de una persona.
- Velocidad, en metros por segundo.
- Velocidad, en Km por hora.
- Productividad del mes, en piezas producidas en un mes.
Notas
13
Estadstica EEGGLL
Ejercicio 16
Indique el tipo y la escala de medicin adecuada para las siguientes variables.
Variable
Cdigo de una alumna o alumno de la PUCP
Costo de una licencia del software SPSS
Nmero de aplicaciones en un celular
Material de una tubera (cobre, pvc, etc.)
Ao de nacimiento de una persona
Facultad (Letras y CCHH; Ciencias Sociales,
Derecho, Gestin y Alta Direccin, otras)
Nota en la primera prctica de Estadstica
Nmero de telfono
Acceso a Internet en casa (s, no)
Notas
Tipo de variable
Escala de medicin
14
Frecuencias simples
La frecuencia absoluta ni de una clase es la cantidad de datos que pertenecen a esa clase.
La frecuencia relativa fi de una clase es la proporcin de datos que pertenecen a esa clase.
frecuencia relativa fi
La frecuencia porcentual pi de una clase es el porcentaje de datos que pertenecen a esa clase.
Ejercicio 17
Distribucin de visitantes extranjeros al Per, segn zona geogrfica, 2012
Zona geogrfica
Sudamrica
Porcentaje
2 590 766
74,29%
Norteamrica
459 413
13,17%
Europa
294 440
8,44%
Centroamrica
138 654
3,98%
797
0,023%
79
0,002%
184
0,005%
3 013
0,086%
Asia
frica
Oceana
Otros
Total
3 487 346
Notas
15
Estadstica EEGGLL
Ejercicio 18
La empresa IGK tom una muestra de personas y les pregunt por su bebida gaseosa preferida. Los
resultados se muestran a continuacin. Construya la distribucin de frecuencias de la variable en estudio.
Inca Kola
Kola Real
Kola Real
Inca Kola
Inca Kola
Otras
Kola Real
Kola Real
Coca Cola
Coca Cola
Coca Cola
Inca Kola
Sprite
Otras
Inca Kola
Coca Cola
Inca Kola
Inca Kola
Kola Real
Inca Kola
Inca Kola
Sprite
Inca Kola
Coca Cola
Coca Cola
Kola Real
Inca Kola
Inca Kola
Coca Cola
Inca Kola
Sprite
Inca Kola
Otras
Coca Cola
Inca Kola
Coca Cola
Otras
Kola Real
Inca Kola
Sprite
Kola Real
Coca Cola
Coca Cola
Kola Real
Coca Cola
Distribucin de .
Marca de gaseosa
ni : Nmero de personas
Total
Fuente: .....
Frecuencias acumuladas
Dado un conjunto de n datos cuantitativos, organizados en k clases, se define:
- La frecuencia acumulada absoluta Ni de una clase es la cantidad de datos que pertenecen hasta
esa clase.
Se tiene que:
Ni
n ,
j
i 1, 2,..., k
j 1
Luego,
N1 n1
Ni Ni 1 ni , i 2, 3,...,k
- La frecuencia acumulada relativa Fi de una clase es la proporcin de datos que pertenecen hasta
esa clase.
frecuencia absolutaacumuladai Ni
frecuencia relativa acumuladaFi
Notas
16
Ejercicio 19
Los siguientes datos muestran el nmero de veces que fueron al cine el ltimo mes un grupo de alumnos de Estudios Generales Letras.
2
1
3
0
4
0
0 0
2 1
8
1
1
2
0
0
5
4
3 2
3 5
1
3
2
5
2
1
3
4
2
1
1
4
2
0
1
2
4
1
3
5
4
1
0
2
1
2
0
0
0
0
2
0
2
2
3 4
2 0
ni: Nmero de
alumnos
pi: Porcentaje de
alumnos
Total
Notas
Pi: Porcentaje
acumulado de
alumnos
17
Estadstica EEGGLL
Fuente: Globocan
Notas
18
Ejercicio 20
Los siguientes datos muestran el nmero de veces que fueron al cine el ltimo mes un grupo de alumnos de Estudios Generales Letras.
2
1
3
0
4
0
0 0
2 1
8
1
1
2
0
0
5
4
3 2
3 5
1
3
2
5
2
1
3
4
Notas
2
1
1
4
2
0
1
2
4
1
3
5
4
1
0
2
1
2
0
0
0
0
2
0
2
2
3 4
2 0
Estadstica EEGGLL
19
Cantidad de clases: k
Se recomienda usar entre 5 y 20 intervalos o clases.
La idea es emplear suficientes clases para mostrar la variacin de los datos, pero no tantas que varias
contendran muy pocos o ningn elemento.
Hay algunas reglas que sugieren el nmero de clases o intervalos que se deben usar que dependen del
nmero de datos disponibles, sin embargo en la prctica la decisin generalmente se toma atendiendo
a una necesidad especfica o por experiencia.
k
k
k
La amplitud se aproxima por exceso de acuerdo con la cantidad de decimales que tienen los datos o
segn la precisin con que se desea trabajar.
Se usa la aproximacin por exceso para asegurar que el mayor de los datos pertenezca a alguna de las
clases.
Amplitud
Marca de clase
La marca de clase es el punto medio de cada intervalo. Se obtiene calculando la semisuma de los lmites
de cada intervalo o clase.
La marca de clase se considera un valor que representa a cada uno de los datos que pertenecen al
intervalo o clase correspondiente. Por eso es importante que los intervalos no sean demasiado grandes
porque la marca de clase no sera un buen representante, ni demasiado pequeos como para complicar la construccin de la tabla o para que hayan varias clases sin datos.
La marca de clase de la clase i se denota mi.
Notas
20
Ejemplo 2
Construya una distribucin de frecuencias de siete intervalos o clases para los siguientes datos que
representan los tiempos (en minutos), que demoraron 48 alumnos en resolver una prueba.
8,8
8,9
12,7
8,7
12,4
8,4
10,2
9,6
10,5
10,3
10,1
10,9
8,2
9,6
11,9
11,7
9,7
9,9
7,8
9,6
9,5
9,8
11,3
10,7
11,1
10,9
12,6
8,9
9,8
10,8
9,3
9,5
8,6
8,3
12,0
9,2
8,2
10,9
8,5
9,0
12,4
9,6
9,2
9,3
10,0
8,5
9,4
9,8
Solucin
El rango R se calcula con:
R = dato mximo dato mnimo = xmax xmin = 12,7 - 7,8 = 4,9
De acuerdo a lo indicado, el nmero de clases o intervalos a usar es k = 7.
La amplitud de cada intervalo es:
R 4 ,9
0,7
k
7
En el curso usaremos intervalos abiertos a la izquierda, pero tambin puede usarse intervalos abiertos
a la derecha. Los intervalos o clases para los datos de este ejemplo son:
I1: [xmin
; xmin + A] = [7,8 ; 7,8 + 0,7] = [7,8 ; 8,5]
I2: ]xmin +A ; xmin + 2A] = ]8,5 ; 9,2]
...
I7: ]xmin + 6A ; xmin + 7A] = ]12,0 ; 12,7]
A
Ttulo: _____________________________________________________________________________
Tiempo (min.)
Marca de clase
(mi)
ni: Nmero
de alumnos
fi: Proporcin
de alumnos
Ni: Nmero
acumulado
de alumnos
Fi: Proporcin
acumulada de
alumnos
[7,8
8,5]
8,15
0,1458
0,1458
]8,5
9,2]
8,85
0,1667
15
0,3125
]9,2
9,9]
9,55
14
0,2917
29
0,6042
]9,9
10,6]
10,25
0,1042
34
0,7083
]10,6
11,3]
10,95
0,1458
41
0,8542
]11,3
12,0]
11,65
0,0625
44
0,9167
]12,0
12,7]
12,35
0,0833
48
1,0000
Distribucin de frecuencias por intervalos para datos de una variable cuantitativa discretas
Si los datos que se quiere organizar en una distribucin de frecuencias corresponden a mediciones de
una variable discreta pero se han observado muchos valores diferentes, entonces tambin podemos
utilizar una distribucin de frecuencias por intervalos para facilitar el anlisis de estos datos.
Notas
21
Estadstica EEGGLL
Ejercicio 21
La manzana delicia (manzana Red Delicious), tiene piel o cscara color rojo brillante, pulpa blanquecina,
es algo arenosa y con un sabor algo cido, de esta variedad procede la variedad Royal Red Delicious.
Se ha tomado una muestra de estas manzanas obtenindose los siguientes pesos, en gramos.
130
158
163
166
168
170
171
174
178
180
183
185
186
187
189
190
190
192
192
193
193
193
193
194
195
196
198
198
199
203
205
211
214
215
217
218
222
224
226
227
233
235
238
239
305
Construya una distribucin de frecuencias usando seis intervalos para las manzanas de la muestra.
Ttulo: _____________________________________________________________________________
mi
[
]
Total
Interprete el valor de n4
Interprete el valor de p2
Interprete el valor de P3
Interprete el valor de m3
Notas
ni
pi
Ni
Pi
22
mi:
marca de
clase
ni: nmero de
obreros
fi: proporcin de
obreros
Fi: proporcin
acumulada de
obreros
[0;4]
57
0,2780
57
0,2780
]4;8]
78
0,3805
135
0,6585
] 8 ; 12 ]
10
43
0,2098
178
0,8683
] 12 ; 16 ]
14
25
0,1220
203
0,9903
]16 ; 20 ]
18
0,0098
205
Total
205
Histograma
Este grfico se construye a partir de una distribucin de frecuencias por intervalos.
Cada frecuencia de clase se representa trazando un rectngulo, cuya base es el intervalo de clase sobre
el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta, relativa o
porcentual).
Los rectngulos adyacentes se tocan entre s.
Notas
23
Estadstica EEGGLL
Polgono de frecuencias
Es la representacin por medio de una figura poligonal cerrada de una distribucin de frecuencias absolutas, relativas o porcentuales.
Se obtiene uniendo con segmentos de recta los puntos con la marca de clase como abscisa y la correspondiente frecuencia absoluta o relativa como ordenada.
Los polgonos de frecuencias se cierran en los puntos del eje horizontal correspondientes al lmite inferior del primer intervalo y al lmite superior del ltimo intervalo.
Ojiva
Es la grfica de una distribucin de frecuencias acumuladas (absolutas, relativas o porcentuales).
La ojiva parte del punto que tiene al lmite inferior del primer intervalo como abscisa y a cero como
ordenada.
Se obtiene uniendo con segmentos de recta los puntos con el lmite superior de cada intervalo como
abscisa y la frecuencia acumulada respectiva como ordenada.
Con la ojiva se puede estimar el nmero o porcentaje aproximado de observaciones que corresponden
a un intervalo determinado.
Porcentaje acumulado
80%
86.63%
60%
65.85%
27.80%
40%
20%
0%
0
12
16
Notas
20
24
Ejercicio 22
La anchoveta es el pez ms importante del ecosistema de la Corriente de Humboldt. Su abundancia ha
permitido el desarrollo y sustento de muchas otras especies de peces, aves, mamferos e invertebrados
que hoy en da habitan en nuestro mar. Una muestra de 250 anchovetas de un ao de edad ha dado
una longitud mnima de 6 cm. Los datos se muestran organizados en la tabla siguiente.
Complete la distribucin de frecuencias por intervalos de las longitudes de las anchovetas.
Ttulo: _______________________________________________________________________
Tamao
(centmetros)
mi:
Marca de clase
ni:
fi:
Ni:
Fi:
0,10
65
180
30
0,96
17
0,04
Total
Notas
Estadstica EEGGLL
25
Determine, aproximadamente, la longitud mnima que debera tener una de estas anchovetas para
estar considerada dentro de las 10% ms grandes.
Notas
26
Cero hijos
298,985
284,650
285,732
283,045
247,888
231,839
216,999
193,952
2,043,090
Total
300,013
285,812
288,104
288,948
261,744
258,998
262,093
257,636
2,203,348
El .% de .
Notas
Estadstica EEGGLL
27
Tomado de http://elpais.com/elpais/2015/06/28/actualidad/1435483359_779060.html
Notas
28
Notas
29
Estadstica EEGGLL
Ejercicio 24
En el II Censo Nacional Universitario del ao 2010 realizado por el INEI se pregunt a los alumnos de
pregrado de todo el Per por su tipo de universidad y su gnero. Los datos se muestran en el siguiente
cuadro.
Per. Distribucin de alumnos censados en pregrado por gnero y tipo de universidad. 2010
Gnero
Pblica
Privada
Total
Femenino
135 082
247 743
382 825
Masculino
174 093
226 052
400 145
309 175
473 795
782 970
Total
b) Elabore un grfico que permita ver la composicin porcentual por gnero y tipo de universidad.
Ttulo ....
Gnero
Pblica
Privada
Total
Femenino
Masculino
Total
100%
Fuente:
Ttulo ....
Notas
30
c) Elabore un grfico que permita ver la composicin porcentual segn tipo de universidad por gnero.
Ttulo ....
Gnero
Pblica
Privada
Total
Femenino
100%
Masculino
100%
Ttulo ....
d) Elabore un grfico apilado al 100% que permita ver la composicin porcentual segn gnero por
tipo de universidad.
Ttulo ....
Gnero
Pblica
Privada
100%
100%
Femenino
Masculino
Total
Ttulo ....
Parece haber relacin entre el gnero del estudiante y el tipo de universidad en que estudia?
Notas
Estadstica EEGGLL
31
Cuartil
Se denomina as a cada uno de los tres percentiles: P25, P50, P75 y se les denota como Q1, Q2 y Q3 respectivamente.
Quintil
Se denomina as a cada uno de los cuatro percentiles: P20, P40, P60, P80 y se les denota como Q1, Q2, Q3,
Q4 respectivamente.
Decil
Se denomina as a cada uno de los diez percentiles: P10, P20, y P90 y se les denota como D1, D2 , , D10
respectivamente.
Ejemplo 3
La Encuesta de Caracterizacin Socioeconmica Nacional, Casen, en Chile, es realizada con el objetivo
de disponer de informacin que permita conocer peridicamente la situacin de los hogares.
Por ejemplo: una familia compuesta por cinco personas (padre, madre y tres hijos), si el padre tiene
ingresos de $400.000 mensuales y la madre de $350.000, el clculo sera as: ($400.000+$350.000)/5
= $150.000, la familia estara en el decil 5.
Ejercicio 25
En los ltimos 150 aos, los holandeses han pasado a ser los habitantes ms altos del mundo, y segn
los expertos siguen creciendo. El estudio de la altura de los holandeses a lo largo de los siglos ofrece
un panorama sobre la salud y riqueza de la nacin. No siempre fue as, en 1848, uno de cada cuatro
varones era rechazado del servicio militar porque no alcanzaba la estatura de 1,57 metro. Actualmente, el percentil 1 de la estatura de los varones holandeses es 1,57 metro y el percentil 70 es 1,88
metro. Indique el significado de estos percentiles. Fuente http://www.ap.org/ Associated Press.
Notas
32
x1 x2 x3 xn
Si el valor calculado de i no
es entero, el percentil ksimo Pk es el dato xi+1 que
tiene la posicin inmediata
superior a i.
Ejercicio 26
Dadas las siguientes edades de una muestra de personas asistentes al Tnel de la Ciencia, calcule e
interprete el percentil 30 y el percentil 50.
10
12
15
14
25
19
10
14
12
18
13
11
15
13
15
16
14
13
15
Ejercicio 27
En la tabla siguiente se muestra la distribucin de los trabajadores de una empresa segn el nmero de
tardanzas en el mes pasado. Calcule e interprete el percentil 30 y el percentil 75.
xi : Nmero de
tardanzas
0
48
80
57
15
Total
Notas
Fi :
33
Estadstica EEGGLL
A k
A nk
Fi 1 Li
Ni 1
fi 100
ni 100
donde:
Li = lmite inferior del intervalo que contiene al percentil k
fi = frecuencia relativa del intervalo que contiene al percentil k
Fi-1 =Frecuencia relativa acumulada del intervalo anterior al que contiene al percentil k
A = Amplitud del intervalo.
Para deducir la frmula para percentiles de datos agrupados en intervalos, podemos establecer una
semejanza de tringulos usando la ojiva de frecuencias relativas acumuladas.
Ui Li
F F
i i 1
k
Pk Li
Fi 1
100
k
Pk Li
Fi 1
100
Despejando se obtiene la frmula del percentil k.
Pk Li
Cuartiles
Primer cuartil:
Segundo cuartil:
Tercer cuartil:
Notas
Q1 = P25
Q2 = P50
Q3 = P75
A k
Fi 1
fi 100
34
Ejercicio 28
Segn la definicin oficial de la Organizacin Meteorolgica Mundial, la lluvia es la precipitacin de
agua en forma de gotas, cuando stas alcanzan un dimetro superior a los 0,5 mm. La cantidad de
lluvia que cae en un lugar se mide con pluvimetros. La intensidad de la precipitacin es medida en
milmetros por hora (mm/h), es decir, la altura medida en milmetros, del agua cada en una hora en
una superficie plana de 1 m2.
Las lluvias se categorizan en:
En la ciudad A se realizaron 120 mediciones de una hora de la cantidad de lluvia, en una muestra de
120 das del ao pasado, obtenindose los siguientes resultados.
Ciudad A: Distribucin de precipitaciones segn su intensidad (en mm/h)
Intensidad (mm/h)
mi: marca de
clase
Ni:
Fi:
[0
16]
30
0,2500
30
0,2500
]16
32]
24
55
0,4583
85
0,7083
]32
48]
40
21
0,1750
106
0,8833
]48
64]
56
0,0750
115
0,9583
]64
80]
72
0,0417
120
1,0000
b. Calcule la cantidad de precipitacin mxima para estar en el 15% de las precipitaciones ms bajas
de las 120 medidas.
Notas
Estadstica EEGGLL
35
c. Calcule la cantidad de precipitacin mnima para estar en el 15% de las precipitaciones ms altas
de las 120 medidas.
d. Calcule el porcentaje de mediciones que fueron clasificadas como lluvia dbil o moderada.
e. Calcule el porcentaje de mediciones que fueron clasificadas como lluvia fuerte o muy fuerte.
Notas
36
Moda
Mediana
Media
Media
ponderada
Media
gemetrica
Media
armnica
Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia.
Caractersticas de la moda
- La moda se puede calcular para datos medidos en cualquier escala de medicin.
- El valor de la moda no se ve afectado por valores extremos.
- La moda no siempre es un valor nico. Una serie de datos puede tener dos modas (bimodal) o ms
modas (multimodal).
Notas
37
Estadstica EEGGLL
Ejercicio 30
Calcule e interprete la moda de los siguientes datos, que representa el nmero de artculos comprados
por 14 clientes de cierto supermercado.
2
Calcule e interprete la moda de los siguientes datos, que representa el nmero de artculos comprados
por 14 clientes de cierto supermercado.
2
80
80
Ejercicio 31
En la empresa A, se midi el nmero de errores por da que cometieron 158 obreros al ensamblar un
determinado producto. Calcule e interprete la moda del nmero de errores por obrero.
Empresa A. Distribucin de obreros por el nmero de errores al ensamblar el producto
xi : Nmero de errores
ni : Nmero de obreros
25
45
60
28
Notas
38
Mediana
Es el percentil 50, tambin llamado segundo cuartil.
Caractersticas de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razn.
La mediana es un estadstico que no se ve afectado por valores extremos. Por eso se le utiliza cuando
hay datos inusuales o el polgono de frecuencias no es muy simtrico.
Ejercicio 32
El tiempo, en horas, que se tarda un grupo de obreros, capacitados y no capacitados, en realizar una
tarea se muestra en la siguiente tabla.
Capacitados
4,5
4,3
2,7
8,2
8,3
6,4
5,4
No capacitados
8,3
7,4
8,5
8,5
9,0
8,4
18
3,4
2,7
5,6
Calcule e interprete la mediana del tiempo para cada grupo. Compare los valores hallados y comente.
Notas
39
Estadstica EEGGLL
Ejercicio 33
En la empresa A se tom una muestra aleatoria de 560 trabajadores y se les pregunt por su ingreso
mensual, en dlares, obtenindose los siguientes resultados.
Distribucin de trabajadores por sus ingresos mensuales (en dlares)
mi: Marca de
clase
275
275
275
325
325
325
ni
fi
Ni
Fi
30
77170000
0,1339
190
130
22500
25
Notas
40
Media aritmtica
La media aritmtica es el valor que se obtiene al dividir la suma total de los datos entre el nmero de
datos.
Caractersticas de la media
- Se puede calcular para datos medidos en escala de intervalo o razn.
- El clculo de la media es sencillo y es la medida de tendencia central ms conocida.
- El valor de la media depende de todos los datos, por lo que la presencia de valores muy grandes o
muy pequeos con respecto a los dems pueden cambiar drsticamente su valor.
nx
i 1
n
x x 0
i
i 1
Si decide fijar el precio de venta aumentando un 10% sobre el costo de cada computadora ms un
monto fijo de 50 dlares, cul sera el precio medio de venta de las computadoras?
Notas
41
Estadstica EEGGLL
i 1
Ejercicio 35
Calcule la media de los siguientes datos que representan el nmero de papeletas pendientes de pago
de cada uno de 11 choferes de vehculos de transporte pblico seleccionados al azar.
12
13
25
20
17
19
15
14
28
Media aritmtica para datos en una distribucin de frecuencias para variable discreta
Sean x1, x2,, xk los valores observados de una variable discreta X con frecuencias absolutas respectivas
n1, n2,, nk. La media aritmtica de estos datos es:
k
x n
i i
i 1
x f
i i
i 1
Ejercicio 36
En la empresa A, se midi el nmero de errores que cometieron 158 obreros al ensamblar un determinado producto. Calcule la media del nmero de errores por obrero.
Empresa A. Nmero de errores al ensamblar un producto
xi: Nmero de errores ni: Nmero de obreros
0
25
45
60
28
Notas
42
m n
i i
i 1
m f
i i
i 1
Ejercicio 37
En el distrito A se tom una muestra aleatoria de jvenes y se les pregunt por su estatura, en centmetros, obtenindose los siguientes resultados.
Distrito A. Distribucin de una muestra de 800 jvenes segn estatura
mi:
150
ni:
fi:
Ni:
Fi:
166
0,48
0,32
0,95
800
Complete la tabla de distribucin de frecuencias y calcule la estatura media para la muestra de jvenes.
Ejercicio 38
En los reportes estadsticos de una empresa, correspondientes al perodo de los ltimos 100 das, se
lee la siguiente informacin sobre el nmero de facturas diarias emitidas por la empresa en dicho perodo.
Notas
Nmero de facturas
Proporcin de das
[30 ; 60]
0,25
]60 ; 90]
0,40
]90 ; 120]
0,20
]120 ; 150]
0,10
]150 ; 180]
0,05
43
Estadstica EEGGLL
Calcule el valor aproximado de la media y la mediana del nmero de facturas diarias emitidas por la
empresa en dicho perodo, compare los valores y comente cul le parece ms adecuado para representar este conjunto de datos.
Calcule aproximadamente el porcentaje de das en los que fueron emitidas ms facturas que la media.
w x
i
xp
i i
n
i 1
Notas
44
Tomado de http://gastronomiaycia.republica.com/2010/08/06/manzanas-tamano-xl/
Ejercicio 40
Calcule la media, mediana y moda de los siguientes grupos de datos:
Grupo 1
1
-20
30
Grupo 2
Grupo 3
Varianza (s2)
Dados n datos cuantitativos x1, x2,, xn la varianza de los datos se define como la media de las distancias
al cuadrado de cada dato a la media aritmtica.
n
s2
i 1
x 2
x
i 1
2
i
x2
Notas
45
Estadstica EEGGLL
Ejemplo 5
Las notas de cuatro alumnos son x1 = 6, x2 = 11, x3 = 15, x4 = 16.
6 11 15 16
Luego la media aritmtica de las notas es x
12 puntos
4
Las diferencias o desvos de cada dato con respecto a la media son d1 = 6 12 = -6, d2 = 11 - 12 = -1, d3
= 15 - 12 = 3, d4 = 16 - 12 = 4.
(6)2 (1)2 32 4 2
3,937 puntos.
4
Ejercicio 41
Calcule e interprete la media y la desviacin estndar de los siguientes datos que representan el nmero de personas atendidas por da en la caseta de informacin de un proyecto inmobiliario, en una
muestra de 15 das.
18
10
11
n x
i
x 2
i 1
f x
i
x 2
i 1
Ejercicio 42
Calcule la desviacin estndar de los siguientes datos que representan el nmero artculos defectuosos
encontrados en cada uno de 122 lotes recibidos la semana pasada. Cada lote tiene 1000 artculos.
Notas
58
26
10
30
46
n m
i
i 1
x 2
f m
i
x 2
i 1
Ejercicio 43
Calcule la media y la desviacin estndar de los siguientes datos que corresponden a los pesos de los
equipajes de los pasajeros de un vuelo Lima - Arequipa
Peso (kg.)
[10,0
Marca de clase
]
17,5
75
56
10
Ejercicio 44
En una muestra de ferreteras se ha registrado el precio de las varillas de acero de 12 mm, encontrndose un precio medio de 19,80 nuevos soles y una desviacin estndar de 0,85 nuevos soles.
Si los precios se redujeran en un 5% en todas las tiendas, calcule el nuevo precio medio y la nueva
desviacin estndar de los precios.
Notas
47
Estadstica EEGGLL
Coeficiente de variacin
El coeficiente de variacin (CV) de un conjunto de datos indica qu proporcin de la media es la desviacin estndar.
El coeficiente de variacin se determina calculando el cociente de la desviacin estndar de los datos
entre la media de los datos
sx
x
Es til al comparar la variabilidad de dos o ms series de datos que se miden en distintas o iguales
unidades, pero difieren a tal punto que una comparacin directa de las respectivas desviaciones estndar no es muy til, por ejemplo, cuando las medias estn muy distantes.
Un valor mayor del coeficiente de variacin indica mayor dispersin del conjunto de datos.
CV
Ejercicio 45
En una tienda, el precio medio y la desviacin estndar del precio de los jeans es de 74 y 15,4 nuevos
soles, respectivamente. Si se rebaja 10 nuevos soles a todos los precios, calcule e interprete el nuevo
coeficiente de variacin de los precios. Despus del descuento, los precios de los jeans son ms homogneos que antes?
Ejercicio 46
El coeficiente de variacin de los salarios un grupo de trabajadores es 0,12. Si se aprueba un aumento
del 20% ms una bonificacin especial de S/.115, el nuevo coeficiente de variacin ser igual a 0,06.
Determine el valor de la media y la varianza de los salarios de los obreros, antes y despus del aumento.
Notas
48
Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados se define como:
R = dato mximo dato mnimo
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Rango intercuartil = RIC = Q3 Q1= P75 P25
Notas
Estadstica EEGGLL
49
Diagrama de cajas
Es una grfica que describe la distribucin de un conjunto de datos tomando como referencia los valores de los cuartiles como medidas de posicin, la mediana como medida de tendencia central y el
valor del rango intercuartil como medida de dispersin. Adems, permite apreciar la forma de la distribucin de los datos (simtrica o asimtrica).
Dato atpico
Es un dato inusualmente grande o pequeo con respecto a los otros datos. Se considera un dato atpico
a cualquier dato que est:
- a ms de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil
- a ms de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil.
Notas
50
Ejercicio 47
Se desea comparar los resultados de la primera prctica en tres horarios de Estadstica de EEGGLL,
para lo cual se ha registrado las notas de una muestra de alumnos de cada horario.
H1 0 2 3 11 11 11 12 12 12 12 12 12 12 13 13 13 14 14 15 15 15 15 15 15 15 20
H2 11 11 11 12 12 12 13 14 14 14 14 14 15 15 16 16 16 16 16 17 17 18 18 18 18
H3 0 1 8 8 8 9 10 10 11 11 12 12 13 13 13 14 15 15 16 16 16 17 17 17
Construya un diagrama de cajas que permita comparar las distribuciones de notas en los tres horarios.
Ttulo: .
Notas
51
Estadstica EEGGLL
Puntuacin estandarizada Z
Si los datos son x1 x2, . , xn entonces los datos estandarizados son:
zi
xi x
sx
i = 1, 2,, n
Ejercicio 48
Un conjunto de alumnos rindi dos exmenes. En el primer examen, la nota media fue 13,4 y la desviacin estndar de 2,3, mientras que en el segundo examen la nota media fue 15,4 y la desviacin
estndar 4,3. Una persona obtuvo 14 en el primer examen y 16 en el segundo examen. En trminos
relativos a los resultados de los exmenes, en cul de ellos la nota fue mejor?
Notas
52
As 3
sx
Ejercicio 49
El salario, en cientos de nuevos soles, de los trabajadores una empresa se presenta a continuacin:
25
14
19
14
15
16
15
15
18
15
Notas
52
24
36
15
15
23
24
53
Estadstica EEGGLL
Ejercicio 50
El siguiente cuadro muestra la distribucin del sueldo mensual de los empleados de dos empresas A y
B en julio del 2015.
Empresas A y B. Sueldos mensuales en julio del 2015
Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[1 500 2 500]
]2 500 3 500]
40
]3 500 4 500]
12
25
]4 500 5 500]
]5 500 6 500]
a) En un solo grfico muestre los dos polgonos de frecuencias para los sueldos de los trabajadores de
las empresas A y B. Comente comparativamente las distribuciones de los sueldos mensuales.
b) Calcule la media, desviacin estndar y coeficiente de variacin de los sueldos para los trabajadores
de las empresas A y B. En cul de las dos empresas los sueldos son ms homogneos?
c) Compare la simetra de las distribuciones de los sueldos en las empresa A y B grficamente (use el
grfico de la parte a) y usando el coeficiente de asimetra de Pearson. Comente.
Notas
54
Ejercicios
1.
Un auditor, luego de revisar las declaraciones juradas de impuesto a la renta de 50 personas naturales, hace un informe de los montos omitidos. El informe lo presenta con una distribucin de
frecuencias de 6 intervalos de la misma longitud. Los montos omitidos varan de 0 soles a 3000
soles, y las frecuencias acumuladas del primero al sexto intervalo son respectivamente: 5, 15, 35,
43, 48, 50.
a. Encuentre e interprete la mediana y el coeficiente de variacin.
b. Halle el porcentaje de declaraciones en las que el monto omitido supera la media.
2.
3.
Tiempo (minutos) [0 - 6] ]6 - 12] ]12 - 18] ]18 - 24] ]24 - 30] ]30 - 36] ]36 - 42] ]42 - 48] ]48 - 54] ]54 - 60]
Nmero de radios
17
10
14
a. Calcule e interprete el coeficiente de variacin del tiempo dedicado a los avisos comerciales.
b. Halle e interprete los cuartiles de la distribucin.
c. Grafique el histograma, el polgono de frecuencias y la ojiva de la distribucin. Comente la
simetra de la distribucin de tiempos.
4.
Los salarios que ofrece una empresa a los practicantes varan entre $180 y $300. Si los salarios se
agrupan en cuatro intervalos de clase de longitudes iguales de manera que el 40% de los practicantes tienen salarios menores o iguales que $225, el 80% tienen salarios menores o iguales que
$255 y el 15% tiene salarios mayores que $262,50.
a. Hallar el porcentaje de practicantes en cada intervalo.
b. Si el ingreso mnimo se fija en $265 y la empresa aumenta una misma cantidad a todos los
practicantes de modo que el 25% supere el ingreso mnimo, cunto sera el aumento?
5.
El porcentaje de grasa corporal es el mtodo ms fiable para establecer el peso ideal de una persona pero es el ms difcil y complicado de medir. En un grupo de hombres adultos se midi el
porcentaje de grasa corporal obteniendo la tabla siguiente.
Porcentaje de grasa [ 3 , 7 ] ]7 , 11] ]11,15] ]15,19] ]19,23] ]23,27]
Frecuencia absoluta
16
66
44
60
10
55
Estadstica EEGGLL
d. Se considera que un hombre tiene sobrepeso si tiene un porcentaje de grasa corporal mayor
a 18%. Qu porcentaje de entrevistados tuvo sobrepeso?
6.
La anchoveta es el pez ms importante del ecosistema de la Corriente de Humboldt. Su abundancia ha permitido el desarrollo y sustento de muchas otras especies de peces, aves, mamferos e
invertebrados que hoy en da habitan en nuestro mar. Una muestra de 250 anchovetas de un ao
de edad ha dado una longitud media de 11,24 cm. Los datos se muestran en la tabla.
Tamao (centmetros)
Marca de
clase
Frecuencia
absoluta
Frecuencia
relativa
Frecuencia absoluta
acumulada
Frecuencia relativa
acumulada
0,10
65
180
30
0,96
17
0,04
El porcentaje de germinacin es uno de los principales factores para decidir la calidad de las semillas. Un fabricante afirma que el porcentaje de germinacin de sus semillas de maz es del 85%.
Para verificar tal afirmacin, una cooperativa de agricultores seleccion 120 muestras de 100 semillas cada una y anot el porcentaje de germinacin en cada muestra. Los valores observados
se organizaron en la siguiente tabla.
Germinacin
(%)
Frecuencia absoluta
Frecuencia relativa
[ 70 ; ]
Frecuencia absoluta
acumulada
10
0,20
0,70
22
] ; 95 ]
2
En dos ros de determinada regin se han soltado cras de truchas marcadas y se han recogido
muestras de las mismas despus de cierto periodo de tiempo. Se ha medido el peso (en gramos)
de esos ejemplares resultando la tabla siguiente:
Notas
56
[0 , 50]
14
11
]50 , 100]
31
23
]100, 150]
25
29
]150, 200]
18
22
]200, 250]
12
15
En los reportes estadsticos de una empresa, correspondientes al perodo de los ltimos 100 das,
se lee la siguiente informacin sobre el nmero de facturas diarias emitidas por la empresa en
dicho perodo.
Nmero de facturas
Frecuencia relativa
[30 ; 60]
0,25
]60 ; 90]
0,40
]90 ; 120]
0,20
]120 ; 150]
0,10
]150 ; 180]
0,05
Nmero de obreros
16
24
12
20
9,5
0,14
0,10
0,12
0,23
0,27
0,19
0,26
0,24
0,15
0,13
Notas
57
Estadstica EEGGLL
a. Realizar un grfico que permita llegar al objetivo deseado y realizar dos conclusiones sobre
el grfico.
b. Encontrar, en cada uno de los dos sistemas, el porcentaje de notas que son mayores que su
respectiva media.
12. Los pesos de una muestra de estudiantes se organizan en una distribucin de frecuencias simtrica:
Intervalos
0,96
]60 ; 70]
n = 50
Gnero
Ao de nacimiento
Categora laboral
9534
1966
10
Empleado
27,900
12,750
2041
1960
12
Empleado
26,250
11,550
1187
1952
16
Ejecutivo
41,500
18,750
1842
1980
12
Empleado
24,000
12,750
1813
1960
12
Empleado
27,450
10,200
2519
1979
12
Empleado
23,100
11,250
3338
1985
16
Ejecutivo
37,050
18,000
3012
1973
12
Empleado
24,450
12,450
1056
1980
Empleado
28,350
12,000
2087
1960
19
Directivo
95,000
56,980
1004
1967
12
Empleado
30,900
15,000
6589
1975
12
Empleado
26,700
14,500
1723
1962
20
Directivo
69,250
42,800
2013
1968
16
Directivo
48,200
21,000
1096
1981
12
Empleado
27,900
16,500
2873
1979
16
Ejecutivo
40,350
19,500
a. Clasifique cada una de las variables e indique la escala de medicin adecuada para cada caso.
b. Calcule la moda, la media y la mediana de la variable nivel educativo y comente su simetra.
c. Haga un grfico que permita comparar el rango y los cuartiles de los salarios iniciales de los
hombres y mujeres. Comente el grfico.
Notas
58
14. Se ha encuestado a un grupo de alumnos de una facultad de ingeniera sobre la cantidad de minutos que usan al da la Internet obtenindose los siguientes resultados.
i
Intervalo
fi
[0 ; 18]
0,0548
0,1905
0,2500
0,2857
0,1071
0,0762
0,0357
a. Calcule el tiempo mnimo para estar en el quinto superior de los que usan la Internet.
b. Calcule el porcentaje de alumnos que usan una hora o menos la Internet.
c. Encuentre la media y la varianza del nmero de minutos diarios que usan la Internet.
15. En la siguiente tabla se muestra la distribucin de frecuencias del nmero de hojas impresas por
un grupo de impresoras durante un da:
Intervalo
Marca de clase
[20 ; ]
Frecuencia relativa
0,20
0,45
0,60
125
0,10
1,946
1,957
1,969
1,971
1,973
1,984
1,996
1,997
1,999
2,003
2,013
2,014
2,014
2,015
2,034
2,045
2,066
2,075
2,086
2,088
a. Las especificaciones del proceso de llenado de las botellas establecen que el contenido medio debe estar entre 1,950 y 2,050 litros y que la desviacin estndar del contenido debe ser
menor a 0,050 litros. A partir de los datos de la muestra, dira usted que el proceso cumple
las especificaciones?
b. Determine e interprete el rango y los cuartiles para la muestra de contenidos de gaseosa.
Notas
59
Estadstica EEGGLL
Grifo B
Nmero de galones
Nmero de camiones
Nmero de galones
Nmero de camiones
1 ; 5
10
20
5 ; 9
15
37
9 ; 13
35
20
25
13 ; 17
30
25
10
17 ; 21
20
30
21 ; 25
Empresa A
[10 ; 14]
20
]14 ; 18]
30
]18 ; 22]
15
]22 ; 26]
10
]26 ; 30]
13
14
17
17
18
19
23
23
25
26
26
27
27
30
31
32
32
34
34
Notas
60
19. La ojiva de los ingresos mensuales, en miles de nuevos soles, de una empresa se muestran en el
siguiente grfico.
Ojiva de ingresos mensuales
1
0.9
0.8
0.7
Fi
0.6
0.5
0.4
0.3
0.2
0.1
0
0
1000
2000
3000
4000
5000
6000
7000
8000
Ingresos
Nmero de asistentes
Ingeniera
24
Administracin
Contabilidad
10
Economa
15
Derecho
3
Total
60
a. Construya un grfico que permita observar la composicin porcentual de los asistentes, segn sus profesiones, a la charla informativa. El grfico debe tener un ttulo adecuado.
b. Calcule una medida de tendencia central para la variable cualitativa.
21. Una compaa requiere los servicios de un tcnico especializado. De los expedientes presentados,
se han seleccionado 2 candidatos: A y B, los cuales renen los requisitos mnimos requeridos. Para
decidir cul de los 2 se va a contratar, los miembros del jurado deciden tomarles 7 pruebas. Todas
las pruebas se calificaron utilizando una escala de 0 a 80, donde 80 es el mximo puntaje posible.
Los resultados se dan a continuacin:
Prueba
57
55
54
52
62
55
59
80
40
62
72
46
80
40
Notas
Estadstica EEGGLL
61
Regresin
La regresin encuentra una relacin funcional entre las variables cuantitativas X e Y.
Diagrama de dispersin
Dado un conjunto de n observaciones de las variables cuantitativas X e Y: (x1, y1), (x2, y2),, (xn, yn), el
primer paso para evaluar la posible asociacin entre estas variables es construir una grfica de los
datos en un plano bidimensional. Esta grfica se denomina diagrama de dispersin o scatter plot.
Notas
62
Covarianza
Dada una muestra de n pares de observaciones de las variables cuantitativas X e Y, (x1 , y1), (x2 , y2),,
(xn , yn), la covarianza muestral se define como:
n
cov(X ,Y ) s xy
x
i 1
x y i y
n 1
nx y
n 1
x y
i i
i 1
sxy
sx sy
Este coeficiente de correlacin mide el grado de asociacin lineal que existe entre las variables X e Y.
- El coeficiente de correlacin r es mayor o igual a -1 y menor o igual a 1.
- Si r = 0 entonces indica que no existe una asociacin lineal entre las variables (pero puede existir
otro tipo de asociacin entre ellas).
- Si r se acerca a 1 o a -1 indica que existe una asociacin lineal fuerte entre las variables, directa si r
= 1 e inversa si r = -1.
- |r| = 1 solamente cuando todos los datos observados pertenecen a una recta, es decir, cuando la
asociacin lineal es perfecta.
Observaciones
- Una correlacin alta no indica que una variable dependa de la otra o que sea causa de las variaciones en la otra. La asociacin entre ellas no necesariamente es causal.
- Una correlacin alta indica que el modelo lineal podra ser adecuado para hacer predicciones en el
intervalo de variacin de los datos; fuera de l, el tipo de relacin entre las variables puede cambiar
o no existir.
- Podemos obtener valores de correlacin muy altos si usamos una muestra de dos o tres pares de
datos pero en ese caso es claro que la conclusin acerca de la asociacin entre las variables puede
no ser vlida.
- Diversos grupos de datos pueden tener el mismo coeficiente de correlacin (como se observa en el
grfico siguiente); sin embargo, el tipo de relacin entre las variables es distinta, lo que muestra la
importancia de realizar el diagrama de dispersin. El coeficiente de correlacin slo se debera calcular interpretar para nubes de puntos de tipo franja, ya sea creciente o decreciente.
Notas
63
Estadstica EEGGLL
ei 2
i 1
i 1
i 1
2
yi yi yi a bxi 2
La recta de regresin de mnimos cuadrados de Y sobre X, es L: y = a + bx; sus coeficientes son los
valores a y b que minimizan la suma de los cuadrados de los errores.
Los valores de b y a que minimizan SCE son:
sy
br
a y bx
sx
sxy
sx 2
y y , la media de los valores estimados con la recta es igual a la media de los valores observados.
Prediccin
Para predecir el valor de la variable dependiente para un valor dado de la variable independiente,
basta con reemplazar el valor dado en la frmula de la recta de mnimos cuadrados.
Notas
64
Coeficiente de determinacin
Se puede demostrar que:
sy 2
(y
y )2
i 1
n 1
(y y )
sy 2
i 1
n 1
(e e ) (y
2
se 2
i 1
n 1
i 1
yi )2
n 1
Var(Y)
Var(Y )
58
51
85
35
62
70
98
104
Y: Ventas
208
171
253
126
206
220
275
281
a.
b.
c.
d.
e.
Grafique el diagrama de dispersin, evale si las variables en estudio parecen estar asociadas.
Calcule e interprete el coeficiente de correlacin lineal de Pearson.
Determine la ecuacin de la recta de regresin de las ventas sobre el nmero de comerciales.
Si en una semana se contratan 75 comerciales, estimar las ventas en esa semana.
Calcule e interprete el coeficiente de determinacin.
Notas
65
Estadstica EEGGLL
Solucin
a. El diagrama de dispersin muestra un comportamiento de franja creciente, esto nos sugiere asociacin lineal directa entre las variables.
Ventas semanales
(miles de nuevos soles)
Diagrama de dispersin
300
250
200
150
100
50
0
0
20
40
60
80
100
120
Nmero de comerciales
b. El coeficiente de correlacin es r 0,981, este valor indica una asociacin lineal fuerte y directa
entre el nmero de comerciales contratados por semana y el valor de las ventas semanales.
c. Calculemos los coeficientes de la recta de regresin.
x 70,375 y 217,5 sx 22,242 sy 49,196 sxy 1074,187
Ventas semanales
(en miles de nuevos soles)
y = 2.1712x + 64.699
R = 0.9637
300
250
200
150
100
50
0
0
20
40
60
80
100
120
Nmero de comerciales
d. Si x es igual a 75, entonces, y a b (75) 227,5 ; entonces, en una semana en que se contratan
75 comerciales se estima que el valor de las ventas sera 227 500 soles.
e. El coeficiente de determinacin es R r 2 0,96 96% . La varianza explicada por la recta de regresin es el 96% de la varianza de la variable valor de las ventas semanales. El ajuste de los datos
al modelo lineal es muy bueno.
Notas
66
Ejercicio 51
Las notas siguientes corresponden a la primera prctica de un horario de un curso de Estadstica y la
cantidad de horas dedicadas a estudiar para dicha prctica.
Horas
5,0
6,0
12,0
10,0
8,0
8,5
4,5
5,0
2,0
2,5
4,0
5,0
6,0
3,0
4,0
6,0
12,5
Notas
15
12
17
14
15
15
13
13
10
10
10
14
12
12
13
11
17
a. Grafique el diagrama de dispersin y evale si parece existir relacin lineal entre el tiempo de
estudio y la nota obtenida en el examen de Estadstica.
Estadstica EEGGLL
Notas
67
68
Ejercicios
22. En un estudio para determinar la relacin entre la edad y la presin sangunea en mujeres se tom
una muestra aleatoria de 9 mujeres dando los siguientes resultados:
Edad (aos)
56
41
70
37
63
46
57
50
39
146
125
153
117
151
124
151
142
118
a. Grafique el diagrama de dispersin y evale la posible asociacin entre las variables edad y
presin sangunea.
b. Calcule e interprete el coeficiente de correlacin lineal.
c. Determine la ecuacin de la recta de regresin lineal y estime la presin sangunea de una
mujer de 65 aos.
23. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para
absorber hierro y plomo. A cada participante del estudio se le da una dosis oral idntica de hierro
y plomo. Despus de 12 das se mide la cantidad de cada componente retenida en el sistema
corporal y, a partir de sta, se determina el porcentaje absorbido por el cuerpo. Se obtienen los
siguientes resultados:
Sujeto
a.
b.
c.
Notas
10
Porcentaje de hierro
17
22
35
43
80
85
91
92
96
99
Porcentaje de plomo
17
18
25
58
59
62
65
70
72
Grafique el diagrama de dispersin. Parece haber asociacin entre las variables estudiadas?
Prediga el porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe
el 20% del plomo ingerido. Le parece adecuado un modelo de regresin lineal para hacer
esta prediccin?
Calcule e interprete el coeficiente de determinacin. Considerado el valor calculado, evale
nuevamente su respuesta a la pregunta de la parte b.
69
Estadstica EEGGLL
Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Se le suele simbolizar
como .
Ejercicio 53
Indique, para los siguientes experimentos aleatorios, los respectivos espacios muestrales.
Experimento aleatorio
Lanzar una moneda y anotar lo obtenido en
la cara superior
Registrar el resultado de una partida de ajedrez
Lanzar un dado y anotar el nmero de puntos de la cara superior
Lanzar dos dados y anotar el nmero de
puntos de cada cara superior
Lanzar un dado y anotar lo obtenido hasta
que salga seis
Notas
Espacios muestrales
70
Evento
Es cualquier subconjunto del espacio muestral.
Al realizar un experimento, diremos que el evento A ha ocurrido si el resultado obtenido es un elemento del evento A.
Ejercicio 54
Indique, para cada uno de los siguientes experimentos aleatorios, uno o ms eventos que pertenezcan
a sus respectivos espacios muestrales.
Experimentos aleatorios
Eventos
Tipos de eventos
Evento elemental o simple:
Evento conjunto:
Evento contrario o comple- Formado por todos los elementos del espacio muestral que
mento del evento A (Ac):
no pertenecen a A
Evento imposible:
Probabilidad
Mide la posibilidad de que un evento ocurra cuando se realiza un experimento.
Ejemplo 9
El Aedes aegypti, mosquito que trasmite el zika, de desarrolla en
cualquier recipiente que acumula agua dentro de las casas y en
patios, jardines, balcones y terrazas. Y no as, en charcos, zanjas,
lagos, lagunas o ros.
La Organizacin Mundial de la Salud seala que el virus del zika
podra dispersarse por todo el continente americano. El mosquito Aedes vive en gran parte del planeta, especialmente en los
pases cercanos a la lnea del ecuador.
Aqu un grfico sobre la probabilidad de aparicin en las diversas
zonas del mundo.
Notas
71
Estadstica EEGGLL
Interseccin de eventos
Es el conjunto de los resultados que estn en ambos eventos. Se denota por (A B).
A B {w / w A w B}
A B se expresa como: Ambos eventos, A y B ocurren a la vez.
Complemento de un evento
AC {w / w A }
AC se expresa como: El evento A no ocurre.
Notas
Diferencia de eventos
A B A BC {w / w A w B}
A B se expresa como: Ocurre el evento A pero no el evento B.
Notas
72
73
Estadstica EEGGLL
Ejercicio 55
Una empresaria comprar un hotel y un restaurante. Se definen los eventos:
A:= la empresaria tenga xito en la inversin del hotel
B:= la empresaria tenga xito en la inversin del restaurante
Escriba los siguientes eventos en funcin de los eventos A y B. Adems, grafique dicho evento en un
diagrama de Venn.
Evento
Notacin
A ... B
Diagrama de Venn
Notacin
A1 A2 A3
Notas
Diagrama de Venn
74
Principio de la multiplicacin
Si A y B son eventos finitos, entonces nA B nA nB
Ejercicio 58
Una joven tiene 34 polos, 16 pantalones y 15 pares de zapatos de cuntas maneras diferentes puede
elegir un polo, un pantaln y un par de zapatos para vestirse?
Permutaciones
La cantidad de formas en que se puede ordenar n objetos distinguibles es:
Pn n!
Ejemplo 10
Encontrar de cuntas maneras se puede ordenar en una fila a cuatro alumnos.
Solucin
La cantidad de maneras es P4 4! 24.
Notas
75
Estadstica EEGGLL
Ejercicio 59
Un grupo de doce personas hace cola en un cine para comprar una entrada.
De cuntas maneras diferentes pueden formar la cola las doce personas?
De cuntas maneras diferentes pueden formar la cola, si el ms grande y el ms bajo no tienen que
estar juntos?
n!
n r !
Si n = r, entonces Vnn Pn .
Ejemplo 11
Encontrar de cuntas maneras se pueden ordenar dos de cinco alumnos.
Solucin
La cantidad de maneras es V25
5!
20
5 2!
Ejercicio 60
De un grupo de 12 vecinos de un edificio, se desea escoger a tres personas al azar para que ocupen los
puestos de presidente, tesorero y vocal de la junta de administracin del edificio, respectivamente.
De cuntas maneras diferentes se puede hacer dicha eleccin?
Notas
76
Solucin
La cantidad de maneras es C25
5!
10
2!5 2!
Ejercicio 61
Un grupo de 25 amigos quiere elegir, al azar, a cuatro de ellos para organizar una fiesta. De cuntas
maneras diferentes se puede elegir a dichas personas?
Es decir, P(A)
nA
n
Ejemplo 13
Se lanza un dado, calcular la probabilidad de que salga:
a. un as.
b. un nmero par.
c. un nmero menor que 5.
d. un nmero par y menor que 5.
e. un nmero par o menor que 5.
Notas
77
Estadstica EEGGLL
Solucin
El espacio muestral al lanzar un dado es {1, 2, 3, 4, 5, 6} . La cantidad de elementos del espacio
muestral es n() 6
A {1} ,
n(A) 1
entonces, P(A)
nA 1
n 6
b. B {2,4,6} ,
n(B) 3
entonces, P(B)
nB 3
n 6
C {1,2,3,4} ,
n(C ) 4
entonces, P(C )
nC 4
n 6
d. D B C {2,4} ,
n(D) 2
entonces, P(D)
nD 2
n 6
n(E) 5
entonces, P(E )
nE 5
n 6
a.
c.
e.
E B C {1,2,3,4,6} ,
Ejercicio 62
Una persona realiza una jugada de la Tinka, que es un juego de lotera que consiste en elegir seis nmeros de 45 nmeros posibles. Encontrar la probabilidad de que con un boleto de seis nmeros se
acierte con todos los nmeros seleccionados.
Solucin
Sea el evento A := Ganar la Tinka.
P A
nA
Ejercicio 63
De un mazo de 52 cartas se saca una carta al azar, calcule la probabilidad de que sea 6.
Ejercicio 64
Se lanzan dos dados, calcule la probabilidad de que la suma sea mayor a 6.
Notas
78
Ejercicio 65
Se entrevist a 3500 clientes de una empresa de telefona celular que adquirieron un paquete promocional que permita llamar ilimitadamente a otros dos celulares de la misma empresa durante tres
meses. La siguiente tabla muestra la distribucin de los clientes entrevistados por sexo y por su intencin de renovar el paquete promocional.
Sexo
S renueva
No renueva
Masculino
1 000
900
Femenino
1 200
400
Si se selecciona al azar uno de los clientes entrevistados, calcule la probabilidad de que el cliente seleccionado:
A = Sea mujer
Notas
79
Estadstica EEGGLL
Probabilidad subjetiva
Es la valoracin que hace un individuo de las posibilidades de obtener un resultado, basado en su experiencia, opinin personal y anlisis que l hace de la situacin particular que se evala (estado de
informacin de la persona).
Ejercicio 66
La probabilidad de que el rendimiento de una cierta accin en la Bolsa de Valores de Lima sea mayor
al 10% es
La probabilidad de que Per clasifique para la Copa Mundial del de Ftbol 2018 es .
La probabilidad de que apruebe el curso de Estadstica es .
Propiedades
Sean A y B dos eventos cualesquiera de , se cumple que:
-
P(A) P(AC ) 1
PA B PA PB PA B
A B P(A) P(B)
P A 1
P A B P A P A B
P A P A B P A B C
Ejemplo 14
La probabilidad de que una computadora de un cierto instituto de computacin tenga instalado el
programa A es 0,6 y de que tenga el programa B es 0,5. Si la probabilidad de que tenga instalados los
dos programas es 0,2, calcule la probabilidad de que:
a. tenga alguno de los dos programas.
b. tenga el programa A pero no el B.
c. tenga el programa B pero no el A.
d. tenga slo uno de los dos programas.
e. no tenga ninguno de los dos programas.
Notas
80
Solucin
Sean los eventos A = {Tenga el programa A} y B = {Tenga el programa B}
a. P(A B) P(A) P(B) P(A B) 0,6 0,5 0,2 0,9
b. P(A B) P(A) P(A B) 0,6 0,2 0,4
c.
Ejercicio 67
El anlisis costo-beneficio de la compra de cierta fbrica determin que solo la ocurrencia de alguno
de los eventos A o B ocasionara una inversin desfavorable. Se estima que la probabilidad de que
ocurra el evento A es 10%; la probabilidad de que el evento B ocurra es 5% y la probabilidad de que
ocurran ambos eventos es 2%.
Cul es la probabilidad de que la inversin resulte desfavorable debido nicamente a la ocurrencia
del evento A?
Cuantifique el riesgo que se corre en esta inversin, es decir, la probabilidad de que la compra ocasione
una inversin desfavorable.
Notas
Estadstica EEGGLL
81
Ejercicio 68
La probabilidad que se fracase en el negocio A es de 1/3, que se tenga xito en al menos uno de los
negocios es 5/6 y que se fracase en el negocio B es 1/2. Determine la probabilidad de que solamente
se tenga xito en uno de los negocios.
Ejercicio 69
Una persona escoge seis manzanas al azar de 25 posibles. Si de las 25 manzanas solo hay ocho que
estn jugosas, calcule la probabilidad de que al menos una de las manzanas escogidas por la persona
estn jugosas.
Ejemplo 15
En un estrado se sientan al azar las personas: I , J, K, L y M. Encontrar la probabilidad de que J y K no
se sienten juntos.
Solucin
El evento pedido es A = {J y K no se sienten juntos}.
Luego AC = {J y K se sienten juntos}.
P P
4 ! 2! 3
La probabilidad pedida es P(A) 1 P(A C ) 1 4 2 1
P5
5!
5
Notas
82
Ejemplo 16
En un lote de conservas de atn 12 son de marca nacional y ocho son de marca extranjera. Se escogen
al azar y sin reposicin seis conservas, encontrar la probabilidad de que entre las conservas elegidas:
a. cuatro sean de marca nacional
b. todas sean de marca nacional
c. ninguna sea de marca nacional
d. alguna sea de marca nacional
e. por lo menos cuatro sean de marca nacional
f. a lo ms una sea de marca nacional
Solucin
P A
C412 C28
0,3576
C620
b. P B
C612 C08
0,0238
C620
P C
C012 C68
0,0007
C620
a.
c.
d. PD 1
C012 C68
0,9993
C620
e.
P E
f.
P F
P(A B)
P(B)
PB / PB
Ejercicio 70
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e Informtica se pregunt a todos los peruanos por los servicios de comunicacin con los que contaba su hogar y su rea
de residencia, obtenindose los siguientes resultados:
Notas
Estadstica EEGGLL
83
a. Si se selecciona a un hogar de zona rural, cul es la probabilidad de que tenga algn servicio?
b. Si se selecciona a un hogar de zona urbana, cul es la probabilidad de que cuente con tres servicios por lo menos?
c. Si se selecciona a un hogar que no cuenta con ningn servicio, cul es la probabilidad de que sea
de zona rural?
Notas
84
Ejemplo 17
De las 100 computadoras de una empresa, 60 tienen instalado el programa A y 50 tienen instalado el
programa B. Si 20 tienen instalados los dos programas, encontrar la probabilidad de que una computadora de la empresa tenga instalado el programa B si tiene instalado el programa A.
Solucin
Sean los eventos A y B, definidos como: A:={La computadora tenga instalado el programa A}
B:={La computadora tenga instalado el programa B}
60
50
20
Se tiene que P(A)
, P(B)
, P(A B)
100
100
100
20
P(A B) 100 20
Ejercicio 71
De los adultos de 25 o ms aos empleados en cierto pas, el 90,3% complet la enseanza media y de
ellos, el 30,8% complet la universidad. Calcular la probabilidad de que un adulto empleado de ese
pas, seleccionado al azar, haya completado la enseanza media y tambin la universidad.
Ejemplo 18
En un lote de 50 computadoras hay 20 que son HP. Si se escoge al azar y una por una dos computadoras
del lote, encontrar la probabilidad de que la primera sea HP y la segunda no lo sea.
Solucin
Sean los eventos A y B, definidos como: A:={La primera computadora escogida sea HP}
B:={La segunda computadora escogida no sea HP}
Por dato del problema, afirmamos que PA
20
30
, PB / A
50
49
Notas
20 30
50 49
85
Estadstica EEGGLL
P(Ai ) 0 , (i 1, 2,...,k)
Ai Aj , (i j)
i 1
Teorema de Bayes
Sean los k eventos A1, A2, A3,..., Ak que constituyen una particin del espacio muestral , entonces para
cualquier evento B de se cumple lo siguiente, si P(B) > 0:
P Ai B
P Ai B
PAi PB / Ai
PB
PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak
El teorema de Bayes establece una relacin muy importante en la teora de probabilidades y es la base
para la revisin de la asignacin de probabilidades a la luz de informacin adicional.
Probabilidades a
priori
Informacin
nueva
Teorema de
Bayes
Posibilidades a
posteriori
Ejemplo 19
En una fbrica los discos bluray son producidos por una de tres mquinas: M1, M2, M3. La produccin
diaria de cada mquina es de: 500, 300 y 200 discos, respectivamente. El porcentaje de discos defectuosos producidos por cada mquina es de: 1%, 1,5% y 0,5% respectivamente.
a. Si se escogi un disco producido en la fbrica, calcule la probabilidad de que sea defectuoso.
b. Si el disco escogido es defectuoso, calcule la probabilidad que haya sido producido por M1.
Solucin
Sean los eventos Ei:={El disco es producido por Mi}, (i = 1, 2, 3); D:={El disco es defectuoso}
500
300
200
PE1
0,5 , PE2
0,3 , PE 3
0,2
1 000
1 000
1 000
Adems, se sabe que: PD / E1 0,01, PD / E2 0,015, PD / E3 0,005
a.
PD
i 1
b. PE1 / D
Notas
0,4761
PD
0,0105
86
Ejercicio 72
En una zona de la ciudad, durante las noches de los fines de semana, la polica sabe por experiencia
que el 20% de los conductores ha consumido alcohol, por lo que realiza operativos para detectar a los
conductores que han consumido alcohol. Para realizar las pruebas usan unos dispositivos que detectan
al consumidor de alcohol en el 95% de los casos y que se equivocan al indicar que una persona ha
consumido, cuando en realidad no lo ha hecho en el 3% de los casos.
Estime el porcentaje de conductores para los que el dispositivo da positivo al consumo de alcohol.
Si la persona ha dado positivo para consumo de alcohol, calcule la probabilidad de que en realidad no
haya consumido alcohol.
Ejercicio 73
Un administrador est interesado en determinar si cierta impureza est presente en un producto. Por
estudio de los datos histricos, el administrador estima que la impureza est presente en 20% de estos
productos. Con un experimento de laboratorio se puede evaluar si la impureza est o no presente en
el producto; este experimento tiene una probabilidad de 86% de detectar la impureza cuando esta
est presente y una probabilidad de 8% de indicar que la impureza est presente cuando en realidad
no lo est.
Si acaba de realizarse el experimento y el resultado indica que la impureza est presente en el producto
evaluado, determine la probabilidad de que la impureza est realmente presente en este producto.
Notas
87
Estadstica EEGGLL
PB C PBPC
PA C PAPC
P(A B C) P(A)P(B)P(C)
Notacin
P(A ... B)=
Diagrama de Venn
Notacin
P(A1 A2 A3)=
Diagrama de Venn
88
Solucin
Definamos el evento A = {El as aparece por lo menos una vez}
Definamos los eventos Ai = {El as aparece en el lanzamiento i}, se tiene que P Ai
1
6
Tambin, afirmamos que AiC , i = 1, 2,, n son eventos independientes y que P AiC
Adems, A
Ai por lo que AC
i 1
5
6
C
i
i 1
n
n
5 5
5
5
PA 1 P AC 1 P AiC 1 P A1C P A2C ...P AnC 1 ... 1
6 6
6
6
i 1
Ejemplo 21
Un televidente ve de manera independiente los programas A y B. La probabilidad de que vea el programa A es 0,2 y de que vea el programa B es 0,3, calcule la probabilidad de que:
a. vea los dos programas.
b. no vea ninguno de los dos programas.
c. vea alguno de los dos programas.
d. vea slo el programa A.
e. vea slo el programa B.
f. vea slo uno de los dos programas.
Solucin
Sean los eventos:
A:= {El televidente vea el programa A}
B:= {El televidente vea el programa B}
a.
f.
Notas
Estadstica EEGGLL
89
Ejercicios
24. Tres mquinas producen cierto artculo en cantidades muy grandes, de tal manera que cualquiera
de estos artculos resulta defectuoso independientemente de la mquina que lo haya producido.
La primera mquina produce 2,5% de artculos defectuosos, la segunda 3,1% y la tercera 1,8%. Se
seleccionan al azar tres de estos artculos, el primero producido en la mquina 1, el segundo en
la mquina 2 y el tercero en la mquina 3.
a. Cul es la probabilidad de que al menos uno de los artculos seleccionados de las dos primeras mquinas sea defectuoso?
b. Cul es la probabilidad de que el artculo seleccionado de la tercera mquina sea el segundo
defectuoso?
c. Cul es la probabilidad de que solo uno de los artculos seleccionados sea defectuoso?
25. La probabilidad de que un evento ocurra es p. Si el experimento aleatorio se repite tres veces de
manera independiente, calcule el valor de p que hace mxima la probabilidad de que ocurra el
evento como mximo una vez.
26. Una fbrica de bujas para motores produce un 88% de buenas y un 12% de defectuosas. Antes
de enviarlas a los almacenes para su venta, se someten a un control en la que se admiten como
buenas las que los son con una probabilidad de 0,91 y las que no los son con una probabilidad de
0,04.
a. Calcule la probabilidad de que una buja sea considerada como buena en un control.
b. Si una buja fue considerada como buena en un control, cul es la probabilidad de que sea
realmente buena?
27. Tres tiradores tiran al blanco simultneamente y de manera independiente. Sus probabilidades
de acertar son 50%; 25% y 75% respectivamente. Calcule la probabilidad de que consigan:
a. al menos un acierto.
b. exactamente un acierto.
c. exactamente dos aciertos.
28. En una ciudad el 55% de los habitantes consume pan integral, el 30% consume pan blanco y el
20% consume ambos. Si se selecciona un habitante al azar:
a. Cul es la probabilidad de que solamente coma pan blanco?
b. Cul es la probabilidad de que una persona de esa ciudad no consuma ninguno de los dos
tipos de pan?
c. Sabiendo que el habitante seleccionado consume pan blanco, cul es la probabilidad de que
no consuma pan integral?
29. Si un vehculo se pasa la luz roja en un cruce que se equip con una cmara de vigilancia, hay un
95% de probabilidad de que reciba una multa de trnsito. Si durante las ltimas tres horas cinco
vehculos se han pasado la luz roja en el referido cruce, cul es la probabilidad de que al menos
uno de ellos reciba una multa?
30. Tres personas lanzan un dado cada una. Calcule la probabilidad de que las tres saquen el mismo
nmero.
Notas
90
31. Se estima que slo un 25% de las personas que compran acciones en la Bolsa de Valores tiene
conocimientos burstiles. De los que compran acciones sin conocimientos burstiles, slo un 10%
obtienen beneficios. El 5% de los que compran acciones tiene conocimientos burstiles pero no
obtiene beneficios. Si se elige al azar una persona que ha comprado acciones en la Bolsa de Valores y resulta que ha obtenido beneficios, cul es la probabilidad de que tenga conocimientos
burstiles?
32. El gerente de proyectos de la empresa LUCET est determinando si deba presentar una oferta
para hacerse cargo de la iluminacin de un nuevo centro comercial. En el pasado, el principal
competidor de LUCET, la empresa ILUMIN, ha propuesto ofertas en el 78% de los nuevos proyectos. Si ILUMIN no presenta ofertas para un trabajo, la probabilidad de que LUCET obtenga el trabajo es de 0,62. Si ILUMIN propone una oferta para el trabajo, la probabilidad de que LUCET obtenga el trabajo es de 0,25.
a. Cul es la probabilidad de que LUCET obtenga el trabajo? Con base en este resultado, recomendara usted que la empresa presente una oferta? Por qu?
b. Si la empresa LUCET obtiene el trabajo, cul es la probabilidad de que la empresa ILUMIN
haya propuesto una oferta?
33. Un inversionista que tiene acciones en tres compaas: A, B y C, estima que las probabilidades de
tener utilidades son 0,3; 0,6 y 0,4 respectivamente.
a. Si la probabilidad de que tenga utilidades en A y B es 0,12, cul es la probabilidad de que no
tenga utilidades en B dado que s las tuvo en A?
b. El tener utilidades en A es independiente de no tener utilidades en B?
c. Si hay independencia entre tener utilidades en las compaas, calcular la probabilidad de que
el inversionista tenga utilidades en ms de una de ellas.
34. Segn datos del informe Perfil Sociodemogrfico del Per, publicado por el INEI en:
http://www.inei.gob.pe/Anexos/libro.pdf, el 78,78% de la poblacin censada de 18 o ms aos
vive en rea urbana y el resto en rea rural. En rea urbana, el 97,59% de las personas censadas
de 18 o ms aos cuenta con Documento Nacional de Identidad (DNI), y este porcentaje es del
93,65% en rea rural.
a. Con base en los datos anteriores, calcule el porcentaje de la poblacin censada, de 18 o ms
aos, que no cuenta con DNI.
b. Si se selecciona una persona censada de 18 o ms aos y tiene DNI, cul es la probabilidad
que viva en rea urbana?
35. Los registros de los delitos en una ciudad muestran que 20% de ellos son violentos y 80% son no
violentos. Se seala tambin que son denunciados el 90% de los delitos violentos y solo el 70%
de los delitos no violentos
a. Cul es la proporcin global de delitos que se denuncian en la ciudad?
b. Si no se denuncia un delito ante la polica, cul es la probabilidad de que el delito sea violento?
36. El nico aeropuerto de cierta ciudad cuenta con tres terminales. El terminal A controla el 50% del
trnsito areo, el terminal B controla el 35% y el terminal C el 15%. La probabilidad de de detectar
a un pasajero portando armas de fuego en los terminales A, B y C se estiman en 96%; 95% y 90%,
respectivamente.
Notas
Estadstica EEGGLL
91
a. Cul es la probabilidad de que un pasajero que porte arma de fuego sea detectado en este
aeropuerto?
b. Si un pasajero que portaba un arma de fuego fue detectado, cul es la probabilidad de que
haya sido detectado en el terminal B?
37. De la poblacin de trabajadores de cierta empresa, el 30% han participado en el curso de capacitacin sobre Control Estadstico de Procesos y el 15% han participado en el curso de capacitacin
en Seis Sigma. Se sabe tambin que el 37% de los trabajadores han participado en al menos uno
de los dos cursos.
a. Qu porcentaje de los trabajadores participaron en los dos cursos?
b. Si se selecciona uno de estos trabajadores al azar, cul es la probabilidad de que haya participado slo en uno de los cursos?
38. Se entrevist a 120 personas que visitaron B&B, una nueva tienda por departamentos, durante
el fin de semana pasado. Se sabe que fueron entrevistadas 84 mujeres y que 30 de las personas
entrevistadas tenan la tarjeta de crdito de la tienda; tambin se sabe que un tercio de los hombres tenan la tarjeta de crdito de la tienda.
a. Calcule la probabilidad de que una de las personas entrevistadas, elegida al azar, sea mujer
o tenga tarjeta de crdito de la tienda.
b. Se selecciona uno de los entrevistados al azar y se verifica que tiene la tarjeta de crdito de
la tienda, cul es la probabilidad de que el cliente entrevistado sea hombre?
c. Sean los eventos H = el cliente seleccionado es hombre y T = el cliente seleccionado tiene
tarjeta de crdito de la tienda. Son H y T eventos independientes?
Notas
93
Estadstica EEGGLL
Tipo
Evento (X = a)
El evento (X a) se define como (X a) { w / X(w) a }
Notas
Rango
94
Ejemplo 23
Sea el espacio obtenido al lanzar un dado hasta que salga el as. Sea X el nmero de lanzamientos.
RX = {1, 2, 3,} = Z+. X es una variable aleatoria discreta.
f x 1
xR X
Si A RX , entonces P A
f x
xA
El dominio de la funcin f(x) se puede extender a todos los nmeros reales, si se define f(x) = 0 para
todo x IR- RX.
Notas
95
Estadstica EEGGLL
Ejemplo 24
Sea X el nmero de caras obtenidas al lanzar una moneda dos veces. Determine la funcin de probabilidad de la variable X y calcule P(X 1)
Solucin
Sea la variable aleatoria X := nmero de caras obtenidas al lanzar una moneda dos veces.
RX = {0, 1, 2}
Luego, la funcin de probabilidad de la variable X es:
f 0 P X 0
1
,
4
La probabilidad pedida es P( X 1)
f 1 P X 1
1
2
,
4
1
f 2 P X 2
1
4
Ejemplo 25
Sea X el nmero de lanzamientos de un dado hasta que salga el primer seis. Determine la funcin de
probabilidad de la variable X y calcule P(X 3)
Solucin
Sea la variable aleatoria X := nmero de lanzamientos de un dado hasta que salga el primer seis.
RX = {1, 2, 3,} = Z+.
f 1 P X 1
1
6
5 1
f 2 P X 2
6 6
5 1
f 3 P X 3
6 6
5
Luego, la funcin de probabilidad de la variable X es f x P X x
6
x 1
1
; x 1, 2, 3,....
6
25
1 5
La probabilidad pedida es P( X 3) 1 P( X 3) 1 f (1) f (2) f (3) 1
0,5787
6 36 216
Ejercicio 77
Se lanza un dado una vez, sea la variable aleatoria X igual al nmero de la cara superior. Determine y
grafique la funcin de probabilidad de la variable X.
Notas
96
Ejercicio 78
Se lanza dos dados a la vez, sea la variable aleatoria X igual a la suma de los nmeros de las caras
superiores. Determine y grafique la funcin de probabilidad de la variable X.
Solucin
Primero definamos la variable X: =
El rango de la variable es RX =
La funcin de probabilidad f(x) ser:
E X
xf x
xR X
El valor esperado E(X), tambin, se le conoce como media de la variable X, denotada por X.
Ejercicio 79
El nmero de trabajadores que faltan por da por razones de salud en una empresa se modela con una
variable aleatoria X con funcin de distribucin.
x
f(x)
0,08
0,12
0,40
0,25
Determine k.
Notas
97
Estadstica EEGGLL
E G X
Gx f x
xR X
Ejercicio 80
Un jugador lanza un dado, si sale un nmero de puntos mayor a cuatro gana 10 nuevos soles y si no,
pierde cinco nuevos soles. Calcule e interprete el valor esperado de la ganancia.
Se cumple V X E X 2 X2
V X E X X 2
f x X2
xR X
12
24
36
48
60
f(x)
0,15
0,25
0,30
0,20
0,10
Se obtiene por cada unidad demandada de producto 20 nuevos soles de utilidad. Si la cantidad demandada en un da es mayor a 36 unidades, se obtiene una utilidad adicional de dos nuevos soles por
unidad demandada de producto. Se tiene siempre ms de 60 productos en su almacn al inicio del da.
Calcule la desviacin estndar de la utilidad por la demanda diaria de productos.
Notas
98
Distribucin binomial
Un experimento binomial consiste en una serie de n repeticiones de un experimento Bernoulli, donde
n se fija antes de realizar el experimento.
Las pruebas son independientes entre s por lo que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
La probabilidad de xito es constante de una prueba a otra y la denotamos como p.
Se define la variable aleatoria binomial X como el nmero de xitos observados en un experimento
binomial, es decir:
X := Nmero de xitos obtenidos en n repeticiones independientes de un experimento de Bernoulli
con probabilidad de xito p.
La funcin de probabilidad de la variable aleatoria binomial X es:
f x PX x C xn p x 1 pn x ; x 0, 1, 2,, n
E X np
Varianza
2 V X np1 p
Ejemplo 26
Notas
99
Estadstica EEGGLL
Ejemplo 27
En un proceso de fabricacin artesanal de papel reciclado se estima, por experiencia anterior, que el
3% de las hojas de papel producidas presentan defectos en el teido. Las hojas de papel se empacan
en cajas de 50 unidades. Si usted ha comprado una de estas cajas, calcule la probabilidad de que:
a. ninguna de las hojas presente defectos en el teido
b. la caja contenga exactamente tres hojas con defectos en el teido
c. la caja contenga a lo ms dos hojas con defectos en el teido
d. la caja contenga al menos una hoja con defectos en el teido
e. Cuntas hojas con defectos en el teido esperara encontrar en su caja?
Solucin
Definimos la variable aleatoria X: = nmero de hojas con defectos en el teido en la caja de 50 hojas
de papel reciclado
Notemos que X ~ B (n = 50, p = 0,03)
a. La probabilidad de que ninguna de las hojas de la caja presente defectos en el teido es
b.
La probabilidad de que en la caja haya exactamente tres hojas que presenten defectos en el teido
50
x
50 x
x 0,03 0,97
0,811
x 0
50
x
50 x
x 0,03 0,97
1 0,555 0,445
x 0
e. En una caja de 50 hojas recicladas se esperara encontrar E(X) = np = 50(0,03) = 1,5 hojas que
presenten defectos en el teido.
Notas
100
Ejercicio 82
Una encuestadora va a entrevistar 30 personas seleccionadas al azar de un rea rural. Si la probabilidad
de que una persona cualquiera de esta zona est indocumentada es de 0,25.
Determine la distribucin de probabilidades del nmero de encuestados indocumentados de los 30
seleccionados.
Ejercicio 83
Un mdico estima que el 42% de los pacientes que atiende diariamente requiere algn examen de
laboratorio.
Si en un da en particular el mdico debe atender 18 pacientes, estime la probabilidad de que menos
de siete de ellos requieran algn examen de laboratorio.
Notas
101
Estadstica EEGGLL
Distribucin hipergeomtrica
El experimento hipergeomtrico consiste en extraer al azar y sin sustitucin n elementos de un conjunto de N elementos, r de los cuales son xitos y N - r son fracasos.
Se define la variable aleatoria hipergeomtrica como X nmero de xitos observados en la muestra de
tamao n.
La funcin de probabilidad de la variable X es:
f ( x) P X x
C xr C nNxr
C nN
Se denota X ~ H (N, r, n) y se lee que la variable aleatoria X sigue una distribucin hipergeomtrica con
parmetros N, r y n.
r
Media
E X n
N
r
r N n
Varianza
2 V X n 1
N N N 1
Ejercicio 84
En un equipo de ftbol hay 18 jugadores de los cuales cuatro consumen sustancias prohibidas. Calcule
la probabilidad de detectar a por lo menos uno de los jugadores que usan sustancias prohibidas, si la
directiva del club ha realizado una prueba antidoping a dos jugadores.
Notas
102
Ejercicios
39. En un taller hay tres tipos de mquinas: A, B y C. De las 20 del tipo A, 4 estn malogradas; de las
15 del tipo B, 2 estn malogradas; y de las 10 del tipo C, 3 estn malogradas. Se escoge al azar y
de manera independiente una mquina de cada tipo. Si la variable X es igual al nmero de mquinas malogradas escogidas, encontrar la media y la desviacin estndar de la variable X.
40. La demanda diaria de cierto artculo es una variable aleatoria cuyos valores son 10, 20 o 30 con
probabilidades de 0,2; 0,5 y 0,3 respectivamente. El costo de cada artculo es 1,80 soles y el precio
de venta es dos soles. Los artculos son perecederos de tal manera que si un artculo no se vende
en el da la prdida es total. Hallar el nmero de artculos que se deben ordenar para la venta de
tal manera que la ganancia esperada sea mxima.
41. Air Amrica tiene la poltica de registrar a 24 personas para viajar en un avin que cuenta con 20
asientos para pasajeros. Estudios anteriores revelaron que solo el 80% de los pasajeros que se
registran en un determinado vuelo, se presentan al aeropuerto para viajar en ese vuelo. Calcular
la probabilidad de que no haya suficientes asientos disponibles para los pasajeros, en un vuelo en
el que se registraron 24 personas.
42. Con fines de auditora sobre 18 empresas que comercializan gas domstico que funcionan en
nuestro medio (entre las cuales tenemos a las compaas A, B y C) se tomar una muestra aleatoria de 6 de ellas. Determine la probabilidad de los siguientes eventos:
a. Que la muestra solo tenga una de las tres empresas antes citadas.
b. La muestra incluya a las tres empresas mencionadas.
c. Que la muestra incluya al menos una de las tres empresas antes citadas.
43. Una empresa de seguros considera que slo alrededor de 5 % de los asegurados atendidos tiene
una determinada enfermedad.
a. Halle la probabilidad de atender ms de dos casos hasta que se reporte el primer asegurado
que sufre de esta enfermedad.
b. Si fueron seleccionados aleatoriamente 100 de los asegurados atendidos, cul sera la probabilidad de que no ms de 3 de ellos tengan la enfermedad?
44. A un estudiante que tiene de manera independiente una probabilidad p de aprobar cada examen
del curso de Fsica 1, se le ofrecen dos alternativas:
I) Dar un nico examen.
II) Dar tres exmenes con la condicin de aprobar por lo menos dos.
Cul es la alternativa ms favorable para el alumno?
45. En un lote de 50 computadoras 12 son defectuosas. Si se eligen al azar y de una sola vez 20 de
ellas, calcule la probabilidad de que de las computadoras elegidas por lo menos dos sean defectuosas.
Notas
103
Estadstica EEGGLL
f x dx 1
RX
El dominio de la funcin f(x) se puede extender a todos los nmeros reales, si se define f(x) = 0 para
todo x IR- RX
Se cumple que:
b
P a X b f x dx
P( X a) f (x) dx 0
a
Ejercicio 85
Una variable aleatoria continua tiene la siguiente funcin de densidad de probabilidad:
ax
f (x)
0
Determine el valor de a.
Notas
0x5
en otro caso
104
Ejemplo 29
Si las ventas diarias (en miles de nuevos soles) en una tienda se modelan con una variable continua X
con funcin de densidad de probabilidad
f (x) c x ; 0 x 10
a. Calcular el valor de c
b. Calcule e interprete P(X 5)
c. Calcule e interprete P(X 8)
Solucin
10
x2
a. Como f(x) es una funcin de densidad cx dx 1 , luego c
2
0
10
1 , de donde,
0
50c 1 c 0,02
5
c.
Distribucin de probabilidad
La distribucin de probabilidad f(x) de una variable aleatoria X, es la funcin de probabilidad de X, si X
es discreta y la funcin de densidad de probabilidad de X, si X es continua.
Notas
105
Estadstica EEGGLL
f x
x a
f x dx
x a
Se cumple que:
P(a < X b) = F(b) F(a)
xf x dx
RX
El valor esperado E(X), tambin, se le conoce como media de la variable X, denotada por X.
RX
Notas
106
f x dx
RX
Se cumple V X E X 2 X2 x 2 f x X2
RX
Variable estandarizada
La variable Z
Notas
X x
107
Estadstica EEGGLL
Se denota X ~ U (a, b) y se lee que la variable aleatoria X sigue una distribucin uniforme con parmetros a, b.
La funcin de distribucin acumulada es:
0
x a
F (x)
b a
1
Media E X
Varianza
Ejercicio 86
Notas
ab
2
2 V X
b a 2
12
xa
; axb
;
xb
108
El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede modelarse por
una variable aleatoria uniforme con parmetros 10 y 38. Si la pizza se tarda ms de 30 minutos en ser
entregada, el cliente no la pagar.
Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Si la familia pide una pizza diaria durante diez das seguidos, calcule la probabilidad de que por lo menos una de ellas le salga gratis.
Una familia pidi una pizza hace 25 minutos y an no ha llegado, cul es la probabilidad de que le
salga gratis?
Notas
109
Estadstica EEGGLL
Distribucin normal
La variable aleatoria X tiene una distribucin normal con parmetros y 2 (2 > 0) si su funcin de
densidad de probabilidad es:
2
1 x
1
f x
e 2
2
x IR
Se denota X ~ N (, 2) y se lee que la variable aleatoria X sigue una distribucin normal con parmetros
y 2.
Media
E X
Varianza
2 V X 2
La funcin de densidad de una variable normal tiene forma de campana y es simtrica, por lo que las
medidas de tendencia central coinciden.
El rango de la variable aleatoria normal es el conjunto de los nmeros reales.
La funcin de densidad de Z es
(z)
(z)
1 2 z2
e
2
1 2 z2
e
dz
2
b
a X b a
P a X b P
Z
P
b
a
Notas
110
Ejercicio 87
Si Z ~ N 0, 2 1 , calcular
P(Z < 1,12) =
0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594
0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859
0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121
0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381
0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639
0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894
0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147
0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398
0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646
1,0
1,1
1,2
0,84134 0,84375
0,86433 0,86650
0,88493 0,88686
0,84614
0,86864
0,88877
0,84849
0,87076
0,89065
0,85083
0,87286
0,89251
0,85314
0,87493
0,89435
0,85543
0,87698
0,89617
0,85769
0,87900
0,89796
0,85993 0,86214
0,88100 0,88298
0,89973 0,90147
Notas
0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891
Estadstica EEGGLL
111
Ejercicio 88
Una compaa ha comprado una prueba para seleccionar personal. Los que han diseado la prueba
saben que las notas siguen una distribucin normal con una media de 75 puntos y una desviacin
estndar de diez puntos. Calcule la probabilidad de que una persona que rinda esta prueba obtenga
una nota superior a 90 puntos.
Ejercicio 89
En una ciudad se estima que la temperatura mxima en un da del mes de enero puede modelarse con
una variable normal con media 30C y desviacin estndar 2C.
Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la temperatura mxima sea
menor a 31C.
Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la temperatura mxima
est entre 28,5 y 32C.
Notas
112
Calcule el nmero esperado de das en el mes de enero en que la temperatura mxima es mayor a
33C. Asuma independencia entre las temperaturas de un da y otro.
Ejemplo 30
Si los puntajes de los postulantes en un examen de ingreso se distribuyen como una variable aleatoria
normal con una media de 1 200 y una desviacin estndar de 300 puntos.
a. Encontrar la probabilidad de que el puntaje de un postulante sea de por lo menos 1 300.
b. Si ingresa el 12,3 % de los postulantes con puntajes ms altos, hallar el puntaje mnimo para ingresar.
Solucin
Definamos la variable aleatoria X := puntaje de un postulante.
= 1 200, = 300, 2 = 3002 X ~ N(1 200, 3002)
a. La probabilidad pedida es
X 1 300
PX 1 300 1 PX 1 300 1 P
b. Sea k el puntaje mnimo para ingresar. Se tiene P(X k) 0,123, luego P(X k) 0,877 . Estandak 1 200
X 1 200 k 1 200
rizando tendremos que P
P Z
0,877
300
300
300
k 1 200
De lo cual, se tiene que
0,877
300
Notas
k 1 200
1,16 , de donde k = 1 548.
300
113
Estadstica EEGGLL
La suma
de una
variable
aleatoria
normal
con otra
variable
aleatoria
normal
es una
variable
aleatoria
normal
X ~ Nn , n
n
i 1
Ejercicio 90
Sean X ~ N(5, 6) e Y ~ N(8, 10) variables aleatorias independientes, calcular la distribucin de las siguientes variables:
S=X+Y
S=XY
S = 4X - 5Y
Ejercicio 91
Notas
114
El peso de un adulto peruano puede modelarse con una variable aleatoria normal. El peso medio para
los varones es de 72 kilos y de 64 kilos para las mujeres, mientras que sus desviaciones estndar fueron
de 8 kilos y 4 kilos respectivamente.
Si se elige, al azar, a un hombre y una mujer, calcular la probabilidad de que la mujer pese ms que el
hombre.
Si se elige a dos hombres y a dos mujeres, calcular la probabilidad de que la suma total de pesos supere
los 260 kilos.
Notas
Estadstica EEGGLL
115
E S n
Varianza
V S n 2
Ejercicio 92
La cantidad de mango que exporta una empresa mensualmente es una variable con una media de 25
toneladas y una desviacin estndar de cuatro toneladas. Encontrar la probabilidad de que la cantidad
exportada en tres aos sea menor a 920 toneladas. Asuma independencia entre las cantidades mensuales exportadas.
Ejercicio 93
Los ingresos por factura en un restaurante pueden modelarse con una variable aleatoria de media 84
soles y desviacin estndar 12 soles. Cul es la probabilidad de que los ingresos totales por 100 facturas elegidas al azar sean de ms de 8650 soles?
Notas
116
X
i 1
; entonces se
2
siempre y cuando n 30.
puede afirmar X N ,
n
- La distribucin de una variable aleatoria X ~ B(n, p) se puede aproximar por una distribucin N(np,
npq) siempre y cuando n 30. La aproximacin es buena si, adems, se verifica que np es mayor a
5 y nq = n(1-p) es mayor a 5.
X
- Sea X ~ B(n, p), Se define la variable aleatoria proporcin muestral como P ; entonces se puede
n
p1 p
afirmar P N p ,
siempre y cuando n 30.
n
Ejercicio 94
El peso de los pasajeros que abordan un mnibus de transporte interprovincial tiene una media de 60
kilogramos y una desviacin estndar de 19 kilogramos. Si se sabe que los 72 asientos de pasajeros
estn ocupados, cul es la probabilidad de que el peso medio de los pasajeros supere los 65 kilogramos?
Ejercicio 95
Notas
Estadstica EEGGLL
117
Por un estudio previo se estima que la probabilidad de que un elector vote por la eleccin del candidato
oficialista es del 25%. Si 1000 electores son entrevistados uno por uno de manera independiente, encontrar la probabilidad de que por lo menos 275 de ellos voten por el candidato oficialista.
Ejercicio 96
El porcentaje de los clientes de una tienda por departamentos que paga con la tarjeta de crdito de la
tienda es 72%. Si se toma una muestra aleatoria de 250 clientes, calcule la probabilidad de que menos
de 75% de los clientes de la muestra paguen con tarjeta de crdito.
Notas
118
Ejercicios
46. El peso de los jabones fabricados por una empresa es una variable aleatoria uniforme con media
120 gramos y varianza 12 gramos2. Un jabn se considera defectuoso si su peso es menor a 115
gramos o mayor de 124 gramos. En el control de calidad, los jabones se pesan uno por uno. Calcular la probabilidad de que se necesite pesar ms de 10 jabones hasta encontrar el primer jabn
defectuoso.
47. En un supermercado, la demanda diaria, en kilos, de mariscos se distribuye segn el modelo uniforme en el intervalo [70, 170]. Por cada kilo de mariscos que se vende se gana 8 soles, pero por
cada kilo que no se vende en el da se pierde 5 soles. El supermercado compra los mariscos todos
los das, muy temprano en la maana. Calcular la cantidad de kilos que el supermercado debe
comprar diariamente para maximizar su utilidad esperada.
48. Si una mquina de una imprenta se malogra, sta puede destinarse a uno de dos talleres A o B
para su reparacin. El tiempo de reparacin en el taller A es una variable normal con una media
de 5 horas y una desviacin estndar de 3 horas. El tiempo de reparacin en el taller B es una
variable aleatoria normal con una media de 7 horas y una desviacin estndar de 2 horas.
a) En qu taller es ms probable que la mquina se repare en menos de 8 horas?
b) Calcule la probabilidad de que la reparacin demore ms en el taller B que en el taller A.
49. Una compaa ha comprado una prueba para seleccionar personal. Los que han diseado la
prueba saben que, para cierta poblacin, las notas siguen una distribucin normal con una media
de 75 puntos y una desviacin estndar de 10 puntos. Si se va a escoger al primer postulante que
supere los 90 puntos. Calcular el nmero esperado de entrevistas que debe hacer la compaa
para escoger un postulante.
50. Los sueldos mensuales, en miles de dlares, de los directivos de una multinacional se modelan
con una distribucin N(10, 1) mientras que los del resto de personal se modelan con una N(4, 2).
Si se extrae una muestra aleatoria de 10 directivos y de 20 empleados no directivos, cul es la
probabilidad de que el sueldo medio mensual de los directivos de la muestra supere al correspondiente de la muestra de empleados no directivos en ms de 5 000 dlares?
51. El porcentaje de determinado compuesto, contenido en un galn de cierto lquido industrial, se
modela con una distribucin normal con una media de 15% y una desviacin estndar de 3%. El
fabricante del lquido obtiene una utilidad neta por galn de $0,15 si el porcentaje del compuesto
est entre 9% y 21%, mientras que la utilidad es de $0,10 si el porcentaje vara entre 21% y 27%.
Cuando el porcentaje est entre 3% y 9%, el fabricante sufre una prdida de $0,05. Calcular la
utilidad esperada por galn.
52. En un estudio de evaluacin de la atencin de un servicio de cafeteras se encontr que los tiempos, en minutos, que tardan en atender a un cliente las cafeteras A y B se pueden modelar con
las variables aleatorias X ~ N(4,9) y Y ~ N(5,16) respectivamente y de manera independiente. Si
en cada cafetera son atendidas 20 personas, halle la probabilidad de que el tiempo total de atencin en la cafetera B sea mayor que el de la cafetera A.
53. En una fbrica, el 25% de los corchos para las botellas de vino se producen en una mquina y la
distribucin de los dimetros de estos corchos se modela normal con una media de 3 cm y una
Notas
Estadstica EEGGLL
119
desviacin estndar de 0,1 cm. El resto de la produccin de corchos para botellas de vino se realiza en otra mquina y en este caso la distribucin de los dimetros de los corchos se modela
normal con media 3,04 cm y varianza 0,0004 cm2. Los corchos son considerados aceptables si sus
dimetros estn entre 2,9 y 3,1 cm. Cul es la probabilidad de que un corcho producido en esta
fbrica sea considerado aceptable?
54. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo puede modelarse como una variable normal. Al menor se le da en promedio 20 nuevos soles con una desviacin estndar de 3 nuevos soles, al del medio se le da el doble que al menor y al mayor se le
da el triple que al menor. Calcular la probabilidad de que en cuatro semanas la suma total recibida
en propinas por los tres sume ms de 500 nuevos soles.
55. La estatura de las personas de un pas se puede modelar por una variable normal con una media
de 1,68 metros y una desviacin estndar de 8 centmetros. Si se eligen al azar personas para
medir su estatura, calcule el valor esperado y desviacin estndar del nmero de personas elegidas hasta encontrar a las primeros doce personas que midan ms de 1,80.
56. Cuando el cemento y el agua entran en contacto, se inicia una reaccin qumica exotrmica que
determina el endurecimiento de la mezcla. Dentro del proceso de endurecimiento se presenta un
estado en que la mezcla pierde su plasticidad y se vuelve difcil de manejar; tal estado corresponde al fraguado inicial de la mezcla. El tiempo de fraguado inicial de un tipo de cemento puede
modelarse por una variable aleatoria normal con una media de 50 minutos y una desviacin estndar de 10 minutos.
a. Calcule la probabilidad de que el cemento tenga un tiempo de fragua inicial menor a 40 minutos.
b. Calcule el tiempo mximo para estar en el 25% de las mezclas con menor tiempo de fraguado
inicial.
c. Si un obrero prepara dos mezclas independientes, calcule la probabilidad de que la diferencia entre los tiempos de fraguado inicial de estas mezclas sea menor a 5 minutos.
57. Los pesos de los posibles usuarios de un ascensor constituyen una poblacin cuya distribucin es
normal con media 70 kg y una desviacin estndar de 10 kg.
a. Qu peso mximo debera poder soportar el ascensor de modo que slo el 1% de las ocasiones el peso de cuatro personas supere ese peso mximo?
b. Si el ascensor admite como peso mximo 585 kg, cuntas personas a la vez pueden entrar
al ascensor de manera que sea 0,0668 la probabilidad de que el peso no supere el mximo
permitido?
58. El ingreso mensual de las socias de una cooperativa se modela por una variable aleatoria con
media de 2800 nuevos soles y desviacin estndar de 500 nuevos soles. Si 80 de las socias han
decidido que destinarn el 3% de sus ingresos para constituir un fondo comn que sirva para
posibles emergencias, calcule la probabilidad de que en un ao el fondo tenga ms de 81 mil
nuevos soles.
Notas
121
Estadstica EEGGLL
Estadstico
Un estadstico es cualquier funcin de las variables de una muestra aleatoria.
Un estadstico es una variable aleatoria.
Distribucin muestral
Es la distribucin de probabilidades de un estadstico.
x x
- La varianza muestral S 2
i 1
Notas
122
Fuente: http://www.fisicanet.com.ar/matematica/estadisticas/ap08_inferencia_estadistica.php
Notas
123
Estadstica EEGGLL
I ( ) x z
; xz
1
1
n
n
2
2
donde x es la media calculada con los datos de la muestra de tamao n.
Si la poblacin es normal o el tamao de muestra n es mayor o igual a 30, entonces el intervalo de
confianza para , a un nivel de confianza de (1-) x 100%, es
s
s
I ( ) x z
; xz
1
1
n
n
2
2
n
x x
i 1
n 1
Ejemplo 32
Para estimar el precio medio de las guas tursticas para visitar el Cusco se elige una muestra aleatoria
formada por 34 guas y se determina que la media muestral es de S/.34,90. Por estudios realizados
anteriormente se sabe que la desviacin estndar de los precios de estas guas es de S/.4,50. Construya
un intervalo de confianza para el precio medio de las guas tursticas para visitar el Cusco, al nivel del
95%. Interprete.
Solucin
El intervalo de confianza al 95% est dado por
x z 0 ,975
x z 0 ,975
4,5
4,5
34,9 1,96
34
34
33,39 36,41
El precio medio de las guas de turismo para visitar el Cusco, se estima entre S/.33,39 y S/.36,41, con
una confianza del 95%.
Notas
124
Ejercicio 97
Para estimar el puntaje medio en una prueba de pensamiento crtico se aplica la prueba a una muestra
aleatoria de 100 estudiantes de EEGGLL. El manual de instrucciones de la prueba reporta que la desviacin estndar de los puntajes es 8 puntos. El puntaje medio de los estudiantes evaluados es 68
puntos (sobre un mximo de 80 puntos). Con esta informacin se estima que el puntaje medio en la
prueba de pensamiento crtico para la poblacin de estudiantes de EEGGLL est entre 66,53 y 69,47
con una confianza del 90%.
__
X
- El tamao de muestra n debe ser un nmero entero. Si es necesario el valor obtenido en las expresiones anteriores se aproxima al siguiente entero.
- Si es desconocida, para encontrar el tamao de muestra, se estima por sx.
Notas
125
Estadstica EEGGLL
Ejemplo 35
El peso de cierto tipo de motores se modela con una variable con desviacin estndar de 7,04 kilos.
Calcular el tamao de muestra para que con una confianza del 99% el error de estimacin, al estimar
la media poblacional por la media muestral, sea de a lo ms dos kilos.
Solucin
Sea X = peso del motor, en kilos, la desviacin estndar = 7,04 kilos y error mximo e = 2 kilos.
2,575 7,04
n
82,15
2
Notas
126
I(p) p z
1
2
p 1 p
; pz
1
n
2
p 1 p
Solucin
El nivel de confianza (1- ) es 0,90, luego 1
n 100 ; p
28
0,28 ;
100
0,045
n
100
La proporcin de clientes que presentaron quejas por fallas en el servicio, durante el mes de abril, se
estima entre 0,206 y 0,354, con una confianza del 90%.
Ejercicio 99
A una muestra aleatoria de 650 personas mayores de 18 aos de una ciudad determinada se les pregunt si estaban a favor de un incremento del 4% en el impuesto al precio de la gasolina para obtener
fondos necesarios que se destinaran a un programa de asistencia social. Si en la muestra elegida se
encontr que 312 estn a favor del impuesto adicional, calcule e interprete un intervalo de confianza
del 90% para la verdadera proporcin de personas a favor del nuevo impuesto.
Ejercicio 100
Notas
127
Estadstica EEGGLL
Se quiere estimar la aprobacin del presidente de la repblica para lo cual se realiz una encuesta
nacional, en la cual se entrevist a 1116 personas, encontrndose que 854 de ellas no estaban de
acuerdo con la gestin presidencial. Calcule un intervalo de confianza al 96% para proporcin poblacional de las personas que estn de acuerdo con la gestin presidencial. Adems, determine el margen
de error. Interprete.
P P p e 1 e z
__
P
p1 p
e2
Como p es desconocida (p es el parmetro que se desea estimar), para encontrar el tamao de muestra, el valor p se reemplaza por una estimacin previa disponible o por 0,5.
El tamao de muestra n debe ser un nmero entero. Si es necesario el valor obtenido en las expresiones anteriores se aproxima al siguiente entero.
Ejercicio 101
Una empresa encuestadora quiere realizar una investigacin sobre intencin de voto a favor de cierto
candidato en la segunda vuelta electoral de las prximas elecciones presidenciales. Desea que los resultados tengan un nivel de confianza del 95% y un margen de error del 3%. Calcule el tamao de
muestra necesario para dicha encuesta.
Ejercicio 102
Notas
128
Una compaa de investigacin de mercado desea estimar el porcentaje de hogares que tienen Internet en casa, cuntos hogares debe encuestarse si desea tener un nivel de confianza del 99% y un
margen de error del 2%? En una investigacin del ao pasado se determin que el porcentaje de hogares con Internet era del 24%.
Notas
Estadstica EEGGLL
129
Ejercicios
59. El gerente financiero de una cadena de tiendas desea estimar la proporcin de clientes que utilizan tarjetas de crdito, qu tamao de muestra es necesario si el intervalo de confianza del 95%
para la proporcin debe tener una longitud de a lo sumo 0,10?
60. Un intervalo de confianza para el porcentaje de taxis informales en Lima es [69,6; 80,4]. Si este
intervalo se obtuvo a partir de una muestra de 200 taxis, cul es su nivel de confianza?
61. Una empresa constructora desea estimar, con un nivel de confianza del 95% y un error mximo
de estimacin de 0,025 la proporcin de personas de una determinada ciudad que compraran
una vivienda de dimensiones comprendidas entre 180 y 200 m2. Para ello pretende tomar una
muestra aleatoria entre los potenciales compradores de vivienda, disponiendo para realizar el
muestreo de 10 000 dlares.
a. Si cada elemento muestreado supone un costo de 10 dlares, es suficiente el presupuesto
disponible?
b. Qu nivel de confianza se puede alcanzar con 10 000 dlares de presupuesto, si se pretende
mantener el error mximo de estimacin en 0,025?
62. En un restaurante universitario, el peso de la racin de arroz que se pone en un plato del men
se puede modelar como una variable aleatoria normal. Si se pesan las raciones de arroz de 116
mens escogidos al azar y se encuentra una media muestral de 220 gramos y una desviacin estndar muestral de 25 gramos. Estime la media poblacional del peso de la racin de arroz en cada
plato con un nivel de confianza del 95%.
63. En la ficha tcnica de la encuesta realizada por Ipsos Apoyo Opinin y Mercado S.A. y publicada
el da 22 de julio de 2007 en el diario El Comercio se afirma que el margen de error fue de 4,4%
con un nivel de confianza del 95%. Qu tamao mnimo de muestra se debe usar para cumplir
con dichas especificaciones?
64. En una investigacin realizada en el Valle de los ros Apurmac y Ene (VRAE) se tom una muestra
aleatoria de 350 viviendas y se estim en 80% 4,8% el porcentaje de viviendas que no tienen
agua potable. Encontrar el nivel de confianza de la estimacin.
65. Para estimar el porcentaje de colegos rurales que tienen por lo menos una computadora, una
universidad realiz una encuesta en 200 colegios rurales. Si en el informe de esta encuesta se
indic que el porcentaje de colegios rurales con por lo menos una computadora se estima entre
33,2% y 46,8%, determine con qu nivel de confianza se realiz la estimacin.
Notas
130
Tablas Estadsticas
Tablas estadsticas
Tabla de la distribucin normal estndar rea bajo la curva PZ z
Z
-3,9
-3,8
-3,7
-3,6
-3,5
-3,4
-3,3
-3,2
-3,1
-3,0
-0,09
0,000033
0,000050
0,000075
0,000112
0,000165
0,000242
0,000349
0,000501
0,000711
0,001001
-0,08
0,000034
0,000052
0,000078
0,000117
0,000172
0,000251
0,000362
0,000519
0,000736
0,001035
-0,07
0,000036
0,000054
0,000082
0,000121
0,000178
0,000260
0,000376
0,000538
0,000762
0,001070
-0,06
0,000037
0,000057
0,000085
0,000126
0,000185
0,000270
0,000390
0,000557
0,000789
0,001107
-0,05
0,000039
0,000059
0,000088
0,000131
0,000193
0,000280
0,000404
0,000577
0,000816
0,001144
-0,04
0,000041
0,000062
0,000092
0,000136
0,000200
0,000291
0,000419
0,000598
0,000845
0,001183
-0,03
0,000042
0,000064
0,000096
0,000142
0,000208
0,000302
0,000434
0,000619
0,000874
0,001223
-0,02
0,000044
0,000067
0,000100
0,000147
0,000216
0,000313
0,000450
0,000641
0,000904
0,001264
-0,01
0,000046
0,000069
0,000104
0,000153
0,000224
0,000325
0,000466
0,000664
0,000935
0,001306
-0,00
0,000048
0,000072
0,000108
0,000159
0,000233
0,000337
0,000483
0,000687
0,000968
0,001350
-2,9
-2,8
-2,7
-2,6
-2,5
-2,4
-2,3
-2,2
-2,1
-2,0
0,00139
0,00193
0,00264
0,00357
0,00480
0,00639
0,00842
0,01101
0,01426
0,01831
0,00144
0,00199
0,00272
0,00368
0,00494
0,00657
0,00866
0,01130
0,01463
0,01876
0,00149
0,00205
0,00280
0,00379
0,00508
0,00676
0,00889
0,01160
0,01500
0,01923
0,00154
0,00212
0,00289
0,00391
0,00523
0,00695
0,00914
0,01191
0,01539
0,01970
0,00159
0,00219
0,00298
0,00402
0,00539
0,00714
0,00939
0,01222
0,01578
0,02018
0,00164
0,00226
0,00307
0,00415
0,00554
0,00734
0,00964
0,01255
0,01618
0,02068
0,00169
0,00233
0,00317
0,00427
0,00570
0,00755
0,00990
0,01287
0,01659
0,02118
0,00175
0,00240
0,00326
0,00440
0,00587
0,00776
0,01017
0,01321
0,01700
0,02169
0,00181
0,00248
0,00336
0,00453
0,00604
0,00798
0,01044
0,01355
0,01743
0,02222
0,00187
0,00256
0,00347
0,00466
0,00621
0,00820
0,01072
0,01390
0,01786
0,02275
-1,9
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1,0
0,02330
0,02938
0,03673
0,04551
0,05592
0,06811
0,08226
0,09853
0,11702
0,13786
0,02385
0,03005
0,03754
0,04648
0,05705
0,06944
0,08379
0,10027
0,11900
0,14007
0,02442
0,03074
0,03836
0,04746
0,05821
0,07078
0,08534
0,10204
0,12100
0,14231
0,02500
0,03144
0,03920
0,04846
0,05938
0,07215
0,08691
0,10383
0,12302
0,14457
0,02559
0,03216
0,04006
0,04947
0,06057
0,07353
0,08851
0,10565
0,12507
0,14686
0,02619
0,03288
0,04093
0,05050
0,06178
0,07493
0,09012
0,10749
0,12714
0,14917
0,02680
0,03362
0,04182
0,05155
0,06301
0,07636
0,09176
0,10935
0,12924
0,15151
0,02743
0,03438
0,04272
0,05262
0,06426
0,07780
0,09342
0,11123
0,13136
0,15386
0,02807
0,03515
0,04363
0,05370
0,06552
0,07927
0,09510
0,11314
0,13350
0,15625
0,02872
0,03593
0,04457
0,05480
0,06681
0,08076
0,09680
0,11507
0,13567
0,15866
-0,9
-0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
-0,0
0,16109
0,18673
0,21476
0,24510
0,27760
0,31207
0,34827
0,38591
0,42465
0,46414
0,16354
0,18943
0,21770
0,24825
0,28096
0,31561
0,35197
0,38974
0,42858
0,46812
0,16602
0,19215
0,22065
0,25143
0,28434
0,31918
0,35569
0,39358
0,43251
0,47210
0,16853
0,19489
0,22363
0,25463
0,28774
0,32276
0,35942
0,39743
0,43644
0,47608
0,17106
0,19766
0,22663
0,25785
0,29116
0,32636
0,36317
0,40129
0,44038
0,48006
0,17361
0,20045
0,22965
0,26109
0,29460
0,32997
0,36693
0,40517
0,44433
0,48405
0,17619
0,20327
0,23270
0,26435
0,29806
0,33360
0,37070
0,40905
0,44828
0,48803
0,17879
0,20611
0,23576
0,26763
0,30153
0,33724
0,37448
0,41294
0,45224
0,49202
0,18141
0,20897
0,23885
0,27093
0,30503
0,34090
0,37828
0,41683
0,45620
0,49601
0,18406
0,21186
0,24196
0,27425
0,30854
0,34458
0,38209
0,42074
0,46017
0,50000
131
Estadstica EEGGLL
Z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594
0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859
0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121
0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381
0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639
0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894
0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147
0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398
0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646
0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
0,84134
0,86433
0,88493
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128
0,84375
0,86650
0,88686
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193
0,84614
0,86864
0,88877
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257
0,84849
0,87076
0,89065
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320
0,85083
0,87286
0,89251
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381
0,85314
0,87493
0,89435
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441
0,85543
0,87698
0,89617
0,91309
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500
0,85769
0,87900
0,89796
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558
0,85993
0,88100
0,89973
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615
0,86214
0,88298
0,90147
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,99813
0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,99819
0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,99825
0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,99831
0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,99836
0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,99841
0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,99846
0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,99851
0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,99856
0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
0,99861
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
0,998650
0,999032
0,999313
0,999517
0,999663
0,999767
0,999841
0,999892
0,999928
0,999952
0,998694
0,999065
0,999336
0,999534
0,999675
0,999776
0,999847
0,999896
0,999931
0,999954
0,998736
0,999096
0,999359
0,999550
0,999687
0,999784
0,999853
0,999900
0,999933
0,999956
0,998777
0,999126
0,999381
0,999566
0,999698
0,999792
0,999858
0,999904
0,999936
0,999958
0,998817
0,999155
0,999402
0,999581
0,999709
0,999800
0,999864
0,999908
0,999938
0,999959
0,998856
0,999184
0,999423
0,999596
0,999720
0,999807
0,999869
0,999912
0,999941
0,999961
0,998893
0,999211
0,999443
0,999610
0,999730
0,999815
0,999874
0,999915
0,999943
0,999963
0,998930
0,999238
0,999462
0,999624
0,999740
0,999822
0,999879
0,999918
0,999946
0,999964
0,998965
0,999264
0,999481
0,999638
0,999749
0,999828
0,999883
0,999922
0,999948
0,999966
0,998999
0,999289
0,999499
0,999651
0,999758
0,999835
0,999888
0,999925
0,999950
0,999967
Tablas Estadsticas
132
ndice alfabtico
Coeficiente de correlacin, 60
Coeficiente de variacin, 45
Cuartil, 29
Desviacin estndar, 42
Distribucin
binomial, 97
de frecuencias, 12, 16, 17
de probabilidad, 92
hipergeomtrica, 100
normal, 108
uniforme continua, 106
Escalas de medicin
intervalo, 11
nominal, 10
ordinal, 10
razn, 11
Espacio muestral, 67
Estadstica
Definicin, 3
Estadstico, 7, 119
Evento, 68
Eventos
independientes, 85
Experimento aleatorio, 67
Experimento de Bernoulli, 97
Funcin
de densidad, 102
Grfico
de barras, 15
de barras apiladas, 25
de barras apiladas al 100%, 26
Diagrama de cajas, 47
Histograma, 20
Ojiva, 21
Polgono de frecuencias, 21
Intervalo de confianza
media poblacional, 121
proporcin poblacional, 124
Media, 38
Mediana, 36
Moda, 34
Muestra, 4
Parmetro, 7
Percentiles, 29
Poblacin, 4
Propiedad reproductiva de la normal, 112
Puntuacin estandarizada Z, 49
Rango, 46
Rango intercuartil, 46
Teorema
de Bayes, 83
Valor esperado
de una funcin de una variable aleatoria, 95, 104
Variable, 9
aleatoria continua, 102
aleatoria discreta, 92
Varianza, 42
de una variable aleatoria, 95, 105