Professional Documents
Culture Documents
Septiembre de 2010.
ndice general.
Introduccin. ............................................................................................................................ 5
Captulo 1. Conceptos Bsicos de Estadstica. ................................................... 6
1.1. La Estadstica y sus aplicaciones ............................................................................................. 6
1.1.1. Qu es la Estadstica? ...................................................................................................... 6
1.1.2. Aplicaciones de la Estadstica. .......................................................................................... 6
1.2. Poblacin, Muestra y tcnicas de muestreo. .......................................................................... 10
1.3. Unidad de estudio y unidad de muestreo ............................................................................... 13
1.4. Variables y datos .................................................................................................................... 14
1.5. Escalas de medicin .............................................................................................................. 15
1.5.1. Escalas nominales ........................................................................................................... 15
1.5.2. Escalas ordinales ............................................................................................................. 16
1.5.3. Escalas de intervalos ....................................................................................................... 16
1.5.4. Escalas de razones o cocientes ........................................................................................ 17
1.6. Diseo de Experimentos estadsticos. .................................................................................... 18
1.7. Gua de ejercicios N 1........................................................................................................... 18
Captulo 2. Distribuciones de frecuencias y sus representaciones
grficas ..................................................................................................................................... 20
2.1. Estadstica Descriptiva con una variable ............................................................................... 20
2.1.1. Distribucin de frecuencias ............................................................................................. 20
2.1.2. Descripcin de Variables Cualitativas ............................................................................ 21
2.1.3. Variables cuantitativas discretas. .................................................................................... 29
2.2. Distribucin de frecuencias agrupadas. .................................................................................. 30
2.2.1 Representacin grfica de variables continuas ................................................................ 32
2.3. Gua de ejercicios N 2........................................................................................................... 33
Captulo 3. Medidas Caractersticas de una Distribucin Cuantitativa
Emprica.................................................................................................................................... 35
3.1 Medidas de posicin ........................................................................................................... 35
3.2 Medidas de Dispersin ....................................................................................................... 42
3.3 Medidas de forma ............................................................................................................... 43
3.4. Gua de Ejercicios N 3. ......................................................................................................... 44
Captulo 4. Distribuciones Bivariadas ...................................................................... 73
4.1. Distribuciones bidimensionales............................................................................................. 73
4.2. Distribuciones marginales y condicionales. ........................................................................... 74
4.3. Coeficiente de correlacin lineal ............................................................................................ 77
4.4. Introduccin al modelos de regresin lineal .......................................................................... 77
4.5. Modelo de regresin simple. ................................................................................................. 82
4.5.1. Estimacin de los parmetros por mnimos cuadrados ................................................... 82
4.5.2. Propiedades de los estimadores por mnimos cuadrados y el modelo ajustado de
regresin. ................................................................................................................................... 84
4.5.3. Intervalos de confianza................................................................................................... 86
2
Introduccin.
La estadstica como herramienta para el anlisis de los datos es esencial en los profesionales que
con frecuencia tienen la necesidad de realizar anlisis de datos para la toma de decisiones.
Este libro, recoge en 10 captulos conocimientos estadsticos bsicos que van desde el anlisis
descriptivo de datos, probabilidad e inferencia estadstica.
Debemos aclarar que los mtodos descriptivos aqu propuestos son elementales univariantes y en
el enfoque de la probabilidad slo hemos considerado espacios probabilsticos discretos
incluyendo dos continuas la uniforme y la normal.
Este libro, es recomendables para principiantes en el rea de estadstica. Los conocimientos aqu
planteados son base para ir enfrentando otros de estadstica de mayor dificultad.
La Estadstica en la Poltica
Conocidas son las famosas encuestas de tipo poltico, que entregan una orientacin de la
intencin de voto, de la aceptacin de un candidato, del impacto de un programa o proyecto de
estado, etc. de una muestra estadstica representativa, sobre la opinin de las personas en un
tiempo determinado, teniendo esta herramienta una gran confiabilidad. As es que el uso de la
estadstica es imprescindible para determinar caminos a seguir para los candidatos de eleccin
popular.
2.
La Estadstica en la Publicidad
Cuando las grandes marcas trasnacionales y/o nacionales como Coca-cola, Pepsi, Nice, Adidas,
Laboratorios Lpez, etc. nos llenan de slogans, msica y colores en sus comerciales, lo nico que
buscan es que la gente adquiera los productos y/o servicios que ofrecen.
Se dedican, entonces, a realizar las llamadas campaas publicitarias, y, antes de lanzar una
campaa, hacen un estudio de mercado para encontrar las mejores alternativas posibles a fin de
lograr el xito de ventas deseado. Estos estudios son de carcter estadstico, es decir, hacen un
diseo muestral y seleccionan una muestra para inferir las caractersticas de la poblacin.
3.
En la administracin es una herramienta del control, como parte del proceso administrativo (o lo
que es lo mismo: planeacin, organizacin, direccin y control) ya que la estadstica ayuda a
7
recolectar, estudiar y al final interpretar los datos que obtienen al terminar el proceso
administrativo, retroalimenta con esta informacin y al final se observa en que pueden mejorar y
que se est haciendo bien.
En la mercadotecnia es una herramienta muy importante cuando tienes la necesidad de trabajar
con datos de muestreo para conocer los gustos y preferencias de las personas. Igualmente en la
auditoria administrativa cuando recabas datos para conocer en que puede mejorar una
organizacin. En pocas palabras te puede servir en cualquier rea de una organizacin debido a
que muestra los resultados de las actividades que bienes realizando.
En la economa se utiliza como una herramienta de prediccin para pronosticar el
comportamiento futuro, por ejemplo, de los precios de los metales (oro, plata, cobre) tomando
como base el comportamiento pasado de los precios de los mismos. Tambin puede servir para
estudiar el comportamiento de la bolsa de valores, de ciertos productos bsicos, los economistas
por lo regular se sienten magos que creen predecir cosas. En general, la Estadstica suministra los
valores que ayudan a descubrir interrelaciones entre mltiples parmetros macro y
microeconmicos, a travs de la evaluacin de modelos economtricos para el establecimiento de
polticas econmicas; anlisis del costo de la canasta bsica, el poder adquisitivo de la poblacin,
etc.
5. La estadstica en la Banca y Seguros
El profesional del seguro de vida ha de ser capaz de asignar primas suficientes para cubrir las
cantidades que habr de pagar la compaa en el caso de muerte del asegurado. En consecuencia,
la prediccin adecuada de las probabilidades de muerte constituye uno de los ejes centrales de la
reduccin del riesgo que se asume. Por ello, el objetivo de la Estadstica de Seguros es una
presentacin exhaustiva de los mtodos disponibles para ajustar tablas de mortalidad y tablas de
seguros no vida, ejemplo, aseguramiento de vehculos, viviendas, etc.
Por otra parte, algunas de las aplicaciones concretas de la Estadstica en el sistema bancario son
las siguientes:
Sistemas de concesin de tarjetas de crdito y fijacin de su lmite.
Sistemas de estimacin del potencial econmico de los clientes.
Definicin de tipologas comerciales de clientes.
Determinacin del pblico objetivo en campaas comerciales.
Modelizacin del riesgo segn las caractersticas de los clientes.
Aplicacin de la teora de colas para brindar un servicio de calidad.
Finalmente, es de mucha utilidad la tcnica de minera de datos para el anlisis de bases de
datos del sistema bancario.
Homogeneidad - que todos los miembros de la poblacin tengan las mismas caractersticas
segn las variables que se vayan a considerar en el estudio o investigacin. Por ejemplo, si se
fuera a investigar la incidencia de la drogadiccin entre jvenes mujeres adolescentes, entonces
hay que definir claramente las edades que comprenden la adolescencia y cuando se seleccione la
poblacin asegurarse de que todas las personas entrevistadas sean de la edad determinada y del
sexo femenino. (La adolescencia se define operacionalmente como el periodo comprendido de
edad que flucta entre 12 y 21 aos.)
Tiempo - se refiere al perodo de tiempo donde se ubicara la poblacin de inters. Determinar si
el estudio es del momento presente o si se va a estudiar a una poblacin de cinco aos atrs o si
se van a entrevistar personas de diferentes generaciones.
Espacio - se refiere al lugar donde se ubica la poblacin de inters. Un estudio no puede ser muy
abarcador y por falta de tiempo y recursos hay que limitarlo a un rea o comunidad en especfico.
Cantidad - se refiere al tamao de la poblacin. El tamao de la poblacin es sumamente
importante porque ello determina o afecta al tamao de la muestra que se vaya a seleccionar,
adems que la falta de recursos y tiempo tambin nos limita la extensin de la poblacin que se
vaya a investigar.
MUESTRA - la muestra es un subconjunto fielmente representativo de la poblacin.
Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione depender de la calidad y
cun representativo se quiera que sea el estudio de la poblacin, en este sentido, la muestra puede
ser:
ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser
incluido.
Un procedimiento de extraer una muestra aleatoria de una poblacin finita es: enumerar todos
los elementos que conforman la poblacin, escribir esos nmeros en papelitos y echarlos en una
urna o bolsa mezclarlos bien removindolos y sacar uno a uno tantos como lo indique el tamao
de la muestra. En este caso los elementos de la muestra lo constituirn los elementos de la
poblacin cuyos nmeros coincidan con los extrados de la bolsa o urna.
El tamao de la muestra (MAS):
Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de
unidades de anlisis (personas, organizaciones, captulo de telenovelas, etc), que se necesitan
para conformar una muestra n que me asegure un error estndar menor que 0.01 ( fijado por el
muestrista o investigador), dado que la poblacin es aproximadamente de N elementos.
En el tamao de una muestra de una poblacin se debe tener presente la varianza poblacional,
error mximo permisible prefijado (diferencia del parmetro y estimador), con un nivel de
confianza de 1 . Simblicamente se refiere a lo siguiente: P X d 1 , bajo este
11
=1.96
: Para calcular la desviacin estndar hay que solicitar la estatura de cada estudiante y luego
2
1 n
xi x , posteriormente se
n i 1
obtiene la raz cuadrada y ese es el valor que se debe utilizar en esta ecuacin. Supongamos
que =12cm, entonces:
Determinar:
Z
1
2
n
d
2
n 12(1.96) 5.53 n 6
10
elementos en el estrato i=1, 2, , k . No se entrar en detalle del clculo del tamao muestral, ya
que supera el alcance de esta asignatura.
12
Personas
Grupos humanos
Poblaciones completas
Unidades geogrficas determinadas
Eventos o interacciones sociales (enfermedades, accidentes, casos de infecciones
intrahospitalarias, etc)
Entidades intangibles, susceptibles de medir (exmenes, das, camas)
13
Por ejemplo, si vas a comprar pintura azul en la ferretera te presentan una escala con diferentes
tonalidades del color azul y cada tonalidad posee un nmero, pero este nmero slo es para
facilitar al vendedor identificar el color solicitado entre cientos de colores. De igual modo en
muchas solicitudes se le asigna el nmero 1 al sexo masculino y nmero dos al femenino y esta
clasificacin slo es para facilitar los cmputos y manejos de informacin estadstica, pero no
quiere decir que los masculinos tengan ms o menor valor que las del sexo femenino. Los
nmeros que se utilizan para efectos de identificacin en una escala nominal nunca se utilizarn
para llevar a cabo los procedimientos matemticos de suma, resta, multiplicacin y divisin.
utilizan este tipo de escalas, estn divididos en unidades iguales, la diferencia en la temperatura
entre 100 grados y 101 grados es equivalente a la diferencia entre 110 grados y 111 grados.
La numeracin de los aos en nuestro calendario utiliza tambin una escala de intervalos. Las
autoridades eclesisticas y gubernamentales de la poca decidieron arbitrariamente fijar como el
ao 1 el del nacimiento de Cristo y como unidad de medida un lapso de 365 das. Por lo tanto, el
lapso de tiempo que estuvo Bill Clinton como presidente de los Estados Unidos desde 1993
2001 es igual al que transcurri George Bush desde 2001 2009.
CARACTERSTICAS
USOS/EJEMPLOS
LIMITACIONES
Nominal
Ordinal
Intervalo
Razones
Restringida
para
Identificar
diferencias relativas, pero no
precisa diferencias en cantidad
absoluta entre personas u objetos.
Razones no tienen sentido ya que el
punto
cero
es
establecido
convencionalmente.
17
objetivo
es
obtener
18
Escala nominal
Escala ordinal
Escala de intervalo.
Escala de razn
19
Cualitativas o atributos
Variables
Cuantitativas : Discretas o Continuas
Las variables cualitativas o atributos son aquellas que no toman valores numricos. Describen
diferentes cualidades denominadas modalidades. Ejemplo: Sexo, estado civil, color de los ojos,
etc. Las variables cualitativas estn formadas por datos que toman valores numricos y pueden
ser discretas, si slo toman un nmero entero de valores, y continuas, si pueden tomar cualquier
valor real dentro de un intervalo.
Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la distribucin de
frecuencias y b) la representacin grfica.
20
La siguiente tabla recoge las principales caractersticas de una distribucin de frecuencias simple
o no agrupada.
Datos
x1
Frecuencias Absolutas
Simples
Acumuladas
N1 n1
n1
x2
n2
N 2 n1 n2
.
.
.
xk
.
.
.
nk
Frecuencias Relativas
Simples
Acumuladas
f1 n1 / n
F1 N1 / n
f 2 n2 / n
F2 N 2 / n
f k nk / n
.
.
.
Fk N k / n
.
.
.
.
.
k
N k ni
i 1
Total
ni n
i 1
f
i 1
La primera columna representa los distintos valores de esos datos y la segunda la frecuencia
simple, es decir, el nmero de veces que se ha observado el correspondiente valor; la tercera
columna recoge la frecuencia acumulada (nmero de veces que se han observado valores
menores o iguales que el que corresponde a dicha fila). Las frecuencias relativas se obtienen a
partir de las frecuencias absolutas, dividiendo por el tamao de la muestra.
Verde
Azul
Color de ojos
k 4
Marron
Negro
Representamos mediante n1, n2, , nk el nmero de datos que aparecen en cada una de las k
categoras.
Frecuencia absoluta de la clase i-sima (ni): nmero de observaciones en la clase i.
21
Nos permiten comparar las frecuencias de las categoras en conjuntos de datos con
distinto nmero de observaciones
Distribucin de frecuencias: es la tabla que presenta las categoras de una variable y sus
respectivas frecuencias.
1
2
Nivel educativo
3
sin estudios
primarios
medios
sup eriores
N n1 n2 n3 n4 3 7 6 4 20
Frecuencias relativas:
f1
3
0,15;
20
f2
7
0,35;
20
f3
6
4
0,3; f 4
0,2
20
20
Distribucin de frecuencias:
Categoras
ni
fi
1. Sin estudios
0,15
2. Primaria
0,35
3. Media
0,3
4. Superior
0,2
N=20
B)
23
A principios del Siglo XX, Vilfredo Pareto (1848-1943), un economista italiano, realiz
un estudio sobre la riqueza y la pobreza. Descubri que el 20% de las personas
controlaba el 80% de la riqueza en Italia.
La grfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar
visualmente en una sola revisin las minoras de caractersticas vitales a las que es importante
prestar atencin.
Algunos ejemplos de tales minoras vitales son:
La minora de clientes que representan la mayora de las ventas.
La minora de productos, procesos, o caractersticas de la calidad causantes del grueso de
desperdicio de los costos de retrabajos.
Ejemplo: Nivel educativo (Continuacin ejemplo 1)
Frecuencias relativas fi (Grfico de Pareto)
0. 40
0. 35
0. 30
0. 25
0. 20
0. 15
0. 10
2
f2=0,35
f2+ f3=0,35+0,3=0,65
f2+ f3+ f4=0,35+0,3+0,2=0,85
f2+ f3+ f4+f1=0,35+0,3+0,2+0,15=1
Un 35 por ciento de la poblacin llega hasta la educacin primaria y el 65 por ciento de la
poblacin tiene un nivel educativo primario o media.
24
Diagrama de Pareto
1.0
0.8
0.6
0.4
0.2
0.0
2
1.
2.
3.
4.
Categoras
Sin estudios
Primario
Medio
Superior
ni
3
7
6
4
N=20
fi
0,15
0,35
0,3
0,2
1
25
1 trabajadores agrarios
2 empresarios agrarios
3 obreros
SOC 4 autonomos
5 clase media
6 clase alta
7 retirados
(b)
n2=9
n6=3
n7=11
n3=25 n4=3
n5=16
f1
n1
8
0,11
N 75
f2
n2
9
0,12
N 75
f3
n3 25
0,33
N 75
f4
n4
3
0,04
N
75
n
16
0,21
N
75
f6
n6
3
0,04
N
75
f7
n7
11
0,15
N
75
Ntese que:
f1 f 2 f 3 f 4 f 5 f 6 f 7
i1
26
Distribucin de frecuencias:
1.
2.
3.
4.
5.
6.
7.
Categora
Trabajadores agrarios
Empresarios agrarios
Obreros
Autnomos
Clase media
Clase alta
Retirados
(c)
ni
8
9
25
3
16
3
11
N=75
fi
0,11
0,12
0,33
0,04
0,21
0,04
0,15
1
0. 8
0. 6
0. 4
0. 2
0. 0
3
f3=0,33;
f3+f5=0,33+0,21=0,54
f3+f5+f7=0,33+0,21+0,15=0,69
f3+f5+f7+f2=0,33+0,21+0,15+0,12=0,81
f3+f5+f7+f2+f1=0,33+0,21+0,15+0,12+0,11=0,92
f3+f5+f7+f2+f1+f4=0,33+0,21++0,11+0,04=0,9
F3+F5+F7+F2+F1+F4+F6=0,33+0,21++0,04+0,04=1
El 33 por ciento de la poblacin son obreros y el 54 por ciento de la poblacin son obreros o clase
media, y as sucesivamente.
27
Grfico de sectores:
En el caso de variables cualitativas el diagrama circular se utiliza con mucha frecuencia. Consiste
en representar sobre un crculo los diferentes atributos, mediante un sector circular de ngulo
proporcional a la correspondiente frecuencia. El ngulo de cada sector circular se calcula
multiplicando por 360 la frecuencia relativa.
Los grficos de sectores, tambin conocidos como diagramas de "tartas o pastel", se divide un
crculo en tantas porciones como clases tenga la variable, de modo que a cada clase le
corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Si el nmero de
categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo
suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de cuatro
categoras. En este caso se pueden apreciar con claridad dichos subgrupos.
Ejemplo.
La poblacin segn nivel de estudio del Municipio de Ayutuxtepeque se presenta en el siguiente
cuadro:
Primaria o Educacin Superior no Tcnico
Superior
Parvularia bsica
media
universitaria universitario universitaria Maestra Doctorado Total
1168
15895
6842
499
363
4556
70
7 29400
Fuente: VI Censo de Poblacin y V de Vivienda, El Salvador, 2007.
Es evidente que la mayora de la poblacin tiene un nivel educativo bsico o media con el
54.06% y 23.27% respectivamente. En general la poblacin de Ayutuxtepeque tiene un nivel
educativo relativamente bajo, son muy pocos los que llegan a hacer estudios universitarios.
28
Madres
278290
509469
339180
177050
92233
50916
27791
15004
7328
7366
Ejemplo.
La poblacin segn condicin de ocupacin del Municipio de Ayutuxtepeque se presenta en el
siguiente cuadro:
REA URBANA
EL ZAPOTE
LOS LLANITOS
Total
29
L0 L1
L1 L2
x2
n2
N 2 n1 n2
.
.
.
Lk 1 Lk
.
.
.
xk
.
.
.
nk
Frecuencias Relativas
Simples
Acumuladas
f1 n1 / n
F1 N1 / n
f 2 n2 / n
F2 N 2 / n
f k nk / n
.
.
.
Fk N k / n
.
.
.
.
.
k
N k ni
i 1
Total
ni n
i 1
f
i 1
A cada uno de los intervalos se les denomina clase y al punto medio marca de clase. A efectos de
clculo la marca de clase se elige como representante del intervalo. El nmero de clases en que se
dividen los datos no debe ser excesivo. A modo orientativo, el nmero de clases se puede obtener
mediante la siguiente frmula emprica, llamada de Sturges:
3 log(n)
nmero de clases
(Tomar la parte entera)
2 log(2)
30
31
32
[50,
60)
[60,
70)
[70, 80)
[80,90)
[90,
100)
[100,
110)
[110,
120)
fi
10
16
14
10
62
67
68
72
65
73
66
75
69
65
75
62
73
57
76
55
80
74
55
75
63
69
65
75
65
73
68
66
67
62
55
67
62
68
58
79
55
68
65
63
64
68
75
81
65
81
66
73
67
63
60
59
80
64
64
56
71
65
63
59
Ventas
1,107
1,041
535
333
164
110
725
8. Las edades de los empleados de una determinada empresa son las que aparecen en la
siguiente tabla:
Edad
N de empleados
Menos de 25
22
Menos de 35
70
Menos de 45
121
Menos de 55
157
Menos de 65
184
Sabiendo que el empleado ms joven tiene 18 aos, escrbase la distribucin de frecuencias para
datos agrupados (amplitud del intervalo definida segn su conveniencia).
34
1
x1n1 x2n2 . . . xk nk
n
Media geomtrica
G x1n1 x2 n2 . . . xk nk
Media armnica
1/ n
n
n1 n2
nk
. . .
xk
x1 x2
35
lo que se pretende presentar, ya que la distribucin de los datos puede requerir de la aplicacin de
un promedio diferente a la media, ya sea, media geomtrica o media armnica.
Le media es altamente sensible a cualquier cambio en los valores de la distribucin. No es
recomendable su uso cuando la variable est dada en forma de tasas o porcentajes. La media es
representativa del conjunto de datos si se quiere promediar cantidades semejantes, que presentan
variaciones dentro de un margen razonable.
Media Aritmtica simple. Se define como el cociente que se obtiene al dividir la suma de los
valores de la variable por el nmero total de observaciones. Su frmula est dada por:
n
i 1
n
Ejemplo. Supongamos que en un almacn tienen empleados a 12 vendedores, y sus ingresos
mensuales son: $ 585, $ 521, $ 656, $ 465, $ 536, $ 487, $ 564, $ 490, $ 563, $ 1234, $ 469 y $
547. Se pide determinar la media de los ingresos de los 12 vendedores.
Solucin.
x
i 1
fi
n
Si los datos estn agrupados en clase, no se conoce el valor de x, por lo tanto se toma el punto
medio de cada clase en vez de x (marca de clase).
Propiedades de la media.
Dada la importancia de la media y su uso frecuente, conviene considerar algunas de sus
propiedades:
1. La suma de las desviaciones respecto a la media es cero, esto es:
36
( x x)n
i 1
( x c)n
variable, ms (o menos) la constante, es decir,
i 1
xc
x n
i
i 1
donde n n1 n2 ... nm
3, 453
n1 n2
1200 800
En promedio el inversionista gasta $ 3,453 dlares en las 2000 acciones.
n1
n2
nk
37
tanto el producto de los xi como su raz n-sima, pueden ser un valor demasiado alto que dificulte
las operaciones. Para obviar esta dificultad se transforma la ecuacin anterior en:
k
ni ln xi
. Es obvio que las dos ecuaciones son equivalentes, esta ltima
Mg exp i 1
n
7 x5x4 5.192
La Mg da una cifra de ganancia ms conservadora porque no tiene una ponderacin alta para la
tasa de 7%.
Ma
ni
x
i 1
Ma
n
ni
i 1 xi
k
Ma
1
1
x1
x2
par de zapatos.
Ma
2
1
1
50 40
El mayor uso de la media armnica es para calcular la velocidad promedio. Recordemos que:
38
dista n cia
, supongamos que se han recorrido k trayectos (distancias) a cierta
tiempo
velocidad cada trayecto, entonces la velocidad media vendr dada por:
Velocidad
Vm
k
di
i 1 Vi
d
di
i 1 Vi
k
Vm
d
200
86.956
k
80 120
di
100
80
i 1 Vi
3.1.4. La moda
La moda es una medida de posicin, menos importante que los promedios y su uso es bastante
limitado. Se utiliza en distribuciones cuando la variable o el atributo presentan una frecuencia
demasiado grande con respecto a las dems.
La moda se define aquel valor de la variable o del atributo que presenta la mayor densidad, es
decir, la mayor frecuencia.
Si se tiene un atributo o una variable con mxima frecuencia, la distribucin es unimodal. Si hay
dos valores en la variable con la misma frecuencia mxima, la distribucin es bimodal. Si hay
ms de dos, la distribucin es multimodal. Cuando ninguno de los valores que toma la variable se
repite, no existe moda.
Datos agrupados.
Cuando la moda se aplica a una variable continua, se requiere que la amplitud de los intervalos
sea constante. A se presenta una frmula para obtener una aproximacin del valor modal:
ni 1
Moda Li 1
C
ni 1 ni 1
39
3.1.5. La mediana.
La mediana de una distribucin de frecuencia corresponde al valor, supuesto los datos ordenados
de menor a mayor, que deja a ambos lados el mismo nmero de observaciones. Cuando
calculamos la mediana en datos no agrupados, ordenamos las observaciones de menor a mayor o
viceversa. En su clculo se presentan dos casos:
a) Cuando el nmero de datos es impar: En este caso la mediana coincide con el dato central.
Ejemplo: Consideremos los salarios en dlares para 11 vendedores; 243, 320, 311, 254, 234,
261, 239, 310, 218, 267, 287. Calcular la mediana.
Solucin:
Primero ordenar los datos de menor a mayor: 218, 234, 239, 243, 254, 261, 267, 287, 310, 311,
320
La posicin donde se encuentra la mediana: (11+1)/2=6, la mediana se encuentra en la sexta
posicin y corresponde al valor de: Md=261.
b) Cuando los datos son pares: La mediana ser el trmino medio de los dos valores centrales.
Ejemplo. Consideremos los salarios en dlares para 12 vendedores; los cuales se han
presentado ordenados anteriormente 218, 234, 239, 243, 254, 261, 267, 287, 310, 311, 320 y
322:. Calcular la mediana.
Solucin:
n 1 12 1
Para obtener la posicin central se aplica la siguiente frmula:
6.5 , entonces
2
2
la mediana corresponde al promedio de los dos valores sombreados de amarillo, esto es:
Md=(261+267)/2=264.
Quintiles
Se representan con la letra K. Su frmula aproximada es i*n/5.
Deciles
Se representan con la letra D. Son 9 valores que distribuyen la serie de datos, ordenada de
forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos
concentra el 10% de los resultados. Su frmula aproximada es i*n/10.
Es el decil i-simo, donde la i toma valores del 1 al 9. El (i*10) % de la muestra son
valores menores que l y el 100-(i*10) % restante son mayores.
Percentiles
41
Q j ;k Li 1
jn / k Ni 1
Ci
ni
Con el objeto de que no exista dependencia de los valores extremos, se introduce el recorrido
intercuartlico, que es la semidiferencia entre el tercer y el primer cuartil:
R1
Q3 Q1
2
Se define tambin la desviacin absoluta media como la media de los valores absolutos de las
diferencias de los datos a la media, es decir:
AM
1 k
xi x ni
n i 1
42
S X Varianza
La relacin entre la varianza de una variable X y la de una nueva variable definida como a+bX
es:
Sa2bX b2 S X2
Por lo tanto, si a los datos de la distribucin les sumamos una cantidad constante la varianza no
se modifica y si multiplicamos por una constante, la varianza queda multiplicada por el cuadrado
de esa constante.
En ocasiones puede interesar comparar la dispersin de dos muestras y la desviacin tpica no ser
vlida, si las dos muestras tienen unidades diferentes. Para obviar este inconveniente se define el
coeficiente de variacin:
S
Desviacin Tpica
CV
X
Media
x
Que no depende de cambios de escala en la variable.
m
n i 1
g1 33
3/ 2
S
2
1 k
n xi x ni
i 1
con curtosis baja tienen forma aplanada (platicrticas). La comparacin se realiza respecto a una
distribucin moderada como es la distribucin normal (mesocrtica). El coeficiente de curtosis
viene dado por:
1 k
xi x
n i 1
m
g 2 44 3
S
1 k
n xi x
i 1
ni
ni
G x1n1 x2 n2 . . . xk nk
1/ n
216 .
44
18.85
21.55
24.25
26.95
29.65
32.35
35.05
11
11
Pruebas
1
57
55
54
52
62
55
59
80
40
62
72
46
80
40
46
Se pide:
a) Calcular el nmero medio de hijos, la mediana y la moda.
b) Calcular los cuartiles y el decil 7.
c) Analizar la dispersin de la distribucin, interpretando los resultados.
d) Analizar la forma de la distribucin calculando los coeficientes correspondientes. Comente los
resultados.
19) La siguiente distribucin expresa el nmero de vehculos vendidos durante un mes por cada
uno de las 50 sucursales que una determinada firma tiene en El Salvador:
xi: nmero de
vehculos
vendidos
1
3
4
6
10
ni: nmero
Sucursales
5
12
20
8
5
Se pide:
a) Media aritmtica, mediana y moda. Qu puede decir de la asimetra de la distribucin con
estos datos?
b) Desviacin tpica, Coeficientes de asimetra de Fisher y curtosis. Comente los resultados.
20) La siguiente tabla recoge la cifra de ventas (en miles de millones) y el nmero de empleados
(en miles) de las diez mayores empresas del sector de automvil durante el ao 1989:
Empresa
SEAT
Fasa Renault
General Motors
Ford
Citroen
Peugeot
Nissan
Mercedes Benz
ENASA
Ventas
457.3
449.7
372.7
356.1
224.6
198.0
161.1
110.7
97.3
Plantilla
23.8
19.2
9.4
9.5
7.6
6.7
6.6
3.4
5.5
47
21) Una empresa dedicada al cultivo y explotacin de naranjos posee 5 fincas. La produccin de
naranjas y el rendimiento medio por hectrea para cada una de las fincas estn dados en la
siguiente tabla. Calcular el rendimiento medio por hectrea para el total de las 5 fincas.
Produccin (Tm) Rendimiento (Tm/Ha)
Finca 1
15
9
Finca 2
5
2
Finca 3
20
10
Finca 4
8
4
Finca 5
30
20
Solucin.
El rendimiento medio por hectrea en el total de la fincas vendr dado por el cociente entre el
total de la produccin y el total de hectreas. Esta ltima cantidad la podemos calcular como
cociente produccin/rendimiento en cada finca:
Total produccin
15 5 20 8 30
= 8.07 Tm/hectrea.
Total hectrea
15 / 9 5 / 2 20 /10 8 / 4 30 / 20
Observe que la frmula aplicada coincide con la media armnica de los rendimientos ponderados
por la produccin de cada fila.
RM
22) La primera etapa de un rally consta de 4 tramos cronometrados. En cada uno de los 4 tramos,
un determinado piloto ha alcanzado las siguientes velocidades medias:
Tramo 1
Tramo 2
Tramo 3
Tramo 4
Distancia (km)
20
10
15
30
Calcular la velocidad media total alcanzada por el piloto en la primera etapa del rally.
Solucin.
La velocidad media total vendr dada por el cociente entre el total de la distancia y el tota del
tiempo:
VM
Total tiempo
20 /120 10 / 70 15/ 80 30 / 90
Observe que la frmula aplicada vuelve a ser la media armnica, de las velocidades ponderadas
por la distancia de cada tramo.
23) Se tienen tres ciudades A, B y C. La distancia que hay de B a C es el triple de la distancia de
A a B; y la distancia de C a A es el doble de la distancia de B a C. Un automovilista viaja de
A a B a 70 Km/h de B a C a 75 Km/h y de C a A 85 Km/h. Determine el promedio de
velocidad para el viaje completo.
48
24) En la asignatura de Matemtica Bsica se obtuvo una nota media de 4 puntos y desviacin
estndar 1.8. Se aaden 20 nuevos datos, todos iguales a 4 puntos.
a) Calcular la media total
n1 S X2 1
b) Verificar que la varianza total est dada por: 20 n1 , donde n1 es el nmero de
S2
alumnos del primer grupo y X1 representa la varianza del primer grupo de alumnos.
25) Supongamos que se tienen dos variables aleatorias X, Y de las que se conocen los siguientes
datos muestrales: X , S x , g1X , yi kxi b y n tamao de la muestra (k y b son constantes
positivas). Calcular:
a) La media y la desviacin estndar de Y
b) Comparar el coeficiente de asimetra de ambas variables
Como tenemos que los trabajadores del turno de da reciben en promedio $800 dlares menos
que los de la noche
Entonces
Ecu. 1
870,000= 100
- 32,000
902,000=100
=
9,020=
Sustituyendo
en Ecu.1 tenemos
=
= 8220, salario promedio en el grupo uno.
3. En un supermercado trabajan 35 mujeres, con un salario promedio mensual de $ 650
dlares y 15 hombres en promedio ganan un 12% ms que las mujeres cul es el salario
promedio de los empleados del supermercado?
Solucin
Datos
= 35
=15
Ahora como tenemos dos grupos utilizamos la media ponderada
, sustituyendo
semanas
Construccin(km)
Construccin promedio(km/d)
4.82
0.9
20.50
3.4
10.18
1.7
32.83
65.66
10
Ma=
Ma=
= 4.39km/d
Solucin
Sean:
Md=6
Mg=
n=3
Como la mediana es el valor central entonces
Md=
6=
Entonces los nmeros son x1= 3, X2=6 y X3=12
Luego encontrar la media armnica de los tres nmeros
= 9.25
, Ecu. 1
Ahora utilicemos la media geomtrica
4=
, sustituyendo
52
16=
+16=0
(
Sustituyendo
en Ecu 1
Sustituyendo
en Ecu 1
= 3.2
7. Una persona viaja 4 das. Diariamente recorre 200km, pero maneja el primero y el ultimo
da a 50km/h. cul es la velocidad media durante el viaje?
Solucin
Construimos la siguiente tabla
das
Distancia(km)
200
50
200
55
200
70
200
50
53
= 55.19
= 38.29
9. Un fabricante dispone $600,000 anuales para la compra de materia prima. Durante tres
aos invierte la misma cantidad de dinero. Si el precio promedio por kg ha aumentado en
los ltimos tres aos sucesivamente de $2,200 a $2,280 y luego a $4,600. Cul es el
precio promedio que ha pagado el fabricante en los tres aos?
Solucin
Utilizar la media geomtrica
Mg=
Sustituyendo los valores tenemos
Mg=
=3,048.69
10. El primero de mayo de 2002 se ahorraron $50,00 en un banco al 7.6% del inters anual,
capitalizado semestralmente. Obtener la cantidad media depositada en la cuenta, entre el
primero de mayo de 2002 y el 31 de octubre de 2006, suponga que no se hicieron retiros
durante el periodo.
54
Solucin
Como el problema se refiere a inters se utiliza la media geomtrica
Mg=
Semestres
ao
capital
Ln
1/05-31/10
2,002
50,000
10.82
1/11-31/05
2,002
51,900
10.85
1/05-31/10
2,003
53,872.2
10.89
1/11-31/05
2,003
55,919.34
10.93
1/05-31/10
2,004
58,044.27
10.97
1/11-31/05
2,004
60,249.95
11.01
1/05-31/10
2,005
62,539.44
11.04
1/11-31/05
2,005
64,915.94
11.08
1/05-31/10
2,005
67,382.74
11.12
Total
Mg=
98.71
Mg=
, tenemos
=29.81
11. Tres amas de casa fueron a comprar a tres mercados diferentes. Cada una gasto $10
dlares en la compra de naranjas. La ama de casa A compro 4 docenas de naranjas, la ama
de casa B compro 6 docenas de naranjas y la ama de casa C, compro 3 docenas de
naranjas. Cul es el precio promedio por docena?
55
Solucin
A=
B=
C= =3.3
12. el siguiente cuadro muestra la distribucin de renta anual (en miles de dlares) en que
incurren 50 viviendas.
Marca de clase
18.85
21.55
24.25
26.95
29.65
32.35
35.05
N de viviendas
11
11
18.85
20.2-<22.9
21.55
22.9-<25.6
24.25
12
25.6-<28.3
26.95
19
28.3-<31
29.65
11
30
31-<33.7
32.35
11
41
33.7-<36.4
35.05
50
Total
n=50
56
-hallar la media
-hallar la mediana
Md=
Buscar la clase
Md=
-hallar la moda.
Como la moda en los datos agrupados en clases es el valor que ms se repite pero en las
frecuencias simples entonces tenemos dos clases modales (las que tiene color rosado)
Para encontrarlas utilizamos
Md=
Md=
Md=
=29.95
Md=
=32.21
-desviacin estndar
Para encontrarla deb primero conocer la varianza y esta viene dada por la siguiente formula
57
b) estime el porcentaje de viviendas con rentas superiores o iguales a 26,000 dlares pero
menores que 32,000 dlares
13) una compaa requiere los servicios de un tecnico especializado. De los expedientes
presentados, se han seleccionado dos candidatos: A y B los cuales renen los requisitos mnimos
requeridos. Para decidir cul de los dos se va a contratar, los miembros del jurado deciden tomar
siete pruebas a cada uno de ellos. Los resultados se dan a continuacin.
Pruebas
57
55
54
52
62
55
59
80
40
62
72
46
80
40
58
Mediana
Entonces
55
62
-hallar moda
40
80
59
,
Entonces estadsticamente el candidato que debe de ser contratado es el A, ya que el coeficiente
de variabilidad de este es ms pequeo que el del candidato B, es decir que la media de A es ms
representativa.
14. se toman las medidas de 80 personas las que tiene estatura media de 1.70m y desviacin
estndar de 3.4cm. Posteriormente se verifico que la media usada tena 4 cm de menos.
Rectifique los estadsticos mencionados.
Solucin
Tenemos que
60
Por propiedad de la varianza sabemos que si a todos los datos que tenemos le sumamos o le
restamos algo esta no cambia entonces la varianza ser la misma
=3.4
15) una asistencia social desea saber cul es el ndice de natalidad en 2 municipios de san
salvador para ello encuesto a 10 familias de cada municipio obteniendo los siguientes resultados.
A
-mediana
Ordenar los datos de los municipios
A
B
Buscar la posicin
4
4
6
61
b) Considera Ud. que el distrito B, el nmero de hijos por familia es ms homogneo que en el
distrito A. Para saber cual distrito es ms homogneo encuentro su respectivo coeficiente de
variacin
Encontrar desviacin estndar del municipio A
,
Entonces el municipio ms homogneo es el B.
16) El salario promedio anual en una ciudad es de 8,000 dlares, con una varianza de 1,000
dlares. Cules sern la nueva media y la nueva varianza si se efectan los siguientes cambios?
a) se aumenta 810 dlares a todos
62
=8000, pero como a cada uno de los trabajadores se les aumenta 810 dlares mas por propiedad
de la media se sabe que si a cada dato se le suma o se le resta una constante entonces esta
constante se le suma o se le resta a la media, entonces tendremos
=8000+810=8,810, esta es la nueva media
Ahora para encontrar la varianza lo hacemos por la propiedad que dice que si a cada uno de los
valores se le suma o resta una constante la varianza no cambia entonces
=1,000,
b) Se aumenta el 15% de su salario a cada trabajador
En lo anterior realizado se puede observar que a cada salario se est multiplicando por una
constante, y por propiedad de la media tenemos que si la media de multiplicar cada uno de los
valores de una variable por una constante es igual a multiplicar la constante por la media.
Entonces la nueva media ser
=8000x1.15=9,200
La nueva varianza la encontramos utilizando la propiedad que dice que si todos los datos son
multiplicados por una constante entonces se multiplica la constante al cuadrado por la varianza
entonces tendremos
=1,000x
c)
=1322.5
63
17) En un examen 20 alumnos del curso A obtienen una media de 60 puntos y desviacin
estndar de 20 puntos. En el curso B los alumnos obtienen una media de 80 y desviacin
estndar de 16. Ante unos reclamos se decide subir en 5% mas 5 puntos adicionales a todos
los alumnos del curso A, en cambio como hubo muchas copias en el curso B se decidi
disminuir la quinta parte de la calificacin. Despus de los mencionados ajustes cul es el
puntaje promedio de los 50 alumnos?
Solucin
Datos
A
B
=20
=30
60
80
20
16
= 22.05,
64
80x = 64
= 10.24,
18) se ha realizado un estudio entre 100 mujeres mayores de 15 aos y el nmero de hijos de las
mismas. El resultado ha sido:
13
20
25
20
11
4
N=100
.se pide:
a) Calcular el nmero medio de hijos, la mediana y la moda.
65
b) La media
=2.33
-mediana
Buscar la posicin
Entonces Md=2
-moda
Como en esta caso el valor que ms se repite es 2, entonces
Mo=2
c) Calcular los cuartiles y el decil 7
-cuartil 1
Buscar la posicin
Entonces
=1
-cuartil 2
Buscar la posicin
Entonces
=2
-cuartil 3
Buscar la posicin
Entonces
75
=3
-calcular el decil 7
Buscar la posicin
=3
d) Analizar la dispersin de la distribucin, interpretando los resultados.
66
Para ello deb calcular el coeficiente de variacin, para encontrarla deb primero conocer la
varianza y esta viene dada por la siguiente formula
=2.39
Comente su respuesta
Que es una distribucin platicurtica y asimtrica a la derecha
67
19) la siguiente distribucin expresa el nmero de vehculos vendidos durante un mes por cada
uno de las 50 sucursales que una determinada firma tiene en El Salvador.
12
20
10
5
N=50
.se pide
a) Media aritmtica, mediana y moda.
-media aritmtica
=4.38
-mediana
Buscar la posicin
Entonces Md=4
-moda
Como en esta caso el valor que ms se repite es 4, entonces
Mo=4
Se espera una distribucin aproximadamente simtrica
b) Desviacin tpica, coeficiente de asimetra de Fisher y curtosis. Comente resultados.
-desviacin tpica
-coeficiente de Fisher
=1.17
-calcular el coeficiente de curtosis
=1
Tiene una distribucin asimtrica a la derecha y platicurtica
20. la siguiente tabal recoge la cifra de ventas (en miles de millones de dlares) de las diez
mayores empresas del sector de automvil durante el ao 1989.
empresa
ventas
Plantilla
Sea
457.3
23.8
Fasa Renault
449.7
19.2
General Motors
372.7
9.4
Ford
356.1
9.5
Citroen
224.6
7.6
Peugeot
198.0
6.7
Nissan
161.1
6.6
Mercedes Benz
110.7
3.4
Enasa
97.3
5.5
69
,
Entonces existe ms homogeneidad en las ventas.
70
Luego lo dividimos entre mil para obtener las ventas medias por empleado
21) una empresa dedicada al cultivo y explotacin de naranjas posee 5 fincas. La produccin de
naranjas y el rendimiento medio por hectrea para cada una de las fincas estn dados en la
siguiente tabla. Calcular el rendimiento medio por hectrea par el total de las 5 fincas.
Fincas
Produccin( Tm)
Rendimiento(Tm/Ha)
15
20
10
30
20
22. la primera etapa de un rally consta de 4 tramos cronometrados. En cada uno de los 4 tramos,
un determinado piloto ha alcanzado las siguientes velocidades.
Tramos
Distancia(km)
Velocidad media(km/h)
20
120
10
70
15
80
30
90
71
.calcular la velocidad media total alcanzada por el piloto en la primera etapa del rally.
72
( x1 , y1 ), ( x2 , y2 ),. . ., ( xn , yn )
En este caso tenemos una variable estadstica bidimensional o distribucin bidimensional de
frecuencias, la cual representaremos por (X, Y). Cuando se cuenta con una gran cantidad de
datos, un modo de presentar la distribucin bidimensional es a travs de una tabla de doble
entrada de la forma:
Tabla de doble entrada
X/Y
y1
y2
. . . yj
...
yk
Total
x1
x2
.
.
.
xi
.
.
.
xl
n11
n12
. . . n1 j
...
n1k
. . . n2 j . . .
.
.
.
. . . nij . . .
.
.
.
. . . nlj . . .
n2k
.
.
.
nik
.
.
.
nlk
n1
n2
.
.
.
ni
.
.
.
nl
Total
n21 n22
.
.
.
.
.
.
ni 1 ni 2
.
.
.
.
.
.
nl 1 nl 2
n1
n2
. . . n j
...
n k
Donde los valores de X e Y pueden venir dados en intervalos, al igual que en el caso de una
dimensin. En el caso de que las dos variables sean atributos, la tabla anterior recibe el nombre
de tabla de contingencia.
La representacin grfica ms utilizada en el caso bidimensional es la nube de puntos o diagrama
de dispersin. Consiste en representar cada pareja de datos como un punto sobre unos ejes
cartesianos.
73
x1
x2
.
.
.
xl
n1
n2
.
.
.
nl
y1
y2
.
.
.
yk
n j
n1
n2
.
.
.
n k
X/Y= y j
x1
x2
.
.
.
xl
Distribuciones condicionadas de X e Y.
ni / j
n j /i
Y/X= x i
n1 j
n2 j
.
.
.
nlj
y1
y2
.
.
.
yk
ni1
ni 2
.
.
.
nik
Ejemplo:
Se desea investigar el ganado caprino (cabras) y el ganado ovino (ovejas) de un pas. En la tabla
de doble entrada adjunta se presentan los resultados de un estudio de 100 explotaciones
ganaderas, seleccionadas aleatoriamente del censo agropecuario. Se proporcionan las frecuencias
conjuntas del nmero de cabezas (en miles) de cabras (X) y ovejas (Y) que poseen las
explotaciones.
X\Y
0
1
2
3
4
0
4
6
9
4
1
1
5
10
7
4
2
2
7
8
5
3
1
3
5
5
3
2
1
4
2
3
2
1
0
a) Hallar las medias, varianzas y desviaciones tpicas marginales.
b) Hallar el nmero medio de cabras condicionado a que en la explotacin hay 2,000 ovejas.
c) Hallar el nmero medio de ovejas que tienen aquellas explotaciones que sabemos que no
tienen cabras.
74
Solucin:
Primero completar la tabla anterior con las distribuciones de frecuencias de X e Y.
X\Y
0
1
2
3
4
n j
4
5
7
5
2
23
6
10
8
5
3
32
9
7
5
3
2
26
4
4
3
2
1
14
1
2
1
1
0
5
ni
24
28
24
16
8
100
a) La media de X es:
La varianza de X es:
S 2X
S X S X 2 =1.2355
Observe que la media muestral es un buen representante de los datos, ya que la desviacin
estndar no es demasiado alta.
Para completar el literal a) debe obtenerse la media, varianza y desviacin estndar para la
variable Y.
b) El nmero medio de ovejas condicionado a que en la explotacin hay 2,000 cabras, se obtiene
manteniendo fija la columna donde la variable Y es igual a 2. Esto es:
3*3 4*2
= 1.3077
X / Y 2 0*9 1*7 2*5
26
75
Yi
nij
1
1
2
3
3
4
4
4
2
6
2
2
4
2
4
6
1
1
2
1
1
1
2
1
Solucin.
La tabla de correlacin pedida y sus distribuciones marginales estn dadas en la siguiente tabla:
Y/X 1
2
3
4
n. j
La distribucin de Y/X=3
2
1
2
1
1
5
Y/X=3 2
4
6
4
0
0
1
2
3
1
1
0
n j / i 3
6
1
0
0
1
2
ni.
10=N
Cov( X , Y ) S XY
x
l
i 1
Y nij
76
S X SY
1 n
( xi x )( y i y )
n i 1
2
1 n
1 n
( y i y )2
( xi x ) n
n i 1
i 1
De modo que valores de r cercanos a 1 indican una dependencia lineal y positiva entre las dos
variables, y valores de r cercanos a -1 indican dependencia lineal negativa. Cuando el valor de r
est cercano a cero, no existe dependencia lineal entre X e Y. Esto ltimo puede ser, bien porque
X e Y son variables independientes, o bien porque la dependencia existente entre ambas variables
es de otro tipo diferente al lineal.
---Observaciones
Yj
X1i Xii.Xin
---Yn
X1n Xin.Xnn
77
Se trata en general de estudiar las posibles relaciones existentes entre la distribucin de Y j y los
valores de las X ij . A la Y se le denomina generalmente la variable dependiente, mientras que
frecuentemente a X i se les llama variables independientes o exgenos del modelo, aunque se
prefiere denominarlas variables explicativas.
Los grficos de dispersin son tiles debido a que proporcionan informacin sobre la relacin
existente entre las variables, permiten sugerir modelos posibles, pueden sealar la existencia de
observaciones atpicas, etc.
EJEMPLO 1. Analicemos la relacin que existe entre el peso y la estatura segn el sexo en el
siguiente diagrama de dispersin. 1: Hombres, 2: Mujeres. ESTAPESO.xls
El diagrama presenta claramente, una relacin positiva entre las dos variables estudiadas, que se
refleja en una nube de puntos cuyo eje principal tiene un sentido creciente, como consecuencia
del hecho de que, en trminos generales, los individuos ms altos pesan ms que los ms bajos.
El diagrama tambin pone de manifiesto que las mujeres tienen en general valores menores de
ambas variables que los hombres, pero que la relacin entre PESO Y ESTATURA es bastante
similar en ambos sexos.
Covarianza. Coeficiente de Correlacin
Con el objetivo de dar una idea intuitiva del concepto de covarianza, razonemos el siguiente
diagrama de dispersin, correspondiente a las variables: TEMPERATURA-COSTO, en la que las
rectas horizontal y vertical sobre el conjunto de puntos corresponden a los valores medios (42.83,
79.25).
78
En este caso, existe claramente una fuerte relacin negativa, la mayor parte de los puntos caen en
los cuadrantes II Y IV. Cuando la relacin existente sea positiva la mayora de los puntos caern
en los cuadrantes I y III
Si consideramos para cada punto
x xy
xi , yi del
y vemos que ste resulta positivo en los cuadrantes I y III y negativo en los
cuadrantes II Y IV. Por lo tanto el producto anterior ser en promedio positivo si existe una
relacin creciente entre las dos variables (es decir, si la Y tiende a crecer cuando lo hace la X) y
negativo si la relacin existente es decreciente.
i
Por definicin la covarianza entre dos variables no es ms que el promedio de los productos de
las desviaciones de ambas variables respecto a sus medias respectivas. De forma similar a como
se procedi a definir la varianza, el promedio se calcula dividiendo por n-1 en vez de n.
x
n
Cov xy
i 1
x yi y
n 1
79
OBSERVACIONES
En general cuanto ms estrechamente se agrupen los puntos del diagrama de dispersin
alrededor de una recta ms fuerte es el grado de relacin lineal existente entre las dos
variables consideradas.
Es importante resaltar que tanto la covarianza como el coeficiente de correlacin miden
slo el grado de relacin lineal existente entre dos variables. Dos variables pueden tener
una relacin estrecha y sin embargo resultar r cercano a cero por ser dicha relacin no
lineal.
Es importante del conocimiento no estadstico del problema al momento de hacer
predicciones.
EJERCICIO 1.
Dada una alta inflacin, el seor Chvez ha cuidado mucho de su presupuesto. Como su casa
tiene calefaccin elctrica, llev un registro de la cuenta del consumo mensual de energa
elctrica durante el ao pasado y del promedio mensual de la temperatura exterior. Los datos
aparecen en la siguiente tabla. La temperatura est dada en grados Celsius y el costo de la energa
est en dlares. TEMPERACOSTO.xls.
Tabla2. Registro mensual: TEMPERATURA-COSTO.
Enero
Temperatura
Promedio
10
costo de
energa
120
Febrero
18
90
Marzo
35
118
Abril
39
60
Mayo
50
81
Junio
65
64
Julio
75
26
Agosto
84
38
Septiembre
52
50
Octubre
40
80
Noviembre
25
100
Diciembre
21
124
Mes
Identificar las variables, dependiente y explicativa. Hacer sus conjeturas de la relacin entre las
variables a partir del siguiente grfico y calcular la Cov xy y rxy .
80
Descriptive Statistics
Mean Std. Deviation N
TEMPERATURA 42.83
23.218 12
COSTO
32.628 12
79.25
Correlations
TEMPERATURA COSTO
TEMPERATURA Pearson Correlation
Sig. (2-tailed)
Sum of Squares and Cross-products
Covariance
N
COSTO
Pearson Correlation
Sig. (2-tailed)
Sum of Squares and Cross-products
Covariance
N
-.863**
.000
5929.667 -7188.500
539.061 -653.500
12
12
-.863**
.000
-7188.500 11710.250
-653.500 1064.568
12
12
81
En este apartado se explica el modelo de regresin lineal simple, un modelo con un solo regresor
x que tiene una relacin con una respuesta y, donde la relacin es una lnea recta. Este modelo de
regresin lineal simple es:
y o 1x
es una
componente aleatorio del error. Se supone que los errores tienen promedio cero y varianza
2 desconocida. Adems se suele suponer que los errores no estn correlacionados. Esto quiere
decir que el valor de un error no depende del valor de cualquier otro error.
o y 1
Estimacin de
Para estimar
o y 1
o y 1
1 tales que la suma de los cuadrados de las diferencias entre las observaciones yi y la lnea
82
recta
sea
mnima.
La
ecuacin
se
puede
yi o 1 xi i
escribir
i 1
n
S
2 yi
0 ,
i 1
0 1
0 1 , deben satisfacer
x 0
1 i
n
S
yi
1 ,
i 1
0 1
0 1 x x
i
0 1 x y
n
i 1
i 1
i 1
i 1
0 x 1 xi2 xi yi
i 1
siguiente: y x ;
0
1
n
n
yi xi
i 1
i 1
yi xi
n
i 1
n
xi
2
i 1
xi n
i 1
, en donde y
1 n
yi
n i 1
1 n
xi son
n i 1
cuadrados.
El
lineal
simple es
entonces:
y 0 1 x .Esta
determinada x.
Otra forma ms compacta de escribir
S xy , donde:
S xx
S xx
xi
n
n
2
2
xi i 1 xi x ;
n
i 1
i 1
S xy
yi y
n
n
xi
i
n
n
yi xi i 1 i 1 yi xi x
n
i 1
i 1
yi se
llama
residual, matemticamente el
0 1 xi i 1,2,....n .
i-simo residual es: i
i
i
i
ei Tiene un papel importante para investigar la adecuacin del modelo de regresin ajustado.
83
Tenemos que:
1 x
y x
n
S xy
i 1
S xx
S xx
E yi
E 1
E 0 0 ;
1 xi
Var 1
sxx
1 x2
Var 0 2
n sxx
Propiedades tiles
n
1. yi yi ei 0
i 1
i 1
n
i 1
i 1
2. yi yi
3. La lnea de regresin de mnimos cuadrados siempre pasa por el centroide de los datos
que es el punto
y, x
4.
xe 0
5.
y e 0
i i
i 1
n
i 1
84
Estimacin de 2
2
Adems de estimar 0 y 1 , se requiere estimar . Se obtiene de la suma de cuadrados
SC Re s ei
i 1
yi yi
i 1
n
y i 0 1 xi
i 1
n
y i y 1 x 1 xi
i 1
n
y i y 2 1 y i y xi x 1
i 1
n
i 1
x
n
i 1
yi 2 yi y y 2 1 xi yi 2 1 yi x 2 1 xi y 2 1 x y 1 s xx
i 1
yi 2n
2
y y
2 1
n
i 1
i 1
i 1
i 1
i 1
i 1
i 1
n y 2 1 xi y i 2 1
2
i 1
s
1
1
1 n
xx
y
x
n
x
y
.s xx
i i
1
i
i
1.
n i 1 i 1
n i 1 n i 1
s xx
n
n
1 n
x
i yi
n i 1 i 1
y i 2 n y n y 2 1 xi y i 2 1
2
i 1
i 1
1 n
x
y
i i 1 S xy
n i 1 i 1
n
n
n
2
1 n
2
yi n y 2 1 xi yi xi yi 1 S xy
n i 1 i 1
i 1
i 1
n
yi n y 2 1 S xy 1 S xy
2
i 1
n
SC Re s yi n y 1 S xy
2
i 1
y y y
n
Pero
i 1
i 1
2
2
n y SCT
85
SCRe s SCT 1 S xy
E SCRe s n 2 2
La suma de cuadrados residuales tiene n-2 grados de libertad, porque 2 grados de libertas se
0 y 1
yi . El estimador insesgado de
2 es:
2
SCRe s
CM Re s (Cuadrado Medio Residual)
n2
1 1
Se 1
0 0
Se 0
es t con n-2
1 es:
1 t 2,n2 Se 1 1 1 t 2,n2 Se 1
0 es:
0 t 2,n2 Se 0 0 0 t 2,n2 Se 0
86
Sea x 0 el valor o nivel de la variable regresora para el que se desea estimar la respuesta media, es
decir, E y . Se supone que x 0 es cualquier valor de la variable regresora dentro del intervalo
x0
de los datos originales de x que se usaron para ajustar el modelo.
Un estimador insesgado de E y se determina a partir del modelo ajustado como sigue:
x0
E y y x0 0 1 x0
x0
Para obtener un intervalo de confianza de 1001 % para E y , se debe notar primero que
x0
y x es una variable aleatoria normalmente distribuida, porque es una combinacin lineal de las
0
observaciones y i . La varianza de y
Var y
x0
x0 x
2 1
n
S xx
x0
es:
y / x E y / x0
0
x0 x
1
CM Re s
n
S xx
de libertad.
Un intervalo de confianza de 1001 % para la respuesta media en el punto x x 0 es:
1 x x
y x0 t ,n2 . CM Re s 0
n
2
S xx
1 x x
E y t
0
.
CM
Re
s
y x0
,n 2
x
n
2
0
S xx
Ntese que el ancho del intervalo de confianza para E y es una funcin de x 0 . El ancho del
x0
intervalo es mnimo para x0 x , y crece a medida que aumenta x0 x .
Las mejores estimaciones de y se hacen con valores de x cerca del centro de los datos.
87
H 0 : 1 10
H1 : 1 10
ei son NID 0, 2
E 1 1 (Promedio de 1 ); Var 1
(Varianza de 1 )
S xx
Estadstico t (Definicin)
Dentese a
CM Re s
Se 1
: Como el error estndar estimado o error estndar de la
S xx
pendiente, entonces t0
1 10
Se 1
t0 t 2 , n2 .
H 0 : 0 00
H1 : 0 00
t0
0 00
1 x2
CM Re s
n S xx
0 00
Se 0
1 x2
Error estndar de la ordenada al origen.
Se 0 CM Re s
n S xx
t0 t 2 , n2 .
Nota: El que una variable no sea significativa no quiere decir que en realidad no lo es, es
necesario el conocimiento no estadstico del problema para determinar por ejemplo si los
intervalos de los datos fue el adecuado.
88
Prueba de significancia de la regresin (Caso particular del test anterior: la conste es igual
a cero).
H 0 : 1 0
H1 : 1 0
cualquier x es y y
La verdadera relacin entre x e y no es lineal
Si se rechaza H 0 : 1 0 , explica que x tiene valor para explicar la variabilidad de y. Rechazar
Una aplicacin importante del modelo de regresin es predecir nuevas observaciones y que
correspondan a un nivel especificado de la variable regresora x. Si x 0 es el valor de inters de la
89
Var y 0 Var 0 1 x0
x0 x
2
2 1
S xx
n
1 x x
Var 1 0
S xx
n
2
1 x x
y 0 t ,n 2 . CM Re s1 0
n
2
S xx
Lo anteriormente expuesto se puede observar en el siguiente grfico que muestra las bandas de
confianza y de prediccin para un conjunto de datos.
SCR
SC Re s
1
. Se llama coeficiente de determinacin.
SCT
SCT
90
Y su valor esperado: E R 2
1 2 S xx
1 2 S xx 2
n
regresora x.
2
tenido en consideracin a x.
SCR
1; 0 R 2 1 .
SCT
xi , yi ,
i 1
yi xi
i 1
n
x i2
i 1
i
i
2
El estimador de 2 es: CM Re s i 1
n 1
n
y
i 1
2
i
1 y i xi
i 1
n 1
1 : 1 t , n 1
2
CM Re s
n
x i2
i 1
x 2 .CM Re s
E y : y t , n 1 0 n
x0
2
x0
xi2
i 1
91
x2
y 0 t , n 1 CM Re s1 n 0
2
2
xi
i 1
yi y
i 1
n
R2
y i y
n
i 1
n 2
yi
i 1
n
y i2
i 1
A veces, el diagrama de dispersin proporciona una gua para decidir si se ajusta o no el modelo
sin ordenada al origen. Tambin, se pueden ajustar ambos modelos y escoger entre ellos de
acuerdo con la calidad del ajuste obtenido. Si no se puede rechazar la hiptesis 0 0 en el
modelo sin ordenada al origen, quiere decir que se puede mejorar el ajuste si se usa es modelo.
El cuadrado medio de residuales es una forma til de comparar la calidad del ajuste. El modelo
que tenga el cuadrado medio residual menor, es el mejor ajuste.
En general, R
1 x x
y 0 t ,n 2 . CM Re s1 0
n
2
S xx
SCR
SC Re s
. Se llama coeficiente de determinacin.
1
SCT
SCT
Y su valor esperado: E R 2
1 2 S xx
1 2 S xx 2
92
regresora x.
2
en consideracin a x.
SCR
1; 0 R 2 1 .
SCT
Transformacin
Forma lineal
y 0 x 1
y log y, x log x
y log 0 1 x
y 0e 1x
y ln y
y ln 0 1 x
y 0 1 log x
x log x
y 0 1 x
x
0 x 1
1
1
, x
y
x
y 0 1 x
El grfico de dispersin muestra que los datos provienen de una funcin exponencial
y 0e 1x Con
y ln y
de Ln (Y)
2.944439
3.610918
4.276666
4.955827
5.686975
6.369901
6.902743
Como se esperaba, hoy los datos se ajustan a una lnea recta. El proceso manual para obtener la
ecuacin de prediccin es el mismo que el de regresin simple. En SPSS se obtiene siguiendo la
RUTA: Analyze>Regression> Linear (Dependent: LOGNATURAL, Independent: Horas>Ok
ANOVAb
Sum of
Squares
Model
1
Regression
Residual
Total
Df
Mean Square
12.627
.013
12.640
12.627 4936.297
Sig.
.000a
.003
94
ANOVAb
Sum of
Squares
Model
1
Regression
Residual
Total
Df
Mean Square
12.627
.013
12.640
Sig.
12.627 4936.297
.000a
.003
Coefficientsa
Unstandardized
Coefficients
Model
1 (Consta
nt)
Horas
Std. Error
2.278
.043
.336
.005
Standardized
Coefficients
Beta
Sig
Lower
Upper
Bound
Bound
53.28 .00
7
.999
70.25 .00
9
2.168
2.388
.323
.348
a. Dependent Variable:
LOGNATURAL
El modelo lineal encontrado es entonces: y 2.278 0.336.Horas . Para determinar el modelo
ajustado a los datos originales, se debe considerar la transformacin y ln y y su modelo
lineal: y ln 0 1 x . Resolviendo: ln 0 2.278 , entonces 0 9.757 .
Finalmente, el modelo ajustado es:
y 9.757e 0.336.Horas .
95
En el anlisis, ste caso se conoce el orden en que fueron recolectados los datos, y debe hacerse
para determinar si hay dependencia de los residuos con la secuencia del tiempo de recoleccin
Para realizar una regresin no lineal mediante SPSS tenemos que elegir los mens
Analize>Regression>Curve Estimation.
Este men nos da la opcin de calcular los siguientes modelos de regresin.
Lineal, Y 0 1 X
Logartmica, Y 0 1 ln X
Inversa Y
X
2
Cuadrtico Y 0 1 X 2 X
Cubico. Y 0 1 X 2 X 3 X
2
0 X o ln Y ln 0 1 ln X
X
Compuesto Y 0 1 o ln Y ln 0 X ln 1
Potencia. Y
96
Curva S Y e
Crecimiento Y e
Exponencial Y
o ln Y
0 1 X
t
o ln Y 0 1 X
0 e X o ln Y ln 0 1 X
1
Para el caso anterior, elegimos exponencial, y los resultados son los siguientes:
Model Summary
R
R Square
Adjusted R
Square
Std. Error of
the Estimate
.999
.999
.999
The independent variable is Horas.
.051
ANOVA
Sum of
Squares
df
Mean Square
Regression
12.627
1
Residual
.013
5
Total
12.640
6
The independent variable is Horas.
12.627 4936.297
.003
Sig.
.000
Coefficients
Unstandardized
Coefficients
B
Std. Error
Horas
.336
.005
(Constant)
9.755
.417
The dependent variable is ln(clulas).
Standardized
Coefficients
Beta
t
.999
70.259
23.394
Sig.
.000
.000
97
4.7. Ejercicios.
1. Determine una ecuacin que describa la relacin entre la frecuencia de accidentes y
el nivel de educacin preventiva
X
150
200
300
450
500
600
800
900
3900
Y
8.00
7.00
6.50
5.20
6.40
4.40
4.00
3.10
44.60
XY
1200
1400
1950
2340
3200
2640
3200
2790
18720
X2
22500
40000
90000
202500
250000
360000
640000
810000
2415000
2. Una compaa que tiene 15 tiendas ha recopilado datos en relacin con los metros
cuadrados de rea de ventas respecto a los ingresos mensuales. Trace una grfica de
los datos, y si parece apropiado un modelo lineal determine la ecuacin de regresin.
Tienda
a
o
j
e
k
d
n
g
c
l
b
i
h
f
m
15
Metros 2
X
55
80
85
90
90
110
130
140
180
180
200
200
215
260
300
2315
Ingreso
Y
45
60
75
75
80
95
95
110
120
105
115
130
140
170
200
1615
XY
2475
4800
6375
6750
7200
10450
12350
15400
21600
18900
23000
26000
30100
44200
60000
289600
X2
3025
6400
7225
8100
8100
12100
16900
19600
32400
32400
40000
40000
46225
67600
90000
430075
3. Determine una ecuacin predictiva para calcular el monto del seguro, en funcin del
ingreso anual para los siguientes datos:
98
Ingreso Prima
X
Y
XY
13
5
65
16
15
240
17
20
340
18
10
180
20
10
200
25
12
300
26
15
390
32
30
960
38
40
1520
40
50
2000
42
40
1680
287
247 7875
X2
169
256
289
324
400
625
676
1024
1444
1600
1764
8571
6. En una distribucin bidimensional ( xi , yi ) se sabe que: Los valores de la variable X son (1, 2,
3, 4 y 5); la recta de regresin de Y sobre X ( x 3 y 8 0) y el coeficiente de correlacin
lineal (r=0.8). Hallar:
a) La media y la varianza de X
b) Los valores estimados de 0 y 1 de la recta de regresin de Y sobre X.
c) La covarianza
d) La media y la varianza de Y.
7. En un estudio donde se investig la relacin que existe entre la temperatura de la superficie
de una carretera (X, medida en grados Fahrenheit) y la deformacin del pavimento (Y). El
99
20
resumen
de
cantidades
es
la
siguiente:
n=20,
y
i 1
20
y
i 1
2
i
20
8, xi 1470;
i 1
20
x
i 1
2
i
143215
20
x y
i 1
12 ,
1083 .
x 20
Se pide que, a partir de la definicin de la anterior recta, determine los
parmetros de la recta de regresin de X sobre Y.
100
Sexo
Total
Hombre
Mujer
Edad de 0 a 10 aos
25,097
23,858
48,955
Edad de 11 a 15 aos
12,849
12,490
25,339
Edad de 16 a 20 aos
11,384
11,810
23,194
Edad de 21 a 30 aos
19,587
23,372
42,959
Edad de 31 a 45 aos
21,264
28,725
49,989
Edad de 46 a 65 aos
16,219
21,645
37,864
Edad de 66 aos ms
4,834
8,269
13,103
111,234
130,169
241,403
Total
se
101
Porcentajes:
Los porcentajes se hacen para expresar las proporciones en base 100. En el ejemplo anterior, los
nios representan el 31%, los jvenes el 47%, los adultos el 15% y los ancianos 4%.
Ejemplo: En el censo de poblacin de El Salvador, 2007, se encuentra que en el Municipio de
Mejicanos, tiene los siguientes sobre la condicin laboral, para la poblacin mayor de 10 aos.
CONDICION LABORAL
Tasas:
Las tasas se hacen cuando el conjunto se fracciona en dos subconjuntos y se quiere dar cuenta de
la parte que representa uno de los subconjuntos sobre el total del conjunto. Esta representacin se
suele expresar en base 100, pero se pude hacer en base 10, 1000, etc. Por ejemplo, si el conjunto
de la poblacin activa se divide en dos subconjuntos denominados desempleados y ocupados, la
tasa de desempleo sera el resultado de multiplicar por cien el nmero resultante de dividir el
nmero de desempleados por el total de activos (ocupados y desocupados). Si de las 4,000
personas activas que hay en una localidad, 3,600 estn ocupadas y 400 estn desempleadas, la
tasa de desempleo sera (400/ 4,000) X 100= 10%.
Ejemplo: En el censo de poblacin de El Salvador, 2007, se encuentra que en el Municipio de
Mejicanos, tiene los siguientes datos de analfabetismo, para la poblacin mayor de 5 aos.
Sabe leer y escribir
LUGARES
Zona Urbana
Si
109205
No
8872
Total
118077
CANTN CHANCALA
CANTN SAN MIGUEL
CANTN SAN ROQUE
Total
672
916
8027
118820
123
221
1343
10559
795
1137
9370
129379
102
Ejercicio.
La poblacin de 15 aos o ms segn su condicin de analfabetismo se presenta en el siguiente
cuadro.
Sexo
Total
Si
No
Soyapango
161,155
10,801
171,956
Ilopango
66,240
5,420
71,660
San Martn
43,033
5,376
48,409
Obtener las tasas de analfabetismo de cada municipio y hacer un anlisis comparativo de los
resultados.
X it X i 0
*100
X i0
Ejemplo:
El siguiente cuadro presenta el nmero de homicidios para los aos 2004, 2005, 2006, 2007 y
2008, para los municipios de Soyapango, Ilopango y San Martn.
Grupos
SOYAPANGO
ILOPANGO
SAN MARTN
de
edades Femenino Masculino Total Femenino Masculino Total Femenino Masculino Total
AO 2004
182
53
Total
15
167
12
78
90
11
42
AO 2005
242
86
Total
14
228
5
74
79
11
75
AO 2006
262
54
Total
16
246
15
69
84
6
48
AO 2007
199
79
Total
20
179
10
67
77
8
71
AO 2008
138
61
Total
10
128
9
66
75
7
54
Fuente: Fuente estadsticas de homicidios de Instituto de Medicina Legal. Los cadveres que no se pudo identificar
el sexo, no aparecen registrados en el cuadro anterior.
Obtener la diferencia relativa del nmero de homicidios por ao, sexo y municipio.
103
de valor que experimenta una variable o magnitud en dos situaciones, una de las cuales se toma
como referencia. La comparacin suele hacerse por cociente.
A la situacin inicial se le llama periodo base y a la situacin que queremos comparar periodo actual o
corriente.
ndices simples: Se denomina as a los referidos a una nica magnitud y se obtienen dividiendo cada
precio, cantidad o valor de un periodo (anual, mensual, semanal, etc.), por un precio, cantidad o valor de
un periodo fijo, considerado base, multiplicado luego por 100.
Si X i es una magnitud simple, representamos por X i 0 el valor de la magnitud en el periodo base y por
X it
*100
X i0
P
0
b. Precio: I t (i ) it *100
Pi 0
q
0
c. Cantidad: I t (i ) it *100
qi 0
a. Valor:
I t0 (i)
104
Ejemplo 1. Con los datos de la serie 2001-2006, calcular los ndices de base fija 2001 y 2004;
luego el ndice de base variable para esa misma serie.
aos
2001
2002
2003
2004
2005
2006
yi
20
28
24
40
48
70
Observe que tomando de base el ao 2001, en el 2004 se tuvo un aumento del 100% y en el 2006
se tuvo un aumento de precios del 250% con respecto al ao 2001; si tomamos de base el ao
2004, en el 2006 se tuvo un aumento del 75%. Finalmente, si tomamos Base Variable en el ao
2006 hubo un aumento del 45.83% con respecto al ao 2005.
EJERCICIO DE APLICACIN. En enero de 2006 una fbrica pag un total de $
99,200,000.00 a 120 empleados en nmina. En julio del mismo ao, la fbrica tuvo 30 empleados
ms en nmina y pag $ 30,000,000 ms que en enero. Tomando el mes de enero como base,
hallar e interpretar:
a) El ndice de empleo (NIE)
b) El ndice del costo de mano de obra (ICMD)
c) Precio relativo
Solucin.
a) NIE= N de empleados en julio / N de empleados en enero
150
NIE
*100 125 . Durante los 6 meses hubo un incremento de empleados del 25%
120
b) ICMD = Salarios pagados en Julio / Salarios pagados en enero
129, 200, 000
ICMD
*100 130.24 . Durante los 6 meses considerados en este estudio
99, 2000, 000
hubo un aumento de costo de mano de obra en la empresa de 30.24%, observe que no se
ha considerado en aumento de empleados.
c) El precio relativo (PR) es equivalente al riesgo relativo utilizado en medicina (RR), es
decir,
129, 200, 000
150 1.04193 . El ndice de costo medio por empleado aument en un
PR
99, 200, 000
120
4.10% para el mes de julio en relacin con el mes de enero.
105
Ahora, suponer que se tienen nicamente los ndices de base variable y se requiere la
variacin del precio en el 2006 respecto al precio de 2003.
Solucin:
06
03
04
05
06
I 03
I 03
* R03
* R04
* R05
100*0.8571*1.6666*1.2 171.43 .
Ejercicio. Un ndice para 2006 revela un aumento del 20% respecto al ao anterior. En el 2007
alcanz a 174, es decir, presenta un incremento anual del 18%. Calcular los ndices de base fija
de los aos 2005 y 2006.
Solucin:
Se requiere encontrar: I 005 , I 006 ?
06
07
120, I 06
118 .
Informacin disponible: I 05
La base o periodo de inicio no se conoce, por lo tanto puede ser cualquier ao, as:
07
I 007 174 adems sabemos que I 007 I 006 * R06
, reemplazando 174 en la ltima expresin se
obtiene:
174
I 006
147.45 .
1.18
Para obtener I 005 , se realiza un procedimiento anlogo al anterior.
06
I 006 I 005 * R05
, reemplazando 147.45 se tiene:
147.45
I 005
122.87 .
1.2
106
Ejercicio. Se tienen tres ndices de base variable, cuyas cifras son: Para 2005=107, para
2006=108, para 2007=104, es decir, que entre 2004 y 2007, hubo un aumento del 19%. Decir si
la afirmacin anterior es cierta o falsa.
Solucin:
07
04
05
06
07
Recordemos que I 04
I 04
* R04
* R05
* R06
100*1.07*1.08*1.04 120.18 , por lo tanto la
afirmacin es falsa.
I
t
0
X (i)
i 1
n
X
i 1
*100
0
(i )
I
t
0
P (i)
i 1
n
P (i)
i 1
I
t
0
*100
q (i)
i 1
n
q (i)
i 1
*100
Las expresiones anteriores son muy tiles cuando no existen variaciones significativas entre
productos, ya estos ndices no se ven afectados por las variaciones en algn producto. Para
recoger las variaciones entre productos se recomienda calcular primeramente los ndices simples
y luego sumarlos y finalmente dividirlos por el nmero de productos. Esto es,
n
I 0t
I (i)
i 1
t
0
*100
Ejemplo: Con los datos de la siguiente tabla, calcular el ndice agregativo de las
cantidades que resultaron en mal estado de conservacin, en un grupo de artculos, comparados
en el mes de junio de 2009, respecto a las cantidades comparadas, en mal estado de conservacin,
en el mes de mayo del mismo ao.
Artculos medida Defectuosas
mayo Junio
A
Kg
12
18
B
Lt
8
15
C
Docena 20
8
D
Libras
14
20
E
Unidad 50
70
Total
104
131
107
Solucin:
Primer mtodo.
n
I
t
0
q (i)
i 1
n
q (i)
i 1
*100
131
*100 125.96 . Este mtodo es poco usual, ya que no es afectado
104
por las variaciones grandes que puede presenta uno varios artculos.
Segundo mtodo.
n
I (i)
t
0
i 1
*100
Este ndice puede interpretarse, como la relacin existente, al comparar los precios actuales de
un grupo de artculos, con los precios de esos mismos artculos considerados en el periodo base,
mantenindose constante como ponderacin las cantidades del periodo base. La expresin es la
siguiente:
n
L
I 0t
P (i)q (i)
i 1
n
P (i)q (i)
i 1
*100
P
I 0t
P (i)q (i)
i 1
n
P (i)q (i)
i 1
*100
La diferencia entre las dos frmulas anteriores, radica nicamente en la base tomada para las
ponderaciones, en la primera se refiere a las cantidades del periodo base y en la segunda, las
cantidades corresponden al periodo que se investiga.
108
I 0t
I 0t
L P
I 0t
Pt (i)q0 (i)
i 1
n
P (i)q (i)
*
i 1
n
i 1
i 1
*100
L
I 0t
P (i)q (i)
i 1
n
P (i)q (i)
i 1
P (i)q (i)
I 0t
*100
i 1
n
P (i)q (i)
i 1
I 0t
I 0t
I 0t
F L P
P0 (i)qt (i)
i 1
n
*100
P (i)q (i)
*
i 1
n
i 1
*100
Ejemplo: Con los siguientes datos referentes a los precios y cantidades para un grupo de
artculos dados para dos periodos.
Artculos Unidad
2006
2007
Precio Cantidad Precio Cantidad
A
Kg
26
10
38
8
B
Lt
6
5
10
7
C
Lbs
1
2
4
5
D
Docena 6
1
15
2
E
Unidad 3.6
2
2
1
Calcular los ndices de precios y de cantidad de las Laspeyres, Paasche y Fisher.
Solucin:
Ordenando los datos de la tabla anterior:
Articulos P06 q06 P07 q07 P06 q06 P07q07 P07q06 P06q07
A
26 10 38 8
260
304
380
208
B
6
5
10 7
30
70
50
42
C
1
2
4
5
2
20
8
5
D
6
1
15 2
6
30
15
12
E
3.6 2
2
1
7.2
2
4
3.6
305.2 426
457
270.6
Clculo de los ndices de precios
109
Laspeyres: L
I 0t
P (i)q (i)
t
i 1
n
P (i)q (i)
0
i 1
Paasche: P I0
t
P (i)q (i)
i 1
n
P (i)q (i)
i 1
Laspeyres: (270.6/305.2)*100=88.66
Paasche: (426/457)*100= 93.22
Fisher: 90.91
Ejercicio. El ndice de cantidad de un grupo de artculos es igual a 200, s se usa la frmula de
Fisher, y a 160 si se emplea la de Laspeyres. Cul es el ndice de cantidad usando la frmula de
Paasche?
Solucin.
t
40, 000
250
160
110
Salario real=
111
Ventas
18
18
19
15
12
16
20
24
35
a) Hallar los ndices de ventas, tomando como base primero 2002 y luego
2005.
b) Hallar los ndices de ventas con base variable
2. Un empleado ganaba $ 772 dlares mensuales en 2009 en el 2010 gana $ 912 mensuales, con
lo cual mejora su ingreso real en 16%. Si el actual ndice de precios es de $ 560 Cul era el
ndice de precios del 2009?
3. La produccin de tomates (en toneladas) en la provincia de Valparaso fue durante los ltimos
10 aos:
AO
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
PRODUCCION (ton)
1300
1280
1189
1234
1100
1250
1310
1270
1140
1240
Se Pide:
a) Establezca una serie de nmeros ndice, que permita
estudiar la evolucin de dichas producciones, considerando
como base el ao 1997.
b) Determine el porcentaje de variacin de la produccin
entre los aos 1997 y 2006.
c) Determine la tasa de crecimiento promedio (tcp) entre los aos 1997 y 2007.
4. La entrada de turistas Alemanes a nuestro Pas durante los ltimos 7 aos segn SERNATUR
viene dada por la tabla siguiente:
AO
2000
2001
2002
2003
2004
2005
2006
Nmero de Turistas
12565
13124
11897
14578
16243
14890
15321
Se Pide:
a) Establezca una serie de nmeros ndice, que permita estudiar todos
los datos, considerando como base el ao 2000.
b) Con respecto al ao 2003. Qu porcentaje de aumento o
disminucin se dio en los aos 2004 y 2005.
112
2002
2003
2004
2005
2006
345
367
354
389
325
Se Pide:
a) Establezca una serie de nmeros ndice, que permita
estudiar todos los consumos, considerando como base el
ao 2002.
b) Determine el porcentaje de variacin del consumo entre los aos 2002 y 2006.
c) Determine la tasa de crecimiento promedio (tcp) entre los aos 2002 y 2006.
6. Una fbrica de automviles chinos produce cuatro modelos distintos, todos en versin
econmica, cuyos precios expresados en millones de pesos y nmero de unidades producidas
en 1998 y 2000 son respectivamente:
Modelo
1
2
3
4
Precio (M$)
0.9
1.3
1.9
3.8
Ao 1998
N de unidades
3200
3200
3200
3200
Precio (M$)
1.2
1.5
2.1
4.3
Ao 2000
N de unidades
5600
4300
2000
1200
Se Pide:
a) Hallar el ndice de precios y de cantidad de LASPEYRE, con base el ao 1998.
b) Hallar el ndice de precios y de cantidad de PAASCHE, con base el ao 1998.
c) Hallar el ndice de FISHER para precio y cantidad, considerando el mismo ao base.
7. Si, por ejemplo, el consumo final de un pas, expresado en miles de dlares corrientes de cada
ao, y el I.P.C. de los mismos aos son los siguientes, expresar en dlares. Constantes el
consumo final de ese pas:
Aos
2000
2001
2002
2003
2004
Consumo
final
17
20
22
25
30
IPC
100
105
110
115
118
113
tenemos
un
conjunto
A a1, a2 , . . ., an con
elementos,
un
conjunto
B b1, b2 , . . ., bm con m es posible formar n.m pares de la forma (ai , bi ) en donde el primer
elemento del par pertenece a A y el segundo a B. Este resultado se puede generalizar.
Proposicin
Si tenemos k conjuntos A1, . . ., Ak con elementos n1, . . ., nk , respectivamente, el nmero de
ordenaciones de la forma ( x1, . . ., xk ) , en donde x1 es un elemento de A1 y xk es un elemento de
Ak, es n1 . . . nk .
Demostracin.
Este resultado se sigue por induccin.
Como consecuencia del resultado anterior, se tiene que si se realizan k selecciones sucesivas con
exactamente ni opciones posibles en el i-simo paso o etapa, produce un total de n1 . . . nk
resultados diferentes posibles.
114
Teorema
Dada una poblacin de N elementos se pueden seleccionar N n muestras diferentes con
remplazamiento de tamao n, y (N)n muestras diferentes sin remplazamiento de tamao n.
Demostracin.
Al realizar n selecciones sucesivas con exactamente N opciones posibles, en cada una de las n
selecciones, que son las correspondientes a los N elementos de la poblacin. As, pues, segn el
resultado anterior N.N . . . N N n , muestras diferente de tamao n, en un muestreo con
remplazamiento, tomando n1 n2 . . . nn N .
Si efectuamos un muestreo sin remplazamiento, tendremos N opciones posibles en la primera
seleccin, pero tan slo (N-1) en la segunda, pues los elementos de la poblacin no son devueltos
a la misma; de la misma manera, en la tercera slo se tendrn (N-3+1) opciones, y as
sucesivamente hasta la n-sima, en la cual se tendrn (N-n+1) posible opciones. Por tanto,
existirn (N)n = N.(N-1) . . . (N-n+1) muestras diferentes de tamao n, en el muestreo sin
remplazamiento.
Ejemplo.
Supongamos una urna que contiene 9 bolas numeradas del 1 al 9. Si realizamos un muestreo
aleatorio con remplazamiento de tamao 6, el espacio muestral , estar compuesto por
96 531,441 elementos.
Ejemplo.
Si lanzamos un dado 5 veces, entonces el espacio muestral estar formado por 65 7,776
elementos, ya que este experimento es equivalente a muestrear con remplazamiento, donde el
nmero de veces que lanzamos el dado es equivalente al tamao n de la muestra aleatoria y N al
nmero de caras del dado.
Ejemplo.
Supongamos una urna que contiene 11 bolas numeradas del 1 al 11. Si realizamos un muestreo
aleatorio sin remplazamiento de tamao n=3, el espacio muestral estar formado por
(11)3 990 elementos.
Teorema.
El nmero de ordenaciones diferentes de N elementos es
RVN ,n N n
6.3.3. Permutaciones.
Las permutaciones o, tambin llamadas, ordenaciones son aquellas formas de agrupar los
elementos de un conjunto teniendo en cuenta que:
116
P (n, r )
n!
(n r )!
RPN n1...nr
N!
n1 !.n2 !...nr !
Para tener una idea de la deduccin de la ecuacin anterior, observe que una poblacin de
tamao n puede dar lugar a n! muestras ordenada de tamao n. Adems, el nmero de muestra
ordenadas de tamao n, en un muestreo sin remplazamiento, efectuado en una poblacin de
117
N
N!
A. n! = (N)n; entonces A = (N)n / n! =
n n !(N n )!
Ahora, tenemos r grupos distintos, n1, n2, , nr, y los elementos del primer grupo pueden ser
N
seleccionados de maneras, de los N- n1 elementos restantes, podemos seleccionar los n2 del
n1
N n1
segundo grupo de
maneras, etc. Despus de formar el (r-1)-simo grupo quedarn N n2
n1 - n2 - - nr-1 = nr elementos, que constituirn el grupo r-simo, que podremos seleccionar de
nr N n1 n2 . . . nr 1
=1 manera. Por tanto, el nmero de permutaciones con
nr
nr
N n1 n2 . . . nr 1
N N n1
N!
=
. . .
nr
n1 n2
n1 !.n2 !...nr !
6.3.4. Combinaciones.
Llamaremos combinaciones de N elementos tomados de n en n, a los diferentes grupos que se
pueden formar figurando n elementos en cada uno, de modo que cada dos grupos difieran en la
naturaleza de, por lo menos, un elemento. Puede observarse, que no se tiene en cuenta el orden
de los elementos en la disposicin. Se denota por CN ,n y el nmero de grupos que podemos
formar de tamao n, ser:
N
N!
CN ,n
n n !(N n )!
Observe que una combinacin, es un arreglo de elementos en donde no nos interesa el lugar o
posicin que ocupan los mismos dentro del arreglo.
Ejemplo 1.
a) Si se cuenta con 14 alumnos que desean colaborar en una campaa pro limpieza, cuantos
grupos de limpieza podrn formarse si se desea que consten de 5 alumnos cada uno de ellos,
118
b) Si entre los 14 alumnos hay 8 mujeres, cuntos de los grupos de limpieza tendrn a 3
mujeres?,
c) Cuntos de los grupos de limpieza contarn con 4 hombres por lo menos?
Solucin: NO INTERESA EL ORDEN.
a) n = 14, r = 5
14C5 =
Entre los 2002 grupos de limpieza hay grupos que contienen solo hombres, grupos que contienen
solo mujeres y grupos mixtos, con hombres y mujeres.
b) n = 14 (8 mujeres y 6 hombres),
r=5
En este caso nos interesan aquellos grupos que contengan 3 mujeres y 2 hombres
8C3*6C2
119
a) n = 12,
r=9
= 12! / (12 9)!9!
12C9
= 12! / 3!9! = 12 x 11 x 10 / 3!
= 220 maneras de seleccionar las nueve preguntas o dicho de otra manera, el
alumno puede seleccionar cualquiera de 220 grupos de 9 preguntas para aprobar el examen.
b)
2C2*10C7
= 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que estn las
dos primeras preguntas.
c)
3C1*9C8 = 3 x 9 = 27 maneras de seleccionar las 9 preguntas entre las que est una de las
tres primeras preguntas.
Ejemplo 3.
Una seora desea invitar a cenar a 5 de 11 amigos que tiene,
a) Cuntas maneras tiene de invitarlos?,
b) Cuntas maneras tiene si entre ellos est una pareja de recin casados y no asisten el uno
sin el otro?,
c) Cuntas maneras tiene de invitarlos si Rafael y Arturo no se llevan bien y no van juntos?
Solucin:
a) n = 11, r = 5
11C5
Es decir, que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.
b) Esta seora tiene dos alternativas para hacer la invitacin, la primera es no invitar a la pareja y
la segunda es invitar a la pareja.
2C0*9C5
2C2*9C3
En este caso separamos a la pareja de los dems invitados para que efectivamente se cumpla el
que no asistan o que asistan a la cena.
120
c) La seora tiene dos alternativas para hacer la invitacin, una de ellas es no invitar a Rafael y a
Arturo o que asista solo uno de ellos.
2C0*9C5
2C1*9C4
= (1 x 126)
invitacin.
n
n !(N 1)!
Ilustracin
Suponemos que cada elemento del conjunto de los N distintos se representa por el espacio entre
dos lneas verticales del siguiente dibujo formado por N+1 lneas verticales:
1 2 3 ..... N-1 N
N+1
N+1
La posicin de la primera y la ltima de las barras es fija y elegir una ubicacin para las n
estrellas es equivalente a elegir un orden entre N-1 barras y n estrellas. El nmero de esas
posibles elecciones es el nmero de combinaciones sin repeticin de N + n 1 elementos
tomados de n en n.
Cmo se forman?. Para construir las combinaciones con repeticin, partimos del conjunto
A={1,2,3,4} y vamos a construir todas las combinaciones con repeticin posibles.
a) De un elemento. Si tenemos un conjunto de cuatro elementos y queremos hacer grupos
de uno, nicamente podremos hacer cuatro grupos: 1 , 2 , 3 , 4. (C4,1)
b) De dos elementos. La forma de construirlas ser similar a las combinaciones sin
repeticin aunque con la diferencia de que al permitirse repetir los elementos tendremos
que aadir a cada una de las de orden uno, el mismo elemento y todos los siguientes. As
se obtienen: 11, 12, 13, 14, 22, 23, 24, 33, 34, 44. (C4+1,2)
121
Los nmeros C(n, r) se llaman Coeficientes Binomiales, pues aparecen en el desarrollo del
binomio (a+b) elevado a una potencia.
El Teorema del Binomio proporciona una frmula para los coeficientes en el desarrollo de
n
n
a b . Como
a b (a b)(a b) (a b) el desarrollo surge al elegir a o b en
n factores
cada uno de los n factores, multiplicando las selecciones entre ellas, y luego sumando todos los
3
productos obtenidos de esta manera. Por ejemplo, en el desarrollo de a b , se elige a o b en el
primer factor (a + b); a o b en el segundo factor (a + b), y a o b en el tercer factor (a + b); se
multiplican las selecciones entre ellas y luego se suman los productos obtenidos. Si elegimos a en
todos los factores y multiplicamos, obtenemos el trmino aaa.
Si elegimos a en el primer factor, b en el segundo factor y a en el tercer factor y multiplicamos,
obtenemos el trmino aba. La tabla 1 muestra todas las posibilidades. Si sumamos los productos
de todas las selecciones, obtenemos
122
Seleccin
del primer
factor (a+b)
Seleccin
del segundo
factor (a+b)
Seleccin
del tercer
factor (a+b)
a
a
a
a
b
b
b
b
a
a
b
b
a
a
b
b
a
b
a
b
a
b
a
b
Producto de
selecciones
aaa= a 3
aab= a2 b
aba= a2 b
Abb= ab 2
baa= ba 2
bab= ab 2
bba= ab 2
bbb= b 3
Tabla 1. Clculo de a b
Un trmino de la forma an k bk surge de elegir b en k factores y a de los otros n-k factores. Pero
esto puede realizarse de C(n, k) formas, pues C(n, k) cuenta el nmero de formas de elegir k
cosas de n elementos. As, an k bk aparece C(n, k) veces. Esto implica que
123
EJEMPLO
Desarrollar
n = 4, obtenemos
EJEMPLO
Determine el coeficiente de
en el desarrollo de
El trmino relacionado con
aparece en el teorema del binomio considerando n = 9 y k = 4.
As el coeficiente de
es 126.
EJEMPLO
Determine el coeficiente de
en el desarrollo de
Como
(Nueve trminos)
Obtenemos
cada vez que multiplicamos dos x elegidas de los nueve trminos, tres y
elegidas de los nueve trminos para las x de C(9,2) formas. Una vez realizada esta seleccin,
podemos elegir as tres trminos para las y de C(7,3) formas. Esto deja los cuatro trminos
restantes para las z. As el coeficiente de
en el desarrollo
es
124
Por consiguiente, el trmino correspondiente al lado derecho del teorema del binomio cuenta el
nmero de subconjuntos de X.
Exprsense los coeficientes binomiales en una disposicin triangular conocida como tringulo de
Pascal (vase la figura 1.).
Los dos lados superiores estn formados por nmeros 1 y cualquier valor interior es la suma de
los dos nmeros que estn por encima y a los lados de l.
1
1
1
1
1
1
2
3
4
5
1
1
3
6
10
1
4
10
1
5
10. Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se
pueden sentar, si el presidente y el secretario siempre van juntos?
11. Cuntas diagonales tiene un pentgono y cuntos tringulos se puede informar con sus
vrtices?
12. Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y
3 mujeres. De cuntas formas puede formarse, si:
a) Puede pertenecer a l cualquier hombre o mujer.
b) Una mujer determinada debe pertenecer al comit.
c) Dos hombres determinados no pueden estar en el comit.
13. De cuntas formas distintas pueden sentarse ocho personas en una fila de butacas?
14. En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos.
Cuntos comits diferentes se pueden formar?
15. De cuntas formas distintas pueden sentarse ocho personas alrededor de una mesa
redonda?
16. En una bodega hay cinco tipos diferentes de botellas. De cuntas formas se pueden elegir
cuatro botellas?
17. En el palo de seales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. Cuntas seales distintas pueden indicarse con la colocacin de las nueve
banderas?
18. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual
color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?
19. Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de
qumica se colocan en un estante. De cuntas formas distintas es posible ordenarlos si:
1. Los libros de cada asignatura deben estar todos juntos.
2. Solamente los libros de matemticas deben estar juntos.
20. Una persona tiene cinco monedas de distintos valores. Cuntas sumas diferentes de
dinero puede formar con las cinco monedas?
6.6. Solucines.
1. De cuntas formas diferentes se pueden cubrir los puestos de presidente, vicepresidente y
tesorero de un club de ftbol sabiendo que hay 12 posibles candidatos?
No entran todos los elementos.
S importa el orden.
No se repiten los elementos.
2. Con las letras de la palabra libro, cuntas ordenaciones distintas se pueden hacer que
empiecen por vocal?
126
3. De cuntas formas pueden mezclarse los siete colores del arco iris tomndolos de tres en
tres?
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
4. Cuntos nmeros de cinco cifras distintas se pueden formar con las cifras impares?
Cuntos de ellos son mayores de 70.000?
S entran todos los elementos.
S importa el orden.
No se repiten los elementos.
127
7. Con las cifras 1, 2 y 3, cuntos nmeros de cinco cifras pueden formarse? Cuntos son
pares?
S entran todos los elementos: 3 < 5
S importa el orden.
S se repiten los elementos.
9. Una mesa presidencial est formada por ocho personas, de cuntas formas distintas se
pueden sentar, si el presidente y el secretario siempre van juntos?
128
Se forman dos grupos el primero de 2 personas y el segundo de 7 personas, en los dos se cumple
que:
S entran todos los elementos.
S importa el orden.
No se repiten los elementos.
10. Cuntas diagonales tiene un pentgono y cuntos tringulos se puede informar con sus
vrtices?
Vamos a determinar en primer lugar las rectas que se pueden trazar entre 2 vrtices.
No entran todos los elementos.
No importa el orden.
No se repiten los elementos.
Son
, a las que tenemos que restar los lados que determinan 5 rectas que no son diagonales.
11. Un grupo, compuesto por cinco hombres y siete mujeres, forma un comit de 2 hombres y 3
mujeres. De cuntas formas puede formarse, si:
1. Puede pertenecer a l cualquier hombre o mujer.
12. De cuntas formas distintas pueden sentarse ocho personas en una fila de butacas?
S entran todos los elementos. Tienen que sentarse las 8 personas.
S importa el orden.
No se repiten los elementos. Una persona no se puede repetir.
13. En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos.
Cuntos comits diferentes se pueden formar?
No entran todos los elementos.
Noimporta el orden: Juan, Ana.
Nose repiten los elementos.
14. De cuntas formas distintas pueden sentarse ocho personas alrededor de una mesa
redonda?
15. En una bodega hay cinco tipos diferentes de botellas. De cuntas formas se pueden elegir
cuatro botellas?
No entran todos los elementos. Slo elije 4.
No importa el orden. Da igual que elija 2 botellas de ans y 2 de ron, que 2 de ron y 2 de ans.
S se repiten los elementos. Puede elegir ms de una botella del mismo tipo.
130
16. En el palo de seales de un barco se pueden izar tres banderas rojas, dos azules y cuatro
verdes. Cuntas seales distintas pueden indicarse con la colocacin de las nueve
banderas?
S entran todos los elementos.
S importa el orden.
S se repiten los elementos.
17. Se ordenan en una fila 5 bolas rojas, 2 bolas blancas y 3 bolas azules. Si las bolas de igual
color no se distinguen entre s, de cuntas formas posibles pueden ordenarse?
18. Cuatro libros distintos de matemticas, seis diferentes de fsica y dos diferentes de qumica
se colocan en un estante. De cuntas formas distintas es posible ordenarlos si:
1. Los libros de cada asignatura deben estar todos juntos.
19. Una persona tiene cinco monedas de distintos valores. Cuntas sumas diferentes de
dinero puede formar con las cinco monedas?
131
Por ltimo, parece razonable tener una medida de dicha incertidumbre: es decir, su
probabilidad P. As pues, en todo experimento aleatorio se deben considerar los siguientes
tres elementos (, P(), P).
133
Ai
i 1
semilgebra
(, ) .
1) S por definicin
2) Para todo par de intervalos de la clase, su interseccin est en la clase ya que cualquier
intervalo intersecado con
ser el mismo intervalo, y cualquier intervalo intersecado con ,
ser , que por definicin ha sido incluido en S.
Por otro lado,
(, a] (b, c] (b, a] S , si b a c,
(, a] (b, c] S , si a b c,
(, a] (b, c] (b, c] S , si b c a,
Adems,
(, a] (d , ] (d , a] S , si d a ,
(, a] (d , ] S , si a d ,
134
Y por ltimo,
(b, c] (d , ) S , si b c d ,
(b, c] (d , ) (d , c] S , si b d c ,
(b, c] (d , ) (b, c] S , si d b c ,
3) Dado un intervalo, el complementario se puede poner como unin finita de elementos de la
clase:
Dado , c y dado , c , as pues, slo debemos estudiar el resto de los intervalos:
a , (, a]c (a, ) S. b, c ,(b, c]c (, b] (c, ), perteneciendo ambos intervalos
a S. Por ltimo, d , (d , ]c (, d ] S.
Ejemplo.
Sea (0,1] verificar que la clase de intervalos (a, b] con 0 a b 1 forman una semilgebra.
Definicin 2. (Estructura de lgebra)
Dado el espacio total , una clase Q P() tiene estructura de lgebra si y slo si:
a) Q
b) A, B Q es A B Q
c) A Q, existe una sucesin finita A1 , A2 , ..., An Q
Ac
con
Ai Aj i j tal que
Ai
i 1
d ) A, B Q se tiene A B Q
Definicin 3. (Estructura de
-lgebra)
Dado el espacio total , una clase A P() tiene estructura de -lgebra si y slo si:
a) A
b) A A Ac A
An A
n 1
An
Anc .
numerables
n 1
n 1
135
Ejemplo:
Sea
entonces
C1 (a, b) ;
C5 [a, b) ;
C2 (, b) ;
C3 (a, ); C4 (, b];
C6 [a, b) ; C7 [a, b] ;
Ejercicio
Sea el conjunto de casos posibles que resulta de la tirada de un dado. Decir cules de las
siguientes clases de conjuntos son lgebras.
a ) M 1 ,
b) M
, 1, 3, 5 , 2, 4, 6 , , I , P,
c) M
d) M
, 1 , 1, 5 , 2, 4, 6 ,
An n
A tal que Ai Aj i j es P An P( An )
n 1 n 1
136
1.
En
efecto,
sea
la
sucesin
A, , ... con
A A ;
evidentemente
n 1
P
An P An P A P An P A P 0
n 1
n2
n 1
2.
3.
4.
Verificacin:
A = (A B ) (A B*)
B* = B complemento.
B= (A B ) (A* B)
Ahora, P(A)= P(A B ) + P (A B*) y P(B) = P(A B ) + P (A* B) por otra parte, A B
= (A B ) (A B*) (A* B)
P(A B) = P(A B ) + P (A B*) + P(A* B)
= P(A B ) + P(A) - P(A B ) + P(B) - P(A B )
= P(A) + P(B) - P(A B )
5. Como generalizacin de la propiedad anterior, podemos expresar la probabilidad de la
unin de n elementos no disjuntos de la -lgebra A de la forma
n
n
n
n
i1 i2 i3
137
k
n
Hemos obtenido as la clsica regla de Laplace: Cociente entre casos favorables y casos
posibles considerados stos como equiprobables.
En este caso, necesitamos determinar qu nmero de situaciones son consideradas como
favorables y qu nmero de situaciones son posibles al realizar nuestro experimento aleatorio.
Para ello, es de mucha utilidad el anlisis combinatorio y al de su base probabilstica asociada.
Ejercicio. Se elige un nmero al azar del 1 al 6,000, todos igualmente probables. Hallar la
probabilidad de que sea mltiplo de 2 de 3 de 4 de 5.
est definida por las masas 1/N situadas en cada punto de . Entre los sucesos de
A consideremos el suceso A = Se elige una persona rubia y el suceso B=se elige una persona
de altura superior a 1.7m. Estos sucesos son parte de , ya que despus de realizar el
experimento tienen respuesta las preguntas: es rubia la persona encuestada? es de altura
superior a 1.7m? Supongamos que estamos en la situacin que una persona rubia (sin saber cul)
es elegida, o dicho de otra manera ha ocurrido el suceso A. A priori, B ha podido tener lugar o
no; para que hubiese ocurrido, habra sido necesario y suficiente que se hubiera elegido una
persona del subconjunto A B de , y para que no hubiese ocurrido, habra sido necesario y
suficiente el que se hubiese elegido una persona del subconjunto A B* de . Supongamos,
que ha ocurrido A y se ha revisado el que B tenga lugar; A ya es un suceso seguro y B no se
realizar a menos que se realizase A B. La probabilidad de realizacin de B, sabiendo que ha
ocurrido A, es el caso de sucesos favorables A B con respecto al nmero de casos posibles que
N A B
realizan A; es decir,
, de donde dividiendo por N las dos cantidades ser:
NA
N A B
N P( A B)
NA
P ( A)
N
En resumen, sabiendo que A se ha realizado, una nueva evaluacin de las probabilidades de los
sucesos, conducen a una nueva ley de probabilidades sobre ( ,P( )), denotada por PA , dando
al suceso A una probabilidad igual a uno, y dando una probabilidad nula a los sucesos disjuntos
con A, viniendo definida por:
PA B
P( A B)
P( A)
1
P( A)
P( A)
3. Por ltimo, si An n A es una sucesin de disjuntos de A entonces
139
P
A
A
P
An A
n 1
n 1
P An / A
P( A)
P( A)
n 1
P A
=
n 1
P( A)
P An A
P An / A
P( A)
n 1
n 1
Cn Bn A
Cn
n 1
n 1
A , por ser A -
Cn AA ya que ser
n 1
Bn A AA
n 1
Bn A
Por ser Bn A .
n 1
Por otro lado, PA es una probabilidad sobre (A, AA ) ya que PA es la restriccin de P(/A) al
espacio (A, AA ).
Teorema. (Teorema del Producto o Regla de multiplicacin)
Si A y B son dos sucesos del espacio probabilstico ( , A , P) con P(A) > 0 y P(B) > 0, a partir
de la proposicin 5 se tiene que:
P( A B) P( A) P B / A y P( A B) P( B) P A / B .
140
Demostracin (Inmediata)
n-1
El teorema anterior se puede generalizar: Sea A1 , A2 ,..., An A con P Aj > 0 entonces,
j=1
j=1
An
n-1
Aj
j=1
An
n 1
P( B / A ) P( A )
i
i 1
Demostracin.
P( B) P( B ) P B Ai P B Ai P( B / Ai ) P( Ai )
i 1
i 1
i 1
P( Ai / B)
P( Ai ) P( B / Ai )
P( A ) P B / A
i 1
, i
141
P( A B) P( A) P( B)
Solucin.
Para obtener las probabilidades condicionadas aplicamos la expresin:
Solucin.
Vamos a representar por A el suceso consistente en que un pedido determinado que se est
despachando sea de la mercanca A, y por A* el suceso complementario consistente en que no
sea de la mercanca A.
Como la probabilidad de que un pedido determinado se refiera a una clase de mercanca
determinada (sea A o A*) est influida por el nmero de pedidos de la misma clase que se hayan
despachado antes, este problema ilustra la ley general de la probabilidad compuesta, expresada en
la Ley general de la probabilidad compuesta:
j=1
An
n-1
Aj
j=1
Una buena forma de considerar el problema es imaginar un mazo de 60 cartas, todas iguales,
excepto que 5 de ellas estn sealadas con A y 55 sealadas con A*. La accin de cumplimentar
los pedidos se puede asociar a la de sacar cartas de un mazo bien barajado, de forma que todas las
cartas que se pueden sacar en una prueba determinada tienen las mismas probabilidades de ser
elegidas.
El suceso de que los pedidos primero y cuarto sean de la mercanca A y el segundo y tercero no,
corresponde a sacar la sucesin de cartas A ,A*, A*, A. Como hay 5 cartas sealadas con A, la
probabilidad de que la primera carta sea una A es 5/60. En la segunda prueba hay 59 cartas en la
baraja, y 55 de ellas estn sealadas con A*. Luego la probabilidad condicionada de que la
segunda carta sea una A* es 55/59. En la tercera prueba quedan 58 cartas, y 54 de ellas estn
sealadas con A*. Luego, la probabilidad condicionada de que la tercera carta sea una A* es
54/58. Finalmente, en la cuarta prueba quedan 57 cartas, de las cuales 4 estn sealadas con A,
luego la probabilidad de que la cuarta carta sea una A es 4/57. Por tanto, multiplicando estas
probabilidades de acuerdo con el teorema que expresa la ley general de la probabilidad
compuesta, obtenemos:
P(A, A*, A*, A) = (5/60) (55/59)(54/58)(4/57) = 0.0051.
Si llamamos E al suceso de que al menos dos pedidos de los cuatro primeros a cumplimentar sean
de la mercanca A, su probabilidad es igual a 1-P(E*), siendo E* el suceso de que los primeros
cuatro pedidos contengan menos de dos pedidos de la mercanca A, es decir, cero o uno. Pero la
probabilidad de que ninguno de los pedidos sea de la mercanca A est dada por:
P(0)= P(A*, A*, A*, A*)= (55/60)(54/59)(53/58)(52/57) = 0.6994.
Como el suceso de que uno de los pedidos sea de la mercanca A puede ocurrir de cuatro formas
mutuamente excluyentes, su probabilidad total es:
P(1) = P(A, A*, A*, A*)+ P(A*, A, A*, A*)+ P(A*, A*, A, A*)+ P(A*, A*, A*, A)
= (5/60)(55/59)(54/58)(53/57) + (55/60)(5/59)(54/58)(53/57)+
(55/60)(54/59)(5/58)(53/57)+ (55/60)(54/59)(53/58)(5/57) = 0.269
144
Por todo ello tendremos: P(E*)= P(0)+P(1) = 0.6994+0.269= 0.9684 y la probabilidad buscada
es:
P(E)= 1- P(E*)= 1 - 0.9684= 0.0316.
Ejercicio 4. Sea un dado tal que la probabilidad de las distintas caras es proporcional al nmero
de puntos inscritos en ellas. Hallar la probabilidad de obtener con este dado un nmero par.
Ejercicio 5. Se elige un nmero al azar del 1 al 6,000, todos igualmente probables. Hallar la
probabilidad de que sea mltiplo de 2 de 3 de 4 de 5.
Ejercicio 6. En un juego de dados, hemos apostado por el 2. Se tira el dado, y antes de ver el
resultado, nos dicen que ha salido par. Hallar la probabilidad de ganar.
Ejercicio 7. En una reunin hay 25 personas. Calcular la probabilidad de que celebren su
cumpleaos el mismo da del ao al menos dos personas.
Ejercicio 8. Un dado slo tiene tres caras posibles: 1, 2 y 3, igualmente probables. Realizamos el
siguiente juego: tiramos el dado, si sale 3 ganamos, si sale 1 2 continuamos tirando hasta repetir
el resultado de la primera tirada, en cuyo caso ganamos, o hasta obtener un tres y entonces
perdemos. Se pide la probabilidad de ganar.
Ejercicio 9. Un parque natural est dividido en dos partes A y B por un ro. Hay 10 ciervos en la
parte A y otros 10 en la parte B. Un bilogo realiza investigaciones sobre la conducta de un cierto
ciervo X que est en A. Por un descuido de los vigilantes 9 ciervos de A pasan a B. stos lo
advierten y devuelven 9 ciervos (escogidos al azar) al territorio A. Informado el bilogo de tal
contingencia, desea proseguir sus investigaciones sobre X. En cul de las dos partes A y B es
preferible que empiece a buscar su ciervo?
Ejercicio 10. Se hacen 6 tiradas con una moneda. Hallar la probabilidad de obtener una racha
ininterrumpida de por lo menos tres caras.
Ejercicio 11. En una reunin, n personas (n > 2) lanzan una moneda al aire. Si hay una que
difiere de todas las dems, su propietario paga una ronda. Cul es la probabilidad de que esto
ocurra?
Ejercicio 12. Un examen consta de 5 temas numerados. Para elegir un tema al azar, se propone
lanzar un dado. Si sale de 1 a 5, el nmero del tema es el resultado del dado; si sale 6 se vuelve a
tirar hasta que sale de 1 a 5. Demostrar que la probabilidad de eleccin de cada tema es 1/5.
Ejercicio 13. Una urna contiene 5 bolas blancas y 3 bolas negras. Tres jugadores A, B y C
extraen una bola, sin devolucin, en este mismo orden. Gana el primer jugador que saca bola
blanca. Calcular la probabilidad de que gane C.
Ejercicio 14. Una urna se ha llenado tirando una moneda al aire dos veces y poniendo una bola
blanca por cada cara y una bola negra por cada cruz. Se extrae una bola que es blanca. Hallar la
probabilidad de que la otra bola tambin lo sea.
145
Ejercicio 15. En una universidad en la que slo hay estudiantes de Arquitectura, Ciencias y
Letras, termina la carrera el 5% de Arquitectura, el 10% de Ciencias y el 20% de Letras. Se sabe
que el 20% estudian Arquitectura, el 30% Ciencias y el 50% Letras. Eligiendo un estudiante al
azar, se pide:
d) Probabilidad de que sea de Arquitectura y haya terminado la carrera.
e) Nos dice que ha terminado la carrera. Probabilidad de que sea de Arquitectura.
Ejercicio 16. Un jugador tira un dado, sale 6 y gana. Hallar la probabilidad de que haya hecho
trampa. (Sugerencia: Resolverlo bajo el supuesto de que el 50% de los jugadores son tramposos)
Ejercicio 17. Se lanzan tres monedas simtricas. Calcular la probabilidad de que salgan las tres
tiradas iguales.
Ejercicio 18. Se lanza un dado n veces. Calcular la probabilidad de obtener al menos un seis.
Ejercicio 19. Se tiene un cuadrado inscrito en un circulo de radio r. Se eligen tres puntos al azar e
independientes dentro del circulo. Hallar la probabilidad de que los tres puntos caigan dentro del
cuadrado.
*Ejercicio 20. Al contestar una pregunta con sus n posibles respuestas, una persona o bien
conoce la respuesta correcta (lo cual ocurre con probabilidad p) o bien lo adivina con
probabilidad 1/n. Calcular la probabilidad de que conociese la respuesta, supuesto que ha
contestado correctamente.
*Ejercicio 21. Con una moneda se juega a cara o cruz. Se para de lanzar cuando por primera vez
la diferencia entre el nmero de caras y el nmero de cruces es en valor absoluto igual a 3.
Calcular la probabilidad de que paremos de lanzar la moneda en la sexta tirada o antes. Idem en
la n-sima tirada o antes.
*Ejercicio 22. Entre 5 ciudades situada en los vrtices de un pentgono A-B-C-D-E-A, un
transportista que parte de A realiza viajes de modo que en cada ciudad tiene probabilidad 1/3 de
ir a la izquierda y 2/3 de ir a la derecha. Calcular la probabilidad de que el primer regreso a A sea
por la ciudad contraria hacia la que parti habiendo pasado una sola vez por D. Idem pero
regresando por BA, y pasando adems por D una sola vez.
**Ejercicio 23. Un profesor tiene una caja de cerillas en cada una de sus dos bolsillos, ambas con
el mismo nmero N de cerillas, y va sacando al azar cerillas de cada bolsillo, una a una. Calcular
la probabilidad de que en el bolsillo izquierdo quede exactamente k cerillas cuando en el derecho
saca la ltima.
**Ejercicio 24. En 4 ciudades situadas en los vrtices de un cuadrado, un transportista realiza
viajes de manera que en cada ciudad tiene una probabilidad p de ir a la derecha y q=1-p de ir
hacia la izquierda. Hallar la probabilidad de que el primer regreso a la ciudad de partida, A, se
produzca por la ciudad contraria hacia la que parti.
146
+
nk
=
N?
RESPUESTA 1.
Como las pruebas son independientes, la probabilidad de obtener un resultado determinado
cualquiera Ri en una prueba dada no est influida en absoluto por los resultados de otras pruebas.
Por tanto, la probabilidad Ps de una sucesin determinada cualquiera de resultados es igual al
producto de sus probabilidades incondicionales separadas y, por tanto,
El nmero S de sucesiones distintas que dan el nmero deseado de resultados de cada clase es
igual a Pm(N; n1, n2, , nk) y la probabilidad total P(n1, n2, , nk) viene dada por el producto
S.Ps
;
por
consiguiente :
P (n1, n2 , ... , nk )
N!
p1n1 p2 n2 ... pk nk
n1 ! n2 ! ... nk !
2. El informe de un ingeniero sobre las causas de avera en los calentadores de agua domsticos
revel que el 90% de las averas se deban a uno de estos tres factores : escapes en las soldaduras,
escapes en las juntas, o corrosin en puntos aislados, siendo las probabilidades respectivas de 0.4
; 0.3 y 0.2. Despreciando la posibilidad remota de que se produzcan averas simultneas, y
suponiendo pruebas independientes, cul es la probabilidad de que una muestra aleatoria de
cinco averas contenga dos casos de escapes en las soldaduras, dos de escapes en las juntas, uno
de corrosin en un punto aislado y ninguno debido a otras causas?
RESPUESTA 2.
Aceptando la hiptesis de que las averas simultneas son despreciables, podemos considerar los
diferentes tipos de averas como sucesos mutuamente excluyentes, e incluyendo la categora de
"averas diversas", obtenemos un sistema exhaustivo. Por tanto, podemos aplicar directamente la
ley polinomial de la probabilidad, y la solucin est dada por:
3. La probabilidad de que un vendedor a domicilio consiga una venta en un solo intento es 1/6.
a) Cul es la probabilidad de que consiga al menos una venta en los cinco intentos siguientes?
b) Cul es la probabilidad de que consiga, en esos cinco intentos, cuatro o ms ventas?
147
RESPUESTA 3.
Aunque puede no ser estrictamente cierto, vamos a suponer que un intento no afecta a otro.
a) La probabilidad P(E) del suceso de que el vendedor consiga al menos una venta en los cinco
intentos es igual a 1 P (E ) , siendo el suceso complementario de que no consiga ninguna venta.
En este caso:
P (E )
5!
(1/ 6)0 (5 / 6)5 =0.402
0!5!
P (E)
5!
5!
(1/ 6)4 (5 / 6)1
(1/ 6)5 (5 / 6)0 0.0032 0.0001 0.0033
4!1!
5!0!
RESPUESTA 4.
Podemos suponer razonablemente que las tres urnas tienen la misma probabilidad de haber sido
elegidas, por lo que tenemos P(Ui) = 1/3 (i = 1, 2, 3). Las probabilidades condicionadas del
suceso A (sacar una bola blanca y otra roja, a la vez) las calculamos como sigue: En la urna U1
tenemos una bola blanca y tres rojas frente a 6 bolas en total. Esto supone que tenemos tres casos
favorables dados por la bola blanca con cada una de las rojas y 15 casos posibles que resultan del
nmero de combinaciones de 6 elementos tomados de dos en dos, C(6, 2) = 6!/2!(6-2)! = 15. Por
todo ello, la probabilidad P(A/U1) vale 3/15 = 1/5. De forma anloga obtenemos tambin P(A/U2)
= 1/3 y P(A/U3) = 2/11.
Sustituyendo estos valores en la frmula de Bayes, obtenemos las probabilidades respectivas
P (U1 / A)
(1/ 3)(1/ 5)
33
148
P (U2 / A)
(1/ 3)(1/ 3)
55
P (U3 / A)
RESPUESTA 5.
Debido al mtodo utilizado para llenar la urna, existen cinco posibilidades para la distribucin
final del color de las cuatro bolas, y se puede calcular la probabilidad de que se produzca cada
una de las distribuciones de colores. Son las siguientes:
Grupos de 4 bolas blancas (B1) = 4!/4!0! = 1
Grupos de 3 blancas y una negra (B2) = 4!/3!1! = 4
Grupos de 2 blancas y 2 negras (B3) = 4!/2!2! = 6
Grupos de 1 blanca y 3 negras (B4) = 4!/1!3! = 4
Grupos de 4 bolas negras (B5) = 4!/0!4! = 1
En total tenemos 2n = 24 = 16 grupos, por lo que las probabilidades respectivas son:
P(B1) = 1/16 ; P(B2) = 4/16 ; P(B3) = 6/16 ; P(B4) = 4/16 ; P(B5) = 1/16.
En el caso que estamos considerando, el suceso A (sacar dos bolas negras) no puede ocurrir con
los antecedentes B1, y B2, por lo que las probabilidades condicionadas P(A/B1) y P(A/B2) tienen
que ser nulas. Las otras tres probabilidades condicionadas se calculan como sigue: para la
primera tenemos 1 caso favorable y 6 casos posibles que resultan del nmero de combinaciones
de 4 elementos tomados de 2 en 2. As pues:
P(A/B3) = 1/C(4, 2) = 1/6
Para la segunda y tercera, por una deduccin anloga tenemos
P(A/B4) = C(3, 2)/C(4, 2) = 1/2 ; P(A/B5) = C(4, 2)/C(4, 2) = 1
149
6. Un avin cubre diariamente el servicio entre dos ciudades. Suponemos que la probabilidad de
accidente en da sin niebla es 0.002 y en da con niebla 0.01. Cierto da de un mes que hubo 18
das sin niebla y 12 con niebla se produjo un accidente. Calcular la probabilidad de que el
accidente haya ocurrido: a) en da sin niebla; b) en da con niebla.
RESPUESTA 6.
Sea A1 el suceso "da sin niebla"; A2 el suceso "da con niebla" y B el suceso "ocurrir accidente".
Se tiene:
7. Un avin con tres bombas trata de destruir una lnea frrea. La probabilidad de destruir la lnea
con cualquiera de las bombas es 1/3. Cual es la probabilidad de que la lnea quede destruida
si el avin emplea las tres bombas?
RESPUESTA 7.
.) Denotemos por Ai al suceso de que la bomba i destruya la lnea frrea; se tiene:
P(A i) = p = 1/3, con i = 1, 2, 3.
Si A es el suceso de que la lnea quede destruida podemos escribir:
150
RESPUESTA 8.
Los nmeros posibles de blancos son:
a) 3 si se hace blanco con cada uno de los caones.
b) 2 si se falla en un disparo.
c) 1 si se fallan dos disparos
d) 0 si se fallan los tres disparos.
En el caso (a), la probabilidad de acertar en todos los disparos vendr dada como el producto de
las probabilidades independientes de acertar cada disparo, es decir:
P( A B C ) = P(A).P(B).P(C) = (0.1)*(0.2)*(0.3) = 0.006
En el caso b) tenemos:
1) Probabilidad de acertar A y B fallando C:
P(A) .P(B) .P(C) = P(A) .P(B)[ 1 P(C)] = 0.1 x 0.2 x 0.7 = 0.014
2) Probabilidad de acertar A y C fallando B :
P(A).P(B').P(C) = F(A)[1 - P(B)]P(C) = 0.1 x 0.8 x 0.3 = 0.024
3) Probabilidad de acertar B y C fallando A :
P(A').P(B).P(C) = [1 - P(A)P(B).P(C) = 0.9 x 0.2 x 0.3 = 0.054
As, la probabilidad total de fallar un disparo es:
0.014 + 0.024 + 0.054 = 0.092
151
9. Distribuimos al azar r bolas en n celdas. Hallar la probabilidad de que una celda especificada a
priori tenga exactamente k bolas.
10. De una urna que contiene b bolas blancas y n bolas negras se extrae k bolas al azar (sin
remplazamiento). Calcular la probabilidad de que exactamente x de ellas sean blancas.
11. De los 30 temas de un examen, un alumno sabe 18. Le proponen dos tipos de examen: Los
miembros del tribunal eligen 3 temas y debe contestar dos; o bien el tribunal elige 5 temas y debe
contestar 3 de ellos. Cul es el examen ms favorable para el alumno?
12. Una persona ha comprado 40 billetes de una lotera de 100 nmeros. Si la lotera consta de
tres premios. Cul es la probabilidad de que gane slo un premio? Al menos uno? Ninguno?
13. Una caja contiene 90 piezas buenas y 10 defectuosas. Sacamos 10 piezas aleatoriamente.
Calcular la probabilidad de que entre esas 10 piezas no haya ninguna defectuosa. Idem que haya k
defectuosas.
14. Un grupo de diez concejales son elegidos al azar de un total de 50 municipios para formar una
comisin. Suponiendo que cada municipio tiene dos concejales, Cul es la probabilidad de que
los dos concejales de cierto municipio estn en dicha comisin? Y de que ninguno est?
*15. En una urna se introducen n bolas, cada una de las cuales pueden ser blanca o negra con
probabilidades iguales. A continuacin se extraen k bolas con remplazamiento. Cul es la
probabilidad de que la urna contenga slo bolas blancas si las k extradas han resultado ser
blancas?
152
*16. Una secretaria ha escrito n cartas con sus correspondientes n sobres. Se introduce al azar las
cartas en los sobres, Cul es la probabilidad de que al menos una carta vaya a parar a su
correspondiente sobre? Hallar el valor de esta probabilidad cuando n tiende a infinito.
** 17. La probabilidad de que un rbol de una cierta variedad de mangos tenga n flores es
(1 p)n p (n=0, 1, 2, 3, 4, . . .) . Cada flor tiene una probabilidad de 2/3 de ser fecundada y dar
fruto, independientemente del resto de las flores del rbol. Cada fruto tiene probabilidad de ser
picado por los pjaros antes de la cosecha. Se desea: a) obtener la probabilidad de que una flor
produzca fruto cosechable; b) Calcular la probabilidad de que un rbol que tiene r frutos haya
tenido n flores.
153
12. *Un examen de oposicin consta de 14 temas. Se debe escoger un tema de entre dos
tomados al azar. Calcular la probabilidad de que a un alumno que ha preparado 5 temas le
toque al menos uno que sabe. Cul es el nmero mnimo de temas que debe preparar
para que tenga una probabilidad superior a 1/2 de superar el examen?
13. Obtener la probabilidad p de que al lanzar n veces dos dados se obtenga al menos un 6
doble. Cuntas partidas habr que jugar para que tengamos p = 1/2 de obtener un 6
doble?
14. N parejas se renen y se emparejan al azar para bailar. Calcular la probabilidad de que
ninguna baile con su pareja.
15. *Cuatro ciudades (1,2,3 y 4) estn interconectadas, un transportista realiza viajes de
manera que: a) La probabilidad de ir de la ciudad 1 a la i (i=1, 2, 3, 4) es .d (1, i ),
y d(1,i)=|i-1| y la suma de estas probabilidades es 1. b) La probabilidad de ir de la ciudad
2 a la j (j=1, 2, 3,4) es .d (2, j ), y d(2,j)=|j-2| y la suma de estas probabilidades
es 1. c) La probabilidad de ir de la ciudad 3 a la k (k=1, 2, 3, 4) es .d (3, k ), y
d(3,k)=|k-3| y la suma de estas probabilidades es 1. Si el transportista sale de la ciudad 1,
Cul es la probabilidad de llegar por primera vez a la ciudad 4 sin haber regresado a la
ciudad de partida?
16. El profesor Prez olvida poner su despertador 3 de cada 10 das. Adems, ha comprobado
que uno de cada 10 das en los que pone el despertador acaba no levandandose a tiempo
de dar su primera clase, mientras que 2 de cada 10 das en los que olvida poner el
despertador, llega a tiempo a dar su primera clase.
a) Cul es la probabilidad de que el profesor Prez llegue a tiempo a dar su primera
clase?
b) Si un da no ha llegado a tiempo, qu probabilidad hay de que olvidase poner el
despertador la noche anterior?
17. Un banco local revisa su poltica de tarjetas de crdito, con el objetivo de cancelar algunas
de ellas. En el pasado, el 5% de los clientes con tarjeta ha pasado a ser moroso, esto es ha
dejado de pagar sin que el banco pudiera recuperar la deuda. Adems, el banco ha
comprobado que la probabilidad de que un cliente normal se atrase en un pago es de 0.2.
Naturalmente, la probabilidad de que un cliente moroso se atrase en un pago es 1.
a) Elegido un clienta al azar, qu probabilidad hay de que el cliente se atrase en un pago
mensual?
b) Si un cliente se atrasa en un pago mensual, calcular la probabilidad de que el cliente acabe
convirtindose en moroso.
c) Al banco le gustara cancelar la lnea de crdito de un cliente si la probabilidad de que ste
acabe convirtindose en moroso es mayor de 0.25. De acuerdo con los resultados
anteriores, debe cancelar una lnea si un cliente se atrasa en un pago? Por qu?
18. *En un pueblo de n + 1 habitantes, una persona le rumorea algo a una segunda persona,
quien lo repite a una tercera, etc. En cada paso se elige aleatoriamente al receptor del
rumor de entre n personas. Encontrar la probabilidad de que el rumor pase r veces sin: a)
Regresar al que lo origin y b) Repetrsele a una persona.
154
Una variable aleatoria X es una funcin cuyo dominio es el espacio muestral S y cuyo
rango es un subconjunto de los nmeros reales
que tiene asociada a su conjunto de
valores una funcin de probabilidad.
Ejemplo 8.1. Supongamos que la Secretara del Medio Ambiente inspecciona una vez al mes la
cantidad de un contaminante que descarga una compaa de productos qumicos. Si la cantidad
del contaminante excede el nivel mximo permitido, se multa a la compaa y se le obliga a
corregir el problema. Consideremos las siguientes dos variables aleatorias asociadas a este
problema:
Primero digamos que X es el nmero de meses antes de que la compaa excede los lmites
permitidos del contaminante. Esta variable toma valores 1, 2, 3, pero no conocemos donde
termina, ya que quizs nunca exceda estos lmites permitidos, por lo tanto, el conjunto de valores
de X es el conjunto de los nmeros enteros positivos. Como podemos enlistar o numerar el
conjunto (es un conjunto numerable) de valores de la variable X, decimos que la variable
aleatoria X es una variable aleatoria discreta.
Ejemplo 8.2. Supongamos que nos interesamos por el nmero de varones X en el experimento de
observar al azar dos nios recin nacidos (Sea H = hombre y M = mujer). Entonces, el espacio
muestra, los valores de la variable aleatoria X que cuenta el nmero de varones y su funcin de
probabilidad se dan en la siguiente tabla:
S
Valores de X:
xi
MM
MH , HM
HH
Ejemplo 8.3. Sea X la variable aleatoria que indica la suma de los puntos en las caras superiores
al lanzar dos dados, Determine el espacio muestral, el conjunto de valores de X y las
probabilidades respectivas.
Solucin: El espacio muestral S es el conjunto de los 36 pares ordenados que se indican a
continuacin:
157
Este conjunto se puede visualizar como el conjunto de puntos del plano cartesiano que se muestra
a continuacin
Fig. 3.2 Diagrama del Espacio Muestral del lanzamiento de dos dados
La variable aleatoria es la suma de los elementos de cada par, por lo tanto, toma los valores del 2
al 12,
indican en la siguiente tabla:
Valores de X : xi
(1,1)
(1,2) (2,1)
10
(5,6) (6,5)
11
(6,6)
12
Total:
158
159
(verificarla)
Varianza = 2 = n p q (verificarla)
Grficamente el aspecto de la distribucin depende de n y de p. Por ejemplo, si p=0.5 y n
cualquiera es simtrica; si p n es 0.5, la binomial no es simttrica. El siguiente grfico lo ilustra
para n=4.
ASPECTO DE LA BINOMIAL PARA n=4 Y p=0.5 Y p=0.25.
Ejemplo 8.4. Se sabe que el 5% de los libros que se prestan en una biblioteca escolar se
devuelven con retraso. Se realiza el experimento que consiste en observar si la devolucin de 5
libros se hacen con retraso o no.
a) Determinar la funcin de probabilidad y hacer su representacin grfica.
b) Calcular la funcin de distribucin y hacer su representacin grfica.
c) Hallar la media y la varianza.
Solucin:
X= Variable aleatoria = Nmero de devoluciones con retrazo.
X=0,1,2,3,4,5.
a) El Modelo o funcin de probabilidad es
5
b( x, n 5, p 0.05) 0.04 x (1 0.05)5 x , x 0,1, 2,3, 4,5
x
160
0, t 0
0.7738, 0 t 1
0.9774, 1 t 2
b) FX (t ) 0.9988, 2 t 3
1
, 3t 4
, 4t5
1
1
, t5
c)
E[ X ] np 5(0.05) 0.25
2 V [ X ] npq 5(0.05)(0.95) 0.2375
(verificarlo)
(verificarlo)
Las variables Poisson cumplen la propiedad de que la suma de variables Poisson independientes
es otra Poisson con media igual a la suma las medias.
El aspecto de la distribucin depende muchsimo de la magnitud de la media. Como ejemplo,
mostramos tres casos con = 0,5 (arriba a la izquierda), = 1,5 (arriba a la derecha) y = 5
(abajo) Obsrvese que la asimetra de la distribucin disminuye al crecer y que, en paralelo, la
grfica empieza a tener un aspecto acampanado.
162
p( x 4, 6 )
0.13392
4!
24
b)
x= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos das
consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos
163
Nota: siempre debe de estar en funcin de x siempre o dicho de otra forma, debe hablar de lo
mismo que x.
p( x 10, 12 )
0.104953
10!
3628800
0.329307
1!
1
b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5 minutos =
0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata
( 1 )0 ( 2.718 )1 ( 1 )( 2.718 )1
p( x 2,3,4,etc .... 1 ) 1 p( x 0,1, 1 ) 1
0!
1!
=1-(0.367918+0.367918) = 0.26416
c)
x = variable que nos define el nmero de imperfecciones en la hojalata por cada 15 minutos
= 0, 1, 2, 3, ....., etc., etc.
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata
p( x 0,1, 3 ) p( x 0, 3 ) p( x 1, 3 )
0!
1!
164
Donde:
p(x) = probabilidad de que ocurra un xito en el ensayo x por primera y nica vez
p = probabilidad de xito
q 1 p = probabilidad de fracaso
165
1)
n
n!
Notacion: n Cr
.
r ! n r !
r
Los valores de la media y la varianza se calculan segn las ecuaciones:
(verificarlas)
Si n es pequeo, con relacin a N (n << N), la probabilidad de un xito varia muy poco de una
prueba a otra, as pues, la variable, en este caso, es esencialmente binomial; en esta situacin, N
suele ser muy grande y los nmeros combinatorios se vuelven prcticamente inmanejables, as
pues, la probabilidades se calculan ms cmodamente aproximando por las ecuaciones de una
binomial con p = K / N.
La media de la variable aproximada ( = n p = n (K / N)) es la misma que la de la variable antes
de la aproximacin; sin embargo, la varianza de la variable binomial es ligeramente superior a la
de la hipergeomtrica.
el factor por el que difieren ser siempre menor que 1 y tan prximo a 1 como cierto sea que n <<
N.
167
15 C3
15 C3
15 C3
0.81538
455
455
455
455
455
C0* 9 C3
15 C3
( 1 )( 84 )
0.184615 0.815385
455
168
C0* 9 C3
15 C3
( 1 )( 84 )
0.184615
455
C4* 3C0 ( 35 )( 1 ) 35
0.16667
210
210
10 C4
b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p( 2 o ms proyectiles no exploten) = p(x = 2 o 3; n=4) =
C2* 7 C2 3 C3* 7 C1 ( 3 )( 21 ) ( 1 )( 7 ) 63 7
70
0.333333
210
210
210
10 C4
169
Su grfico es:
La probabilidad de un intervalo [a,x] con x (a, b] , se puede calcular sin usar la integral:
1
ba
1
entre el rea de todo el rectngulo de base b-a
ba
1
. Este hecho se puede usar para calcular la funcin de distribucin.
ba
170
E[ X ] xf ( x)dx x
Pero
xdx
1
1 b
dx
xdx
a
ba
ba
B
A
b
171
A B
ab
H
(b a) ; por tanto
2
2
E[ X ]
ab
2
(b a) 2
V[X ]
12
Ejemplo 8.11. Un meteorlogo hace una medicin del tiempo al azar, suponiendo que est
distribuida uniformemente en el intervalo [1, 4]. A) Calcule la probabilidad de que la medicin
este entre 5/2 y 3. b) Si se realizan 6 mediciones independientes, hallar la probabilidad de que
exactamente 3 de ellas estn entre 2 y 3.
4)
Para calcular probabilidades en intervalos de valores de la variable, habra que integrar la funcin
de densidad entre los extremos del intervalo. por desgracia (o por suerte), la funcin de densidad
normal no tiene primitiva, es decir, no se puede integrar. Por ello la nica solucin es referirse a
tablas de la funcin de distribucin de la variable (calculadas por integracin numrica) Estas
tablas tendran que ser de triple entrada (, , valor) y el asunto tendra una complejidad enorme.
Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una
correspondencia de sus valores con los de otra variable con distribucin normal, media 0 y
varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas
variables se obtiene mediante la ecuacin:
P( x1 X x2 ) P( z1 Z z2 ) , donde
z1
x1
z2
x2
173
Ej em pl os :
Ejemplo 8.12. S i X e s una v ari abl e al e a t ori a de una di st ri buci n N( , ),
hal l ar:
P ( 3 X +3)
174
S ol uci n:
P( 3 X 3 ) P(3 Z 3) 0.9974
Ejemplo 3.13. En una di st ri buci n norm a l de m edi a 4 y d esvi aci n t pi ca 2,
cal cul ar el val or de a para qu e P (4 a x 4+a) = 0.5934.
S ol uci n:
P( x1 X x2 ) P( z1 Z z2 ) 0.5934, donde
z1
x1
z2
x2
y x1 4 a y x2 4 a
P or t ant o:
4a4
4a4
y z2
2
2
a
a
z1
y z2
2
2
z1
Pb ( X x) PN ( x 0.5 X x 0.5)
8.9. Ejercicios.
1 . En una ci udad se es t i m a que l a t em pera t ura m x i m a en el m es de j uni o
s i gue un a di st ri buc i n norm al , con m e di a 23 y desvi a ci n t pi ca 5.
C al cul ar el nm ero de d as del m es en l os que se esp era al canz ar
m x i m as ent re 21 y 27.
2 . La m edi a de l os p e sos de 500 est udi an t es de un col e gi o e s 70 kg y l a
d es vi aci n t pi ca 3 kg. S uponi endo que l os pesos s e di st ri bu ye n
norm al m ent e, hal l ar cunt os est udi ant es pesan:
175
a. Ent re 60 k g y 75 kg.
b . M s de 90 k g.
c. M enos de 64 k g.
d . 64 kg.
e. 64 kg o menos.
3 . Se supone que los resultados de un examen siguen una distribucin normal con media 78
y varianza 36. Se pide:
a. C ul es l a prob abi l i dad de qu e una persona que s e pr e sent a el ex am en
obt enga una c al i fi ca ci n superi or a 72?
b . C al cul ar l a proporci n de est udi ant es que t i enen punt uaci ones que
ex ceden por l o m e nos e n ci nco punt os de l a punt uaci n que m arc a l a
front era ent r e el Ap t o y el No -Apt o (son decl ar ados No - Apt os el 25% de l os
es t udi ant es que obt u vi eron l as punt uaci o nes m s baj as).
c. Si se sabe que la calificacin de un estudiante es mayor que 72 cul es la probabilidad de
que su calificacin sea, de hecho, superior a 84?
4 . Tras un t est de cul t ura gen eral se observa que l as punt uaci ones
obt eni das si gu en un a di st ri buci n una d i st ri buci n N(65, 1 8). S e des ea
cl as i fi car a l os ex am i nados en t res gru pos (de baj a cul t ura gen eral , de
cul t ura gener al ace pt abl e, de ex cel ent e cul t ura gener al ) de m odo que
ha y en el pri m ero u n 20% l a pobl aci n, un 65% el segundo y un 15% en
el t ercero. C ul es han de ser l as punt uaci ones que m ar ca n el paso de
un grupo al ot ro?
5 . Varios test de inteligencia dieron una puntuacin que sigue una ley normal con media 100
y desviacin tpica 15.
a. Det e rm i nar el po r cent aj e d e pobl aci n que obt endr a un coefi ci ent e ent r e
95 y 110.
b . Qu i nt erval o ce nt rado en 100 cont i e ne al 50% de l a pobl aci n?
c. En un a pobl a ci n de 2500 i ndi vi duos cunt os i ndi vi duos se esp eran que
t engan un coe fi ci ent e superi or a 125?
176
177
Cuando el muestreo se realiza a partir de una poblacin que sigue una distribucin normal, la
distribucin de la medida de la muestra tiene las siguientes propiedades:
1. La distribucin de ser normal
2. La media , de la distribucin de ser igual a la medida de la poblacin de la cual se
seleccionaron las muestras.
3. La varianza,
, de la distribucin de
ser igual a la varianza de la poblacin
dividida entre el tamao de la muestra.
178
en la distribucin
Al consultar la tabla normal estndar, se encuentra que el rea a la derecha de 1.10 es 0.1357;
por lo tanto, se puede decir que la probabilidad de que la muestra de tamao tenga una media
mayor que 190 es 0.1357.
Ejemplo:
Si la media y desviacin estndar de la concentracin de hierro en el suero en hombres sanos es
de 120 y 15 microgramos por cada 100 ml, respectivamente, cul es la probabilidad de que una
muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por
cada 100 ml.
179
Solucin:
La probabilidad buscada es:
Ejercicios:
1. La National Health and Nutrition Examination Survey de 1976-1980 en una investigacin
encontr que los niveles de colesterol en individuos varones, estadounidenses, con edades
entre 20-74 aos, fue de 211. La desviacin estndar fue de aproximadamente de 90.
Considere la distribucin muestral de la media de la muestra basada en muestras de
tamao 50 extradas de esta poblacin de individuos varones. Cul es la media de la
distribucin muestral y el error estndar?
2. Si las concentraciones de cido rico en hombres adultos normales siguen una
distribucin aproximadamente normal, con una media y desviacin estndar de 5.7 y 1 mg
por ciento, respectivamente, encuentre la probabilidad de que una muestra de tamao 9
proporcione una media:
i) Mayor que 6
ii) Entre 5 y 6
iii) Menor que 5.2
3. Para cierto sector amplio de la poblacin en un ao determinado, suponga que el nmero
medio de das de incapacidad es de 5.4, con una desviacin estndar de 2.8 das.
Encuentre la probabilidad de que una muestra aleatoria de tamao 49 de esa poblacin
tenga una media:
i) Mayor a 6 das
ii) Entre 4 y 6 das
iii) Entre 4.5 y 5.5 das.
concluyen que las medias de la poblacin son diferentes, es posible que deseen saber qu tanto
difieren. El conocimiento acerca de la distribucin muestral de la diferencia entre dos medias es
muy til en investigaciones de este tipo.
Ejemplo:
Suponga que se tienen dos poblaciones de individuos. Una de ellas ( la poblacin 1 ) ha
experimentado alguna enfermedad que se considera est asociada con retraso mental, y la otra (la
poblacin 2) no ha experimentado tal enfermedad. Se cree que la distribucin de calificaciones de
inteligencia de cada una de las poblaciones presenta una distribucin aproximadamente normal
con una desviacin estndar de 20.
Suponga, tambin, que se toma una muestra de 15 individuos de cada poblacin y se calcula en
cada muestra la media de las calificaciones de inteligencia, con los siguientes resultados:
y
Si no hay diferencia entre las dos poblaciones con respecto a la media
real de las calificaciones de inteligencia, cul es la probabilidad de observar una diferencia de
esta magnitud
(
Solucin:
Para responder a esta pregunta es necesario conocer la naturaleza de la distribucin muestral para
la estadstica principal, es decir, la diferencia entre las dos medias,
. Es importante notar
que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar
de una.
Distribucin muestral de
: caractersticas.
Lo que se pretende es calcular la distribucin de la diferencia entre las medias de las muestras. Si
se elabora una grfica de las diferencias de las muestras contra sus frecuencias de ocurrencia, se
podra obtener una distribucin normal con una media igual a
, la diferencia entre las
medias reales de los dos grupos o poblaciones, y una varianza igual a
. Esto es,
Para el ejemplo anterior habra una distribucin normal con una media igual a 0 (si no hay
diferencia entre las medias reales de la poblacin) y una varianza de [(20)2/15]+
[(20)2/15]=53.33.
181
Al consultar la tabla de la normal, se encuentra que el rea bajo la curva normal estndar a la
izquierda de -1.78 es igual a 0.0375. Para responder a la pregunta original, se puede decir que, si
no hay diferencia entre las medias poblacionales, la probabilidad de obtener una diferencia mayor
o igual que 13 entre las medias de las muestras es de 0.0375.
Muestreo a partir de poblaciones normales.
El procedimiento anterior es vlido incluso cuando el tamao de la muestras n1 y n2, son
diferentes, y cuando las varianzas
y
, tienen valores diferentes. Los resultados tericos
sobre los que se basa este procedimiento, se resumen de la siguiente forma.
Dadas dos poblaciones con una distribucin normal, con medias
, y varianzas
y , la
distribucin muestral de la diferencia,
entre las medias de muestras independientes de
182
tamao n1 y n2 extradas de esas poblaciones siguen una distribucin normal con media
y varianza
estadstica, el procedimiento es el mismo que el muestreo que se hace a partir de poblaciones con
distribucin normal.
Ejemplo:
Suponga que se estableci que para cierto tipo de pacientes el tiempo promedio de visita
domiciliaria hecha por una enfermera es de 45 minutos con una desviacin estndar de 15
minutos, y para un segundo tipo de paciente, el promedio de visita domiciliaria es de 30 minutos
con una desviacin estndar de 20 minutos. Si la enfermera visita al azar a 32 pacientes del
primer tipo y 40 del segundo tipo, cul es la probabilidad de que el tiempo promedio de visita
domiciliaria difiera entre los dos grupos por 20 minutos o ms?
Solucin:
No se menciona nada respecto a la forma funcional de las poblaciones, por lo que se supone que
esta caracterstica se desconoce, o que las poblaciones no presentan una distribucin normal.
Puesto que las muestras son grandes (mayores que 30) en ambos casos, se hace uso de los
resultados del teorema del lmite central. Se sabe que la diferencia entre las muestras sigue una
distribucin al menos aproximadamente normal con las siguientes media y varianza:
183
En la tabla de la distribucin normal se encuentra que el rea a la derecha de z=1.23 es: 1-0.8907
=0.1093. por lo tanto, se puede decir que la probabilidad de que las visitas al azar de la enfermera
difieren entre las dos medias por 20 o ms minutos es de 0.1093. La curva de
y la curva
normal estndar correspondiente se muestran en la siguiente figura:
184
Solucin:
Para responder esta pregunta es necesario conocer algunas de las propiedades de la distribucin
muestral de la proporcin de la muestra. Se designar la proporcin de la muestra con el smbolo
.
Distribucin muestral de : caractersticas.
Cuando la muestra es grande, la distribucin de las proporciones de la muestra es
aproximadamente normal de acuerdo con el teorema del lmite central. La media de la
distribucin
, que es el promedio de todas las proporciones posibles de la muestra, es igual a la
proporcin real de la poblacin , y la varianza de la distribucin,
es igual a
donde
. Entonces para responder a las preguntas acerca de la probabilidad
respecto a , se utiliza la siguiente frmula:
La pregunta que surge ahora es: qu tan grande debe ser la muestra para que sea vlido el uso de
la aproximacin normal? Un criterio ampliamente utilizado es que
y
deben ser
mayores que 5, por lo que se seguir dicha regla en el presente texto.
Ahora se est en posibilidad de responder a la pregunta referente al daltonismo en la muestra de
150 individuos de una poblacin en la cual 0.08 son daltnicos. Puesto que
y
son
mayores que 5 (150x0.08=12 y 150x0.92=138), se puede decir que, en este caso,
sigue una
distribucin aproximadamente normal con una media
y
. La probabilidad buscada es el rea bajo la curva de
a la
derecha de 0.15. Esta rea es igual al rea bajo la curva normal estndar a la derecha de:
185
Ejercicios:
1. Una investigacin realizada en 1990 por el National Center for Health Statistics, 19 por
ciento de los encuestados mayores de 18 aos, dijo no saber del virus VIH del SIDA.
Cul es la probabilidad de que en una muestra de 175 individuos de esa poblacin 25 por
ciento o ms no sepa de la existencia del SIDA?
2. Se sabe que 35 por ciento de los miembros de una poblacin sufren de enfermedades
crnicas. Cul es la probabilidad de que en una muestra aleatoria de 200 individuos 80 o
ms de ellos tengan al menos una enfermedad crnica?
: caractersticas.
Con varianza
consideran
n1
n2
suficientemente
son mayores que 5.
grandes
cuando
Para responder a preguntas respecto a la diferencia entre proporciones de dos muestras, se utiliza
la siguiente frmula:
186
Ejemplo:
Suponga que la proporcin de consumidores moderados a grandes consumidores de
estupefacientes ilegales es de 0.50 para la poblacin 1, en tanto que en la poblacin 2 la
proporcin es de 0.33. Cul es la probabilidad de que muestras de tamao 100, extradas de cada
una de las poblaciones, presente un valor de
igual a 0.30?
Solucin:
Se supone que la distribucin muestral de
de
Y varianza:
Al consultar la tabla de la normal, se encuentra que el rea bajo la curva normal estndar que est
a la derecha de z=1.89 es 1-0.9706=0.0294. Por lo tanto, la probabilidad de observar una
diferencia igual a 0.30 es de 0.0294.
Ejemplo:
Se sabe que en una poblacin de adolescentes 10 por ciento de los varones son obesos. Si la
misma proporcin de mujeres en esa poblacin son obesas, cul es la probabilidad de que una
muestra al azar de 250 varones y 200 mujeres proporcione un valor de
?
Solucin:
Se supone que la distribucin muestral de
es aproximadamente normal. Si la proporcin
de individuos obesos es la misma en ambas poblaciones, la media de la distribucin es igual a 0 y
la varianza es:
187
(Lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional
que calcule probabilidades normales).
Luego, si una variable X tiene distribucin N( ,
Despejando
en la ecuacin se tiene:
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresin
(mayor puntaje significa mayor depresin).
2
11
14
16
19
5
11
15
16
19
6
13
15
17
19
8
13
16
17
19
8
14
16
17
19
9
14
16
18
19
9
14
16
18
19
10
14
16
18
20
11
14
16
19
20
189
Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los
datos tienen distribucin normal, con varianza poblacional
desconocida. Como
es
desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es:
Luego, el intervalo de confianza para es (13.2, 15,8). Es decir, el puntaje promedio poblacional
se encuentra entre 13,2 y 15,8 con una confianza 95%.
Ahora construya un intervalo de confianza utilizando la distribucin t-Student.
III. Intervalo de Confianza para una Proporcin.
A menudo es necesario construir intervalos de confianza para una proporcin. Por ejemplo,
supngase que se toma una muestra de tamao n de una poblacin grande (posiblemente infinita)
y que X observaciones de esta muestra pertenecen a una clase de inters.
Ejemplo: El nmero de caras obtenidas al lanzar una moneda n veces.
X1, X2, X3,.Xn
X caras
B(n, p)
Ntese que
,a
190
z/2
- z/2
Pero:
Luego:
191
Obsrvese que:
Por lo que:
Note que para utilizar esta ecuacin se requiere una estimacin del parmetro p. Si se tiene una
estimacin de alguna muestra anterior, entonces p puede sustituirse por , de tal manera que:
192
Si el tamao muestral n es grande, el Teorema Central del Lmite nos asegura que:
O bien:
Ejemplo:
En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15
aos en la Regin Metropolitana, se encontr que el 17.6% eran hipertensas. Un intervalo de 95%
de confianza para la proporcin de mujeres hipertensas en la Regin Metropolitana est dado por:
Luego, la proporcin de hipertensas vara entre (0.139, 0.212) con una confianza de 95%.
IV. Intervalos de confianza para la diferencia de dos proporciones
Supngase que existen dos proporciones de inters p1 y p2, y es necesario obtener un intervalo
de confianza para la diferencia de p1 - p2 con un nivel de confianza de (1-)%. Supngase que se
toman dos muestras independientes de tamao n1 y n2 de dos poblaciones infinitamente grandes.
En estas dos muestras sean X1 el nmero de observaciones de la primera muestra que pertenecen
a la clase de inters y X2 el nmero de observaciones en la muestra de la segunda poblacin que
pertenecen a la clase de inters.
P1
P2
Xn1 observaciones
Xn2 observaciones
193
X1~B(n1,p)
X2~B(n2, p)
Luego:
=
=
As para
Donde Z tiene una distribucin que es aproximadamente normal, esto implica que podemos
sustituir el valor de Z directamente para construir el intervalo de confianza:
194
Pero:
Nos resta calcular
. Como (1-)=0.99, entonces /2= 0.005.
Luego como el valor para
no se encuentra en la tabla, promediamos los valores ms
prximos
Luego
Ejemplos:
1.
Solucin:
La sospecha estar apoyada si existe un intervalo de confiabilidad alto para el cual la proporcin
p se encuentra completamente a la derecha del valor asegurado 0.05. Si seleccionamos una
195
confiabilidad del 95%, entonces /2=0.025, y ya conocemos que X=19 y n=200, por lo que
=19/200=0.095
Al sustituir estos valores en:
Aparentemente existe una razn para sospechar del fabricante, ya que el intervalo de confianza se
encuentra completamente a la derecha del valor asegurado.
2.
196
3.
Solucin:
Se tiene que
Pero:
197
198
H0 es cierta
H0 es Falsa
Aceptar H0
Decisin Correcta
Error tipo II
()
Rechazar H0
Error tipo I
()
Decisin Correcta
Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y as
se tiene a conseguir poner una limitacin al error de mayor importancia. La nica forma de
reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
200
En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor estadstico t.
201
donde
Donde
202
Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha
Valor crtico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que no se rechaza la hiptesis nula.
Paso 5: Tomar una decisin.
En este ltimo paso de la prueba de hiptesis, se calcula el estadstico de prueba, se compara con
el valor crtico y se toma la decisin de rechazar o no la hiptesis nula. Tenga presente que en
una prueba de hiptesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hiptesis
nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hiptesis nula cuando no
debera haberse rechazado (error tipo I). Tambin existe la posibilidad de que la hiptesis nula se
acepte cuando debera haberse rechazado (error de tipo II).
Ejemplo 1:
Prueba la hiptesis
H0 : p = 0.4
H1 : p 0.4
H0 : p = 0.4
H1 : p 0.4
Paso 2
Paso 3
Z=
0.4(1 0.4)
0.0346
200
0.45 0.4
1.45
0.0346
.005
-2.575
.005
2.575
203
Paso 4
obtenemos:
.005
.005
-2.575
Paso 5
rechazamos Ho.
2.575
p = p0
H1 :
p > p0
p < p0
p p0
Paso 2
Z=
p p0
, donde p
p0 (1 p0 )
.
n
Paso 3
Usando la hiptesis alterna dibuja la regin bajo la curva z que representa los
valores extremos.
Valor P
Valor P
-z
z
(H1 : > o)
(H1 : < o)
P/2
P/2
-z
(H1 : o)
Paso 4
Paso 5
204
Ejemplo 1:
Pruebe la hiptesis
H0 : p = 0.4
H1 : p 0.4
H0 : p = 0.4
H1 : p 0.4
Paso 2
p
Z=
Paso 3
0.4(1 0.4)
0.0346
200
0.45 0.4
1.45
0.0346
Paso 4
1.45
P/2
P/2
= 0.147
Paso 5
Ejercicios.
1.
H0 : p=0.6
H1 : p 0.6,
2.
n = 100, y = 0.01
H0 : p = 0.29
H0 : p = 0.36
205
Bibliografa
Gardner, Robert C. (2003). Estadstica para Psicologa Usando SPSS para Windows.
Prentice-Hall, 1 ED.
206