You are on page 1of 17

.- Variable aleatoria. Concepto.

I
Antes de definir el concepto de varibale aleatoria, veamos algunos ejemplos (ya ests
empezando a comprobar que en estadstica sin ejemplos andamos algo perdidos).
Ejemplos:
Supongamos el experimento consistente en el lanzamiento de tres monedas, y consideremos la
variable . Los valores que puede tomar la variable son x = numero de caras del experimento
. x = 0, 1, 2, 3
Sea ahora el experimento consistente en lanzar dos dados y consideremos la varibale
. Los valores posible son:
x = suma de la cara superior de los dos dados
. x = 2, 3, 4, 5, 6, 7, 8, , 9, 10, 11, 12
Elijamos un alumno de la clase y preguntmonos por la varibable {tiempo invertido por el x =
alumno en cubrir el trayecto que va desde su casa al instituto}. En este caso la variable no puede x
tomar valores discretos, ya que el rango de tiempos es infinito y la distancia entre un tiempo dado y
el siguiente es infinitamente prxima y por tanto no podemos numerarlos.
Pues bien, todas las variables de los ejemplos anteriores son variables aleatorias. As,
Una variable aleatoria es una funcin que hace corresponder un x
nmero real a cada resultado de un experimento aleatorio.
Tambin de los ejemplos anteriores ya habrs podido deducir que existen dos tipos de
variables aleatorias:
Discretas, cuando la variable aleatoria toma como valores nmeros enteros.
Continua, cuando la variable aleatoria puede tomar cualquier valor dentro de un
intervalo y no es posible asignar un valor entero a un resultado cualquiera del
experimento.
A los valores que puede tomar una variable aleatoria se le llama recorrido. En el caso
de las tres monedas, por ejemplo, el recorrido son los nmeros . En el caso del 0, 1, 2, 3
tiempo invertido por el alumno sera el intervalo entre el mnimo valor y el mximo.

t
1,
t
2
(

Observacin. Hay variables discretas que pueden tomar infinitos valores, pero
siempre es posible contarlos o numerarlos. Por ejemplo, en el lanzamiento de un dado,
podemos preguntarnos por el la variable . En x = numero de lanzamientos hasta que salga un
principio, el nmero de lanzamientos hasta que salga el resultado esperado puede infinito,
pero es posible contarlos. Es, por tanto, una variable discreta.
- 19 -
TEMA II VARIABLES ALEATORIAS. DISTRIBUCIN .
BINOMIAL Y NORMAL
II. Variables discretas. Funcin de Probabilidad y Funcin de
Distribucin.
Lo que viene a continuacin es vlido slo para variables discretas. Y referidas a stas
pueden definirse dos funciones que con posterioridad nos servirn para calcular parmetros
tales como la media y la desviacin tpica de una variable aleatoria. Tales funciones son: la
funcin de probabilidad y la funcin de distribucin.
Se define funcin de probabilidad, , de una variable f(x)
aleatoria discreta a toda funcin que asocia a cada resultado del x
experimento su probabilidad de ocurrencia. Es decir:
f(x) = p(x)
Nuevamente confiemos en los ejemplos para entender las ideas.
Supongamos el lanzamiento de las tres monedas y la variable . El recorrido x = numero de caras
de la variable es y los resultados posibles del experimento son : x x = 0, 1, 2, 3
. E = CCC, CCX, CXC, CXX, XCC, XCX, XXXC, XXX
Si llamamos a probabilidad de que el nmero de caras sea , entonces, aplicando la regla de f(x) x
Laplace, es fcil ver que estas probabilidades son:
f(0) = p
(
0 caras
)
=
1
8
f(1) = p(1 cara ) =
3
8
f(2) = p(2 caras ) =
3
8
f(3) = p(3 caras ) =
1
8
Supongamos ahora que un tirador tira dos veces seguidas a una diana y sabemos que la probabilidad de
que acierte de cada vez es de 0.6. Consideremos para este experimento la variable aleatoria
, cuyo recorrido es x = numero de aciertos del tirador en los dos disparos x = 0, 1, 2
Sea ahora la funcin que asocia a cada valor de la variable su probabilidad de ocurrencia. Veamos, f(x)
diagrama de arbol:
1
er
disparo 2 disparo
Acierto
Fallo
0,6
0,6
0,4
0,4
0,6
0,4


f(0) = p(0 aciertos ) = 0.4
2
= 0.16
- 20 -
f(1) = p(1 acierto ) = 2 $ 0.6 $ 0.4 = 0.48
f(2) = p(2 aciertos ) = 0.6
2
= 0.36
En ambos casos la funcin es la funcin de probabilidad asociada a la variable para cada uno de f(x) x
los experimentos aleatorios.
Grficamente:
1/8
3/8
4/8
2/8
0,16
0,36
0,48
0 1
2 3
0 1 2
aciertos
caras
Se define funcin de distribucin de una variable aleatoria F(x)
discreta a toda funcin que asocia a cada valor de la variable x
su probabilidad de que sta tome todos los valores menores o
iguales que Es decir: x.
F(x) = p(todos los valores menores o iguales que x
Para el caso de las tres monedas, y siendo la variable aleatoria , esta funcin x = numero de caras
toma los valores:
F(0) = p
(
x [ 0
)
= 1/8
F(1) = p(x [ 1) = p(0) + p(1) = 1/8 + 3/8 = 4/8
F(2) = p(x [ 2) = p(0) + p(1) + p(2) = 1/8 + 3/8 + 3/8 = 7/8
F(3) = p
(
x [ 3
)
= p
(
0
)
+ p1) + p(2) + p(3) = 1/8 + 3/8 + 3/8 + 1/8 = 8/8 = 1
Para el caso del tirador, y siendo , la funcin queda: x = numero de aciertos F(x)
F(0) = p(x [ 0) = 0.16
F(1) = p
(
x [ 1
)
= p(0) + p(1) = 0.16 + 0.48 = 0.64
F(2) = p(x [ 2 ) = p(0) + p(1) + p(2) = 0.16 + 0.48 + 0.36 = 1
Por ltimo, cuando para una variable aleatoria discreta hemos obtenido su funcin de
probabilidad y su funcin de distribucin se dice que ha quedado determinada su distribucin
de probabilidad.
Ejercicios:
- 21 -
Determinar la distribucin de probabilidad (funcin de probabilidad y funcin de
distribucin) en cada uno de los siguientes casos. Representar mediante un diagrama de barras
y un polgono de frecuencias los resultados obtenidos.
(a) En una urna hay siete bolas, de las cuales tres son blancas y cuatro negras. Se
extraen tres bolas sin reemplazamiento y consideramos la variable aleatoria nmero de x =
bolas negras obtenidas entre las tres extradas
(b) Lanzamos dos dados y analizamos la variable aleatoria suma de las x =
puntuaciones de los dos dados.
(c) En el lanzamiento de 5 chichetas idnticas sea nmero de ellas que quedaron x =
con la punta hacia abajo. Supongamos que
p( )=0.70 y p( ) =0.30
(d) Supongamos un dado de quinielas (tres unos, dos equis y un dos) y estudiamos la
variable aleatoria nmero de veces que se lanza el dado hasta obtener una equis x =
III. Parmetros estadsticos: Media, Varianza y Desviacin Tpica
En primer lugar, se entiende por parmetro estadstico a toda cantidad que puede
obtenerse de los datos de una distribucin y que son representativos de alguna propiedad de la
misma. Muchos de estos parmetros te suenan ya: media, moda, mediana, varianza ,
desviacin tpica; de otros, en cambio, seguramente no has oido hablar: momentos ordinarios
y centrales, coeficientes de asimetra, de Kurtosis. Pues bien, de todos los parmetros que
pueden determinarse de una distribucin, dos de ellos resumen una gran parte de la
informacin necesaria para su interpretacin. Son: su media, como una medida del valor
central de los datos, y su desviacin tpica, como medida de lo dispersos que estn stos
respecto del valor medio.
Por cierto, lo de media, varianza y desviacin tpica, tal vez, te suene raro aqu. Estos
trminos suelen asociarse con la estadstica descriptiva: media de altura, de pesos, de
calificaciones. Vers, sin embargo, que estos conceptos aplicados a un conjunto de datos y a
una distribucin estadstica estn ligados de manera muy cercana.
Para mostrarlo, un ejemplo:
Supongamos que hacemos un estudio sobre el nmero de hijos de 15 familias, obtenendose los
resultados de la tabla:
1 1 2 6 5
n
i
=numero de familias
4 3 2 1 0
x
i
=numero de hijos
Si llamamos al nmero total de datos (en nuestro caso 15 ), el clculo del nmero medio de hijos de N
las 15 familias se realiza, como sabes, de la siguiente manera:
- 22 -

x =
x
i
$ n
i
N
=
0 $ 5 + 1 $ 6 + 2 $ 2 + 3 $ 1 + 4 $ 1
15
=
17
15
= 1, 13 hijos, de media
Sin embargo, el clculo de la media puede verse tambin de otro modo. Supongamos que definimos la
variable aleatoria
. x =numero de hijos de una de las familias del estudio
El recorrido de esta variable es . y su funcin de probabilidad, segn los datos de x = 0, 1, 2, 3, 4
la tabla toma los valores:
f(0) = p(0 hijos ) = 5/15 = 0.33
f(1) = p(1 hijo ) = 6/15 = 0.40
f(2 ) = p(2 hijos ) = 2/15 = 0.13
f(3) = p(3 hijos ) = 1/15 = 0.07
f(4) = p(4 hijos ) = 1/15 = 0.07
Ahora, la expresin que nos da el nmero medio de hijos puede expresarse en trminos de
probabilidad, ya que:
x =
x
i
$ n
i
N
= x
i
$
n
i
N
= x
i
$ f
(
x
i
)
= x
i
$ p(x
i
) = 1, 13 hijos, de media
Resumiendo, la media de un conjunto de datos y de una distribucin de probabilidad tiene un
significado equivalente y su valor es el mismo.
As:
Llamamos media o esperanza matemtica de una distribucin
estadstica a la suma de los productos de cada valor de la
variable por su probabilidad de ocurrencia. Se denota por la letra
griega .
(1) = x
i
$ p
(
x
i
)
Lo de esperanza matemtica proviene de los juegos de azar, ya que la media de una
distribucin estadstica tambin puede interpretarse como el promedio de ganancia esperado
por un jugador al apostar.
Llamamos varianza, , de una distribucin estadstica al
2
valor obtenido a travs de la frmula
(2)
2
= (x
i
)
2
$ p(x
i
)
O en su versin ms prctica para el clculo -que no
demostraremos-:

2
= x
i
2
$ p(x
i
)
2
- 23 -
Por ltimo
Llamamos desviacin tpica de una distribucin estadstica, , a
la raz cuadrada de la varianza:
= varianza = x
i
2
$ p(x
i
)
2
Sobre la media nada que decir. La varianza, en cambio, merece un comentario.
Observa que su clculo depende del valor de la diferencia al cuadrado entre cada valor de la
variable y la media de la distribucin. As pues, cuanto ms alejados estn los elementos
individuales de la media mayor es la varianza. Por tanto, esta es una medida de lo dispersos
que estn los datos respecto del valor medio. La varianza, sin embargo, presenta un problema
de interpretacin, ya que se mide en Para evitar esto y poder dar cm
2
, segundos
2
, hijos
2
, etc
los resultados en trminos de cm, segundos, hijos, etc se introduce la desviacin tpica como
la raz cuadrada de la varianza. As, todo cuadra.
Ejercicios.
1. Calcular la media y la varianza de las distribuciones de probabilidad de ejercicio del
apartado anterior. Interpretar los resultados.
IV. Distribucin Binomial.
En ejercicios anteriores ya has descrito casos de distribucin de probabilidad de
variables discretas. Algunas de estas distribuciones, por su importancia, tienen nombres
propios -Distribucin dicotmica, binomial, geomtrica, hipergeomtrica, de Poisson-
Por ejemplo, la distribucin del ejercicio (d) del apartado II, en la que nos preguntamos por el nmero
de veces que debemos realizar un experimento hasta obtener el resultado esperado corresponde al tipo
geomtrica.
Pues bien, probablemente sea la distribucin binomial, la que por su relacin con el
estudio de las proporciones (proporcin de jvenes que acceden a la universidad frente a los
que no, proporcin de personas que en vacaciones viajan al extranjero frente a las que no,
proporcin de los que invierten en bolsa frente a los que no, etc) tiene mayor importancia en
el mbito social.
Una distribucin de probabilidad se ajusta a los parmetros de una binomial si
verifica los siguientes requisistos:
El experimento consiste en un nmero determinado de ensayos idnticos e independientes,
, cada una de ellos con slo dos resultados posibles (xito o fracaso, a favor o en contra, n
cara o cruz).
La probabilidad de xito se designa por y la de fracaso por . Y dadas sus caractersticas, p q
se verifica
- 24 -
p + q = 1 o q = 1 p
La variable aleatoria es x = numero de exitos en los n ensayos
Pues bien, su funcin de probabilidad, es decir, la que da la probabilidad de obtener
xitos de ensayos viene determinada por la siguiente frmula: x n
f(x) = p(x exitos de n ensayos) =
|
\

n
x
|

| p
x
$ q
nx
donde el trmino es el llamadao nmero combinatorio.
|
\

n
x
|

| =
n!
x!
(
n x
)
!
El nmero medio de xitos, , y la varianza y desviacin tpica, , se calculan
aplicando las frmula (1) y (2) -que omitiremos, por resultar los clculos algo engorrosos- ,
llegndose a los siguientes resultados:
Media = n $ p
Varianza
2
= n $ p $ q
Desv. tpica = n $ p $ q
Abreviadamente, a las distribuciones binomiales se las designa por . B(n, p)
Una observacin muy importante es que en cada uno de los ensayos de una
distribucin binomial la probabilidad de xito y de fracaso no debe cambiar. Por ejemplo, si
extraemos 10 estudiantes al azar de una universidad para preguntarles si utilizan el comedor
universitario, siendo esta proporcin, antes de extraer ningn estudiante, del 35 % que s
(xito) y del 65 % que no (fracaso) y su respuesta ha sido afirmativa, entonces la proporcin
de estudiantes de esa universidad que s y que no utilizan el comedor universitario ha variado
ligeramente como consecuencia de la extraccin de un estudiante. Siendo rigurosos y, para
que pueda hacerse el estudio a travs de un distribucin binomial, el individuo extrado debe
ser reinsertado nuevamente a la poblacin para que tenga la posibilidad de ser elegido
nuevamente!... No obstante, cuando la poblacin es muy grande, como es el caso que nos
ocupa, la variacin que se produce al extraer un nmero reducido de individuos es tan
pequea que apenas tiene incidencia en los resultados que se obtienen y puede omitirse este
rebuscado procedimiento. Sacamos a los 10 individuos, y ya est.
Ejercicios.
1. Indica si cada una de las siguientes situaciones se ajustan a distribuciones binomiales...
Descrbelas y calcula en cada caso su valor medio y su desviacin tpica. Interpreta los
resultados.
(a) Un cazador acierta en el 65 % de los disparos que realiza. Definimos la variable
aleatoria nmero de aciertos en los prximos cinco disparos. x =
(b) Un medicamento contra la gripe es efectivo en 8 de cada 10 enfermos. Definimos la
variable aleatoria nmero de enfermos curados en un grupo de 10 enfermos x =
- 25 -
(c) Consideremos xito obtener cara al lanzar una moneda. Lanzamos la moneda 7 veces
y consideramos la variable aleatoria: nmero de caras obtenidas en los 7 x =
lanzamientos
(d) En una urna en la que hay 7 bolas rojas y 5 negras, extraemos de una vez 3 bolas y
consideramos la variable aleatoria nmero de bolas rojas de las 3 extradas x =
(e) La probabilidad de nacimiento de nios varones en Espaa es del 51,7 %, mientras
que la de nias es del 48,3 %. Consideramos la variable aleatoria nmero de x =
varones en una familia con 5 hijos
(f) En la primera evaluacin -sin contar la recuperacin- aprobasteis la asignatura de
matemticas 12 alumnos de un total de 22 que estis en clase. Sea la variable aleatoria
nmero de alumnos que aprobaron que las matemticas de un grupo de 4 alumnos. x =
2.- a) Cul es la probabilidad de que el cazador del ejercicio (a) cace al menos una pieza si
un da efectu cinco disparos?
b) Y de que cace exactamente 2 piezas? Y ninguna? -que tambin puede ser-.
3.- a) Cul es la probabilidad de que un grupo de diez enfermos del ejercicio (b) a los que
se les suministr el medicamento todos estn curados?
b) Cul es la probabilidad de que estn curados ms de la mitad de los enfermos?
4.- a) Cuntos nios y nias (ejercicio (e)) se espera habr entre los 1500 bebs que
nacieron en cierta ciudad el ao pasado?
b) Cul es la probabilidad de que en una familia con cinco hijos slo haya nias?
5.- Y finalmente...
a) Cul es la probabilidad de que cuatro de vosotros elegidos al azar por Adolfo
hayis aprobado todos las matemticas en la primera evaluacin? Y al menos uno?
b) Podras hacer previsiones para la segunda evaluacin con los datos disponibles?
V. Variables estadsticas continuas. Funcin Densidad.
Al principio del tema, al introducir el concepto de variable aleatoria, distinguiamos
entre variable discreta y continua. Hasta ahora slo hemos tratado las primeras, las que slo
pueden tomar valores discretos (generalmente nmeros enteros), pero no ha aparecido ninguna
que pueda tomar cualquier valor dentro de un rango. Y esto es porque el tratamiento para este
tipo de variables -tiempos, pesos, alturas, cantidades, etc- es completamente distinto.
Un nuevo ejemplo para ilustrar lo dicho:
Supongamos nuevamente a nuestro alumno, compaero y amigo que con gran perseverancia mide y
anota cada dia el tiempo que invierte en el trayecto desde su casa al instituo. Fruto de sus anotaciones observa
que este tiempo se encuentra comprendido entre 7 y 12 minutos, es decir en el intervalo .Ahora bien, 7, 12(
cuntos tiempos son posibles en ese intervalo?... Te habrs percatado de que la respuesta es: infinitos!. As
pues, a priori, la probabilidad de que se de uno solo de ellos es cero (aplica la regla de Laplace: divide tu
resultado favorable entre los infinitos posibles y observa que el resultado es cero). Por tanto para la variable
- 26 -
aleatoria tiempo invertido en realizar el trayecto desde casa al instituto no es posible construir una funcin x =
de probabilidad, puesto que la probabilidad de que ocurra cada uno de los valores posibles de la variable es
siempre nula. Pensars con razn que algunos de los resultados s ocurren, los que tiene anotados en su cuaderno
de tiempos. Y esto es cierto, pero a priori, incluso para esos tiempos la probabilidad de ocurrencia es cero -no me
preguntes, entonces, cmo ocurrieron, podriamos entrar en una interminable discusin sobre el infinito, tal vez
interesante, pero de la misma utilidad que los claustros y reuniones de tutores de este instituto: ninguna, y con el
pernicioso efecto secundario de agrandar el ego de quienes las presiden y disminuir en la misma proporcin su
capacidad de sntesis-.
Cmo obtener entonces los parmetros que caracterizan la distribucin, media y
desviacin tpica, si no disponemos de una funcin de probabilidad a travs de la cul realizar
los clculos?
Nuestro amigo diria: fcil!, sumo todos los tiempos que tengo anotados , los divido por el nmero de
anotaciones y ya tengo la media. Y para la desviacin tpica, elevo al cuadrado cada dato, los sumo, divido el
resultado entre el nmero de anotaciones y le resto el cuadrado de la media; hallo su raz cuadrada, y ya est. es
decir aplico la frmula:
= x
i
2
$ n
i

2
en todos los casos vale uno, pues es muy raro que se repita un resultado. n
i
Bien, esta forma de proceder es la correcta y sin duda es la nica que conduce a los
verdaderos resultados de los parmetros media y desviacin tpica. Pero presenta dos
problemas:
Si el nmero de anotaciones fuera muy grande (como suele ocurrir cuando se tratan
problemas reales) el procedimiento no es operativo (imagina por ejemplo sumar las alturas
de todos los habitantes de un pais y dividir por el nmero de habitantes para determinar su
altura media).
Aunque fuera posible determinar sus parmetros, media y desviacin tpica, no podramos
utilizarlos para hacer predicciones ni hiptesis sobre sus posibles cambios en el tiempo
(este ser el tema del prximo captulo de la estadstica)
As pues se hace necesario construir algo parecido a una funcin de probabilidad.
Razonamos de la siguiente manera: puesto que para un resultado cualquiera de la
variable aleatoria existen infinitos que estn muy prximos a l, no tiene sentido tratarlos
como si fueran distintos y as, lo ms razonable es meter dentro de un intervalo de la variable
todos aquellos cuyos valores se encuentran entre sus lmites. Esto es un histograma.
Por ejemplo, puede que para nuestro compaero y alumno no represente mucha diferencia tardar
medio minuto ms o menos en realizar el trayecto desde su casa al instituto, as es que decide partir el intervalo
que va de los 7 a los 12 minutos en subintervalos de longitud medio minuto y contar el nmero de veces cuyos
tiempos se encuentran en los intervalos construidos. Como valor representativo de cada intervalo puede tomar su
valor central. Supongamos que el resultado es el siguiente:
- 27 -


La lnea que une las barras verticales se llama polgono de frecuencias y como vers ms adelante
tiene su importancia.
El proceso iniciado puede acabar aqu o continuar. Si el nmero de datos es muy
grande ello nos permite estrechar los intervalos. Podemos, adems, sustituir la frecuencia
absoluta en el eje vertical por la relativa o, su equivalente, por la probabilidad de que ocurra
un resultado en un intervalo determinado.
Observar que en el eje vertical no hace referencia a la probabilidad de un resultado f
concreto, como ocurria para variable discreta, -esta probabilidad como se dijo al principio es
cero- sino a la probabilidad por intervalo de la variable. Se trata pues de una densidad de
probabilidad, de la misma manera que hablamos de habitantes por de un pas, de kg de km
2
grano por hectrea de una explotacin agrcola o de nacimientos por cada 1000 habitantes
como ndice de crecimiento. Aqu se habla de probababilidad por amplitud de intervalo.
Cuando el nmero de intervalos es muy grande, y por tanto muy estrechos, el
polgono de frecuencias adopta la forma de una curva que representa en cada punto la altura
de la barra correspondiente. Si quitamos estas barras, que ya no son necesarias queda una
curva como la siguiente:
- 28 -
7 7,5 8 8,5 9 9,5 10 10,5 11 11,5 12
t
n
x
f
x
f
A esta y otras curvas obtenidas de esta manera se las llama funciones densidad para
variables continuas, y como tales funciones se las denota por . f(x)
Una aclaracin ya mencionada. Las funciones dendisad no representan la
probabilidad de ocurrencia de un valor concreto de la variable, como ya se ha mencionado
esta probabilidad es cero, pero a partir de su forma es posible determinar la probabilidad de
que un valor se encuentre entre dos dados, puesto que todas las funciones densidad cumplen
las siguientes dos propiedades:
El rea bajo la curva y el eje entre dos valores nos da la probabilidad de que la X x
1
y x
2
variable se encuentre entre . x
1
y x
2
probabilidad de x entre x
1
y x
2
=p
(
x
1
[ x [ x
2
)
= A
El rea total bajo la curva entre los extremos de la funcin es 1.
VI. Distribucin Normal.
Aunque existen funciones densidad de muy distintas formas, lo cierto es que muchos
fenmenos sociales acaban adoptando la forma de funciones tericas conocidas. Esto es una ventaja,
pues al ser conocidas es posible determinar sus parmetros, cuantificar probabilidades y hacer
predicciones.
Entre estas funciones densidad cuya frmula terica es conocida, la ms importante de todas
es la llamada distribucin Normal o Campana de Gauss. Su importancia se debe no slo al gran
nmero de fenmenos reales para los que es posible tomar como modelo esta distribucin
(especialmente cualquier variable de carcter cuantitativo de casi todas las grandes poblaciones) sino
al hecho de que otras distribuciones de uso frecuente bajo ciertas condiciones tienden a distribuirse
segn una normal.
Veamos sus caractersticas ms importantes:
Su forma es la de una campana en la que el valor medio de la varible, , ocupa su valor central.
Para este valor la funcin toma el mximo valor. es la desviacin tpica de la variable. Las dos
colas de la funcin se aproximan a cero (eje ) cuanto ms nos alejamos del valor central. X
- 29 -
Su frmula matemtica es (Otra vez el nmero ) f(x) =
1
2
e

1
2
|
\

|
e = 2, 718...
El rea total bajo su curva es 1 -como para cualquier funcin densidad-, pero adems se
verifica que:
En el intervalo se encuentra el 68,4 % de los datos.
|
\
, +
|

En el intervalo se encuentran el 95,4 % de los datos


|
\
2, + 2
|

En el intervalo se encuentran el 99,7 % de los datos.


|
\
3, + 3
|

Abreviadamente a las distribuciones normales se las designa por . N


|
\
,
|

Bien. Y para qu sirve?... Vamos a ello.


Supongamos que hacemos un estudio sobre el peso de los nios recin nacidos, y que
dichos pesos se distribuyen segn una normal de media y desviacin tpica (es lgico que
as sea: habr un nmero muy grande de nios cuyos pesos estn prximos al valor medio y a
medida que nos alejamos de ese valor, tanto por exceso como por defecto el nmero ir
disminuyendo). Pues bien, a partir de la curva podemos asegurar que el 68,4 % de los recin
nacidos tendr un peso comprendido entre , y que, por ejemplo, un nio cuyo y +
peso haya sido superior a es anormalmente gordo, puesto que ms del 99,7 % de los + 3
nios dan un peso inferior a esa cantidad. Ms an -y esto es lo ms importante- dado el peso
de un nio, podemos calcular la proporcin de ellos con un peso superior -inferior- al
obtenido: para ello, basta dividir el rea que queda por encima -por debajo- de ese peso entre
el rea total de la curva, que como se ha dicho es 1. Pero esto no podemos hacerlo
directamente, antes hay que tipificar la variable.
Un nio da un peso de 4,200 kg, el valor medio establecido en estudios previos fue de
3,750 kg ( ) y la desviacin tpica de 0,420 kg ( ), ajustndose los datos a una distribucin
normal . Son muchos los nios con un peso igual o superior a 4,200 kg? N
(
3, 750; 0, 420
)
Para saberlo situamos este valor en la curva y sealamos el rea que queda a su derecha. La
razn entre esta rea y la total bajo la curva -que es 1- es precisamente esa proporcin.
- 30 -
Sin embargo, estos clculos no pueden hacerse sobre la distribucin de los recin
nacidos pues desconocemos el rea a la derecha del valor . Dont worry!, existe x = 4, 200 kg
una distribucin normal de media , idntica a cualquier otra distribucin normal = 0 y = 1
pero cuyas reas estn calculadas y recogidas en una tabla para cualquier valor de . As es x
que lo nico que debemos hacer es determinar sobre esa distribucin , el valor N(0, 1)
equivalente a nuestro 4,200 kg, y buscar en la tabla el valor del rea correspondiente (hay
unas reglas de clculo que vistes el ao pasado y que repasaremos este ao). A este proceso se
le denomina tipificar la variable.
Si es el valor que queremos tipificar y llamamos al valor de su x = 4, 200 kg z
equivalente en la distribucin , entonces N(0, 1)
(frmula que tipifica a ) z =
x

x
nos da el valor de: z =
4, 200 3, 750
0, 420
= 1, 07
el cul, buscado en la tabla, y aplicando las reglas de clculo da una proporcin de:
p(z m 1, 07) = 1 0.8577 = 0.1423
Es decir, el 14,23 % de los nios tendrn un peso igual o superior a 4,200 kg
- 31 -
Ejercicios.
1. Las puntuaciones obtenidas en un test de aptitudes aplicado cada ao a estudiantes
universitarios siguen una distribucin N(500, 100)
a) Qu porcentaje de estudiantes universitarios se espera que obtengan puntuaciones
entre 500 y 675?
b) Qu porcentaje de etudiantes se espera que logran puntuaciones superiores a 630?
c) Qu probabilidad hay de que un estudiante elgido al azar tenga una puntuacin
superior a 700?
2. Supongamos que la altura de las personas con edades comprendidas entre 20 y 30 aos se
distribuye normalmente con media 1,65 metros y desviacin tpica 0,15 metros.
Si consideramos que una persona es alta si mide ms de 1,80 metros, qu nmero de
personas altas se espera que haya en un grupo de 2.000 individuos con edades
comprendidas entre los 20 y 30 aos?
3. Si se multiplica una variable con distribucin normal por una constante, se obtiene otra
variable con distribucin normal, cuyas medias y desviacin tpica quedan multiplicadas por
dicha constante.
x d N
|
\
,
|

entonces kx d N(k, k)
Segn esto, calcula la probabilidad que tiene una empresa de ingresar por ventas ms de
20.000 euros, cuyo producto tiene una demanda que sigue una distribucin normal
si el precio de venta al pblco de cada unidad es de 3,6 euros. N(5.000, 250)
4. Si se suman o restan dos variables aleatorias que presentan distribucin normal, se obtiene
otra variable aleatoria con distribucin normal cuya media es la suma o resta de las medias y
cuya varianza es la suma de las varianzas:

x d N
|
\

1
,
1
|

y d N
|
\

2
,
2
|

d x + y d N(
1
!
2
,
1
2
+
2
2
)
Una tienda vende dos productos. El primero de ellos tiene una demanda diaria que se
distribuye segn una ley normal de media 200 unidades y desviacin tpica 30, y se vende a 5
euros la unidad. El segundo producto tiene una demanda diaria de 60 unidades, con una
desviacin tpica de 4 unidades, y se vende a 20 euros la unidad.
a) Halla la probabilidad de que un da, las ventas de ambos productos superen los
2.370 euros.
b) Halla la probabilidad de que un da las ventas del primer producto sean superiores a
las del segundo producto.
- 32 -
VII. Convergencia de la distribucin binomial hacia la normal
Son muchas las distribuciones de probabilidad de variable discreta en las que al
aumentar el nmero de ensayos se comportan como una distribucin normal. As, se puede
comprobar que las distribuciones binomiales si es los suficientemente grande y no B(n, p) n p
est prximo a 0 ni a 1, se aproximan a una normal de media y desviacin tpica = np
. Es decir: = npq
B
|
\
n, p
|

d N
|
\
np, npq
|

Generalmente se admite que la aproximacin es aceptable cuando


n m 30 , np m 5 y np m 5
La aproximacin es tanto mejor cuanto mayor es el nmero de pruebas y cuanto ms n
prximos a 0.5 sea el valor de la probabilidad . p
En las grficas siguientes se muestra esta aproximacin para algunas binomiales. Las
lineas verticales son los resultados de la distribucin binomial y la curva continua la
aproximacin de la correspondiente distribucin normal.
De ellas se observa que el mejor ajuste se da para la binomial cuyo ajuste a B(30, 0.5),
la normal de media es casi = 30 $ 0.5 = 15 y desviacion ti pica = 30 $ 0.5 $ 0.5 = 2, 72
perfecto.
Ejercicios
- 33 -
1. El cinco por ciento de las bombillas fabricadas salen defectuosas. Si se extrae una muestra
de 2.000 bombillas, halla la probabilidad de que dicha muestra contenga ms de 120
bombillas defectuosas.
2. Durante cierta epidemia de gripe enferma el 20 % de la poblacin. En un centro escolar con
350 alumnos,
a) Cul es la probabilidad de haya exactamente 50 alumnos que pasen la gripe?
b) Y la probabilidad de que haya al menos 40 alumnos?
c) Y la probabilidad de que haya entre 40 y 60 alumnos?
3. En un pas, la tasa de paro de la poblacin es de 8,5 %. Si se toma una muestra de 50
individuos, cul es la probabilidad de que en la muestra haya un nmero de parados menor o
igual que 4? Efecta los clculos mediante la distribucin binomial y aproximando mediante
la normal. Compara los resultados.
En la misma muestra cul es la probabilidad de que el nmero de parados sea superior a 10.
- 34 -
- 35 -