You are on page 1of 57

FACULTAD DE CIENCIAS ECONOMICAS

FRANJA MORADA - CONDUCCION


ESTADSTICA PARA LOS NEGOCIOS.
Paul Newbold.
Cmo resumir la informacin numrica.
Poblaciones y muestras.
Definicin.
La poblacin es el conjunto completo de la informacin numrica sobre una caracterstica
particular en la que el investigador est interesado.
Una muestra es un subconjunto de los valores poblacionales observados.
Notacin.
Poblacin: N observaciones designadas por x

! x
"
! ...! x
N
.
Muestra: n observaciones designadas por x

! x
"
! ...! x
n
Resumen numrico: medidas de centralizacin.
La media.
Definicin.
La media de un conjunto de observaciones numricas es la suma de los valores del
conjunto dividida por el n#mero de observaciones! es decir! su promedio.
La media se calcula sumando todas las observaciones $ dividiendo el resultado por el
n#mero de observaciones.
%xpresiones algebraicas para la media.
&ean x

! x
"
! ...! x
N
! los N datos correspondientes a una poblacin. %ntonces! la media
poblacional es' (
N

=
N
1 i
xi
&ean x

! x
"
! ...! x
n
! los datos correspondientes a una muestra. %ntonces! la media
muestral es'
n
x
X
n
i
i

=
=
1
La mediana.
Definicin.
La mediana de un conjunto de observaciones es la observacin que ocupa el lugar central
cuando stas estn ordenadas en sentido creciente si el n#mero de observaciones es
impar! $ el promedio de las dos observaciones centrales si la cantidad es par. %s decir! si
se tienen N observaciones ordenadas de menor a ma$or! la mediana es la observacin
que ocupa la posicin )*N + ,-". cuando N es impar! $ la media de las observaciones que
ocupan las posiciones *N-", $ )*N + ",-". cuando N es par.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
%n aquellas situaciones en las que se considera inadecuado dar muc/o peso a las
observaciones extremas! se preferir usar como medida de centrali0acin la mediana en
lugar de la media. 1 pesar de esta ventaja de no verse tan afectada por las
observaciones extremas! la mediana se usa con menor frecuencia que la media. %l
motivo es que el desarrollo terico de los mtodos de inferencia basados en la media es
considerablemente ms sencillo que el desarrollo de los mtodos basados en la mediana.
La moda.
Definicin.
La moda de un conjunto de observaciones es el valor que aparece con ma$or frecuencia.
%l concepto de moda es relevante en los casos de conjuntos de datos en los que /a$
observaciones que aparecen varias veces.
Resumen numrico: medidas de dispersin.
La varianza y la desviacin tpica.
2epresentemos por x

! x
"
! ...! x
N
una poblacin de valores numricos con media . Dado
que queremos anali0ar la dispersin de estos valores! ser fijarnos en sus discrepancias
con respecto a la media. &in embargo! las diferencias de las observaciones con respecto
a la media estn equilibradas3 es decir! su suma es 43 pero no nos interesa el signo de
estas diferencias.
%l promedio de los cuadrados de las discrepancias nos proporciona una medida de la
dispersin que se conoce con el nombre de varian0a.
Definiciones.
&ean x

! x
"
! ...! x
N
los N miembros de una poblacin con media . La varianza
poblacional!
"
! es el promedio de los cuadrados de las diferencias entre estos valores $
su media. %s decir'

"
( )

=
N
i 1
*x
i
5 ,
"
. - N ( *

=
N
i 1
x
i
"
,-N 5
"
La desviacin tpica poblacional! ! es la ra0 cuadrada *positiva, de la varian0a.
La equivalencia entre ambas frmulas se demuestra de la forma siguiente'

=
N
i 1
*x
i
5 ,
"
(

=
N
i 1
*x
i
"
5 "x
i
+
"
, (

=
N
i 1
x
i
"
5 "

=
N
i 1
x
i
+

=
N
i 1

"
(

=
N
i 1
x
i
"
6 "N
"
+ N
"
(

=
N
i 1
x
i
"
5 N
"
Interpretacin de la desviacin tpica poblacional.
7uede usarse la desviacin tpica para estimar el porcentaje de valores de la poblacin
que se encontrarn a menos de una distancia especfica de la media. 7ara construir tales
estimaciones! usaremos dos reglas.
2egla de 8c/eb$c/ev.
7ara cualquier poblacin con media $ desviacin tpica ! al menos el 44* 6 -m
"
,9
de los valores de la poblacin se encuentran a una distancia de la media menor que m
veces la desviacin tpica! para cualquier n#mero m : .
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
2egla emprica.
7ara la ma$ora de poblaciones grandes! aproximadamente el ;<9 de los valores de la
poblacin se encuentran a una distancia de la media menor que una desviacin tpica! $
aproximadamente el =>9 estn a una distancia de la media menor que dos veces la
desviacin tpica.
Varianza muestral y desviacin tpica.
Definiciones.
&ean x

! x
"
! ...! x
n
los n valores de una muestra cu$a media es x . La varianza muestral!
s
"
! se define como s
"
( )

=
n
i 1
*x
i
5 x ,
"
. - *n 6, o s
"
( )

=
n
i 1
*x
i
5 x ,
"
. - *n 6 ,
La desviacin tpica muestral! s! es la ra0 cuadrada *positiva, de la varian0a.
%l /ec/o de que se divida por *n 6 , en lugar de /acerlo por n es que en esta frmula
/emos usado como medida de centrali0acin la media muestral en lugar de la media
poblacional.
La media de las desviaciones absolutas.
Definiciones.
&ean x

! x
"
! ...! x
N
los N valores de una poblacin cu$a media es . La media de las
desviaciones absolutas es el promedio del valor absoluto de las desviaciones de estos
valores respecto a su media! es decir' ?D1 (
N
x
N
i
i

1

La media muestral de las desviaciones absolutas se define de manera anloga como el
promedio de las desviaciones absolutas de las observaciones muestrales respecto a su
media.
1 la /ora de elegir una medida que describa la cantidad de dispersin de un conjunto de
datos! la media de las desviaciones absolutas tiene dos ventajas frente a la desviacin
tpica. %n primer lugar! es ms fcil de interpretar conceptualmente. %n segundo lugar!
dado que en el clculo de la varian0a $ de la desviacin tpica se elevan al cuadrado las
desviaciones individuales! estas dos medidas se vern ms influenciadas por
observaciones extremadamente grandes o extremadamente peque@as que la media de
las desviaciones absolutas. 1 pesar de sus ventajas! la media de las desviaciones
absolutas se emplea con poca frecuencia en la prctica! debido a las complicaciones que
pueden surgir si se usa para /acer inferencias sobre una poblacin a partir de las
observaciones de una muestra.
l ran!o o recorrido.
Definicin.
%l rango o recorrido de un conjunto de datos es la diferencia entre la ma$or $ la menor de
sus observaciones.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
%s susceptible de sufrir una distorsin considerable si la muestra contiene alguna
observacin exageradamente atpica. 1dems! su valor puede verse influido por el
n#mero de observaciones. La principal aplicacin econmica del recorrido es el control
de calidad estadstico.
l ran!o intercuartlico.
Una forma de solventar el inconveniente de la dispersin del rango o recorrido es
descartar unas pocas de las observaciones ms altas $ ms bajas! $ /allar el recorrido de
las observaciones restantes. Los cuartiles se calculan de forma que /a$a el mismo
n#mero de observaciones antes $ despus de cada cuartil.
Auartiles $ rango intercuartlico.
&upongamos que se tienen N observaciones ordenadas de menor a ma$or. %ntonces! el
primer cuartil es la observacin que ocupa la posicin )*N + , - B. $ el tercer cuartil es la
observacin que ocupa la posicin )C*N + , - B.. %l segundo cuartil *la mediana, es la
observacin que ocupa la posicin )*N + , - "..
Auando *N + , no es un m#ltiplo entero de B! los cuartiles se calculan por interpolacin.
&e toma como primer cuartil el n#mero que est a una determinada posicin *4!">3 4!>3
4!D>, entre la x $ la x+ observacin. 1nlogamente! tomamos como tercer cuartil el
n#mero que est a una determinada posicin entre la x $ la x+ observacin.
La diferencia entre el tercer $ el primer cuartil nos da una medida de la dispersin que se
conoce con el nombre de rango intercuartlico. %s el rango que contiene la mitad central
de las observaciones. &e ve mu$ poco influenciado por observaciones atpicas.
"atos a!rupados e #isto!ramas.
Los subintervalos en los que se dividen el conjunto de datos! reciben el nombre de clases!
$ el n#mero de observaciones en cada clase se llama frecuencia. 7ara cada clase
particular! la frecuencia acumulada es el n#mero total de observaciones que /a$ en esa
clase $ las anteriores.
Las frecuencias relativas acumuladas son las sumas acumuladas de las frecuencias
relativas. &e obtiene a@adiendo la frecuencia relativa de esa clase a la frecuencia relativa
acumulada de la clase anterior.
Definiciones $ notacin.
&upongamos que un conjunto de N observaciones numricas se subdivide en E clases.
%ntonces'
. Los n#meros de observaciones que caen en cada una de estas clases reciben el
nombre de frecuencias! $ se designan f

! f
"
! ...! f
E
. 7uesto que N es el n#mero total de
observaciones! deber verificarse'

=
K
i 1
f
i
( N
". La proporcin de observaciones que se encuentra en cada una de las clases recibe el
nombre de frecuencia relativa. 7or tanto! la frecuencia relativa de la clase i5sima es
f

-N.
C. La proporcin de todas las observaciones que son menores que el lmite superior de la
i 6 sima clase recibe el nombre de frecuencia relativa acumulada. %sta proporcin
viene dada por f

-N + f
"
-N + ... + f
i
-N ( *f

+ f
"
+ F + f
i
,-N
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
2eglas generales.
. %l rango de posibles observaciones debe subdividirse en clases no solapadas! de
forma que cada observacin particular debe estar en una $ slo una de las clases.
". %n general! para lograr una interpretacin ms fcil! es preferible establecer intervalos
de igual longitud.
C. %s importante que nos aseguremos de que los puntos medios de las clases o
intervalos son representativos de los valores de los miembros de esa clase.
B. Aon frecuencia! la decisin ms difcil de tomar es decidir el n#mero de clases a
incluir. &i el n#mero de clases es demasiado peque@o! la clasificacin resultante
puede esconder aspectos importantes de los datos. &i /a$ demasiadas clases! puede
resultar un grfico difcil de interpretar.
Diagramas de tallo y hoas.
%l diagrama de tallos $ /ojas consiste en agrupar los datos seg#n sus primeras cifras! $
/acer un listado de las #ltimas cifras de cada miembro de una clase. 8ransmite una
impresin visual del n#mero de observaciones de cada clase.
Resumen numrico de datos a!rupados.
$edia y varianza para con%untos de datos con observaciones repetidas.
?edia $ varian0a para conjuntos de datos con observaciones repetidas.
&upongamos que en un conjunto de datos aparecen los valores m

! m
"
! ...! m
E
! con
frecuencias f

! f
"
! ...! f
E
respectivamente.
1. 7ara una poblacin de N observaciones! tal que N (

=
K
i 1
f
i
La media es (
N
m f
K
i
i i

=1
La varianza es'
"
( )

=
K
i 1
f
i
*m
i
5 ,
"
. - N ( )*

=
K
i 1
f
i
m
i
"
, - N. 5
"
2. 7ara una muestra de n observaciones! tal que n (

=
K
i 1
f
i
La media es x (
n
m f
K
i
i i

=1
La varianza es' s
"
( )

=
K
i 1
f
i
*m
i
5 x ,
"
. - *n 6 , ( G)*

=
K
i 1
f
i
m
i
"
, - N. 5 n x
"
H- *n 6 ,
$edia y varianza para datos a!rupados.
&upongamos que se dispone slo de datos agrupados en clases. &in embargo! no
conocemos el valor exacto de las observaciones. 7ara poder dar alguna medida!
necesitaremos /acer alguna aproximacin. 7uesto que la locali0acin exacta de los
valores de cada clase es desconocida! una posibilidad consiste en proceder como si todos
los puntos de una clase estuviesen situados en el centro del intervalo. Auando se /ace
esto! suele llamarse a los untos medios de cada clase marcas de clase.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
?edia $ varian0a aproximadas para datos agrupados.
&upongamos que tenemos datos agrupados en E clases con frecuencias f

! f
"
! ...! f
E
. &i
los puntos medios de estas clases son m

! m
"
! ...! m
E
! la media $ la varian0a del conjunto
de datos agrupados pueden estimarse usando las frmulas para observaciones repetidas
que se dieron anteriormente.
$ediana y ran!o intercuartlico para datos a!rupados.
%stimacin de la posicin de una observacin en una clase.
&upongamos que una clase! cu$o extremo inferior es L $ cu$o extremo superior es U!
contiene f observaciones. &i se ordenan estas observaciones de menor a ma$or! se
estimar la j 6 sima observacin por' L + *j 6 I,
f
L U ) (
para j ( ! "! ...! f
Clase modal.
Definicin.
7ara datos agrupados! la clase modal es la clase con ma$or frecuencia.
&simetra.
%n una distribucin simtrica! los datos se distribu$en simtricamente alrededor de su
valor central3 las observaciones extremadamente grandes no son ms frecuentes que las
extremadamente peque@as.
Una distribucin asimtrica a la derec/a! tiene la caracterstica de que su media es ma$or
que su mediana.
Una distribucin asimtrica a la i0quierda! representa la situacin opuesta.
%l /istograma es una /erramienta grfica importante para anali0ar los datos.
'tros mtodos !r(ficos.
"ia!ramas de barras.
Los diagramas de barra constitu$en una /erramienta mu$ adecuada para comparar los
tama@os relativos de cantidades que se distribu$en! en el espacio! en el tiempo.
Los diagramas de barras por componentes! permite /acer comparaciones visuales tanto
sobre el total como sobre sus componentes individuales.
)r(ficos temporales.
Una forma alternativa de ilustrar la evolucin de una cantidad a lo largo del tiempo!
consiste en dibujar un grfico con los diferentes valores a lo largo del tiempo. &ituando el
tiempo a lo largo del eje /ori0ontal! $ la cantidad numrica de inters en el eje vertical! se
obtiene! para cada observacin! un punto del grfico. Uniendo los puntos consecutivos
mediante lneas se obtiene un grfico temporal! que proporciona una idea visual de la
evolucin fcil $ rpida de la variable.
Los grficos temporales proporcionan una visin mu$ adecuada de la evolucin /istrica
de una variable.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Picto!ramas.
Los pictogramas! o diagramas de tarta! son #tiles para representar la divisin de un todo
de las partes que lo constitu$en. La tarta se constru$e de forma que el rea de cada
fragmento es proporcional a la frecuencia que le corresponde.
"ia!ramas de dispersin.
Los diagramas de dispersin! proporcionan una visin grfica de la relacin entre dos
variables.
"ia!ramas de ca%a.
%l rectngulo *o JcajaK, se dibuja de forma que sus lmites inferior $ superior corresponden
al primer $ al tercer cuartil respectivamente. %n el interior de la caja se /a dibujado una
lnea para se@alar el lugar que ocupa la mediante. %l valor atpico aparece lejos de la
caja! $ las lneas que van desde los bordes de la caja /asta las lneas intermitentes *o
JbigotesK, se@alan la menor $ la ma$or de las observaciones restantes.
Los diagramas de caja resultan mu$ #tiles para comparar visualmente dos o ms
conjuntos de datos.
Probabilidad.
*ntroduccin.
&i nos basamos en la informacin muestral! es imposible determinar exactamente la
reaccin de la totalidad de la poblacin3 cualquier medida de dic/a reaccin
inevitablemente llevar consigo incertidumbre.
+perimentos aleatorios, resultados, sucesos.
Definicin.
Un e!perimento aleatorio es un proceso que puede concretarse en al menos dos
resultados posibles! con incertidumbre en cuanto a cul de ellos tendr lugar.
Los resultados posibles de un experimento aleatorio se denominan resultados b"sicos! $
el conjunto de todos los resultados bsicos se llama espacio muestral.
Definicin.
Los resultados bsicos no pueden ocurrir simultneamente. %l experimento aleatorio
debe conducir necesariamente a la ocurrencia de uno de los resultados bsicos. &e
utili0ar & para denominar el espacio muestral.
Definicin.
Un suceso es un conjunto de resultados bsicos de un espacio muestral! $ se dice que
ocurre si el experimento aleatorio da lugar a uno de los resultados bsicos que lo
constitu$en.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Definicin.
&ean 1 $ L dos sucesos pertenecientes a un espacio muestral &. &u interseccin! que se
denomina 1 L! es el conjunto de todos los resultados bsicos en & que pertenecen a 1
$ a L. 7or tanto! la interseccin 1 L ocurre si $ solo si tanto 1 como L ocurren.
De manera ms general! dados E sucesos %

! %
"
! ...! %
E
! su interseccin %

%
"
...
%
E
! es el conjunto de todos los resultados bsicos que pertenecen a todo %
i
*i ( ! "! ...! E,.
Definicin.
&i los sucesos 1 $ L no tienen en com#n resultados bsicos! se denominan mutuamente
e!cluyentes $ su interseccin 1 L es el conunto vaco. De esto se deduce! entonces!
que 1 L no puede ocurrir.
De manera ms general! los E sucesos %

! %
"
! ...! %
E
se dice que son mutuamente
exclu$entes si todo par de estos sucesos s mutuamente exclu$ente! es decir! si %
i
%
j
es
el conjunto vaco para todo i j.
Definicin.
&ean 1 $ L los dos sucesos en el espacio muestral &. &u unin! denominada 1 L! es el
conjunto de todos los resultados bsicos en & que pertenecen al menos a uno de estos
dos sucesos. 7or tanto! la unin 1 L tiene lugar si $ slo si 1 $-o L ocurren.
De manera ms general! dados E sucesos %

! %
"
! ...! %
E
! su unin! %

%
"
... %
E
! es el
conjunto de todos los resultados bsicos pertenecientes al menos a uno de estos E
sucesos.
Definicin.
&ean %

! %
"
! ...! %
E
E sucesos en el espacio muestral &. &i %

%
"
... %
E
( &! estos E
sucesos se denominan colectivamente e!haustivos.
Definicin.
&ea 1 un suceso en el espacio muestral &. %l conjunto de resultados bsicos de un
experimento aleatorio perteneciente a & pero no a 1 se denomina el complementario de 1!
$ se representa por A
2eglas de probabilidad.
. &ean 1 $ L dos sucesos. %ntonces los sucesos 1 L $ A L son mutuamente
exclu$entes! $ su unin es L. Alaramente' *1 L, * A L, ( L
". &ean 1 $ L dos sucesos. Los sucesos 1 $ A L son mutuamente exclu$entes! $ su
unin es 1 L. De su observacin debe quedar claro que' 1 * A L, ( 1 L
C. &ean %

! %
"
! ...! %
E
E sucesos mutuamente exclu$entes $ colectivamente ex/austivos!
$ sea 1 otro suceso. %ntonces! los E sucesos %

1! %
"
1! ...! %
E
1 son
mutuamente exclu$entes $ su unin es 1.
-.u es la probabilidad/
%l concepto de probabilidad pretende aportar una medida numrica de la verosimilitud de
ocurrencia de un suceso.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
0recuencia relativa.
&upongamos que un experimento aleatoria puede ser replicado de tal manera que!
despus de una tentativa! es posible volver al estado inicial $ repetir el experimento de
modo que el resultado no se vea afectado por los resultados previos. &i se reali0a un
n#mero N de experimentos $ el suceso 1 ocurre N
1
veces *N
1
obviamente depende de N,!
tenemos que'
7roporcin de ocurrencias de 1 en N intentos ( N
1
-N
1/ora bien! si N es mu$ grande! esperaremos que la proporcin N
1
-N no experimente
gran variacin a medida que N aumenta! es decir! la proporcin de ocurrencias de 1
permanecer aproximadamente constante.
Definicin.
&ea N
1
el n#mero de ocurrencias de un suceso 1 en N repeticiones. %ntonces! siguiendo
el concepto de probabilidad de frecuencia relativa! la probabilidad de que 1 ocurra es el
lmite del cociente N
1
-N a medida que el n#mero de intentos N se /ace infinitamente
grande.
Probabilidad sub%etiva.
Una visin alternativa! que no depende de la nocin de experimentos repetibles!
considera la probabilidad como un concepto personal subjetivo que expresa un grado de
creencia individual sobre la posibilidad de que un suceso ocurra.
Las probabilidades subjetivas son personales3 no se requiere que diferentes individuos
consideren que el mismo suceso debe tener lugar con las mismas probabilidades.
La probabilidad y sus postulados.
Postulados probabilsticos.
. &i 1 es un suceso cualquiera en el espacio muestral &! o M 7*1, M
". &ea 1 un suceso en &! $ sean N
i
los resultados bsicos. %ntonces! 7*1, (

A
7*N
i
,!
donde la notacin indica que el sumatorio corresponde a todos los resultados bsicos
pertenecientes a 1.
C. 7*&, (
%l primer postulado exige que una probabilidad se encuentre entre 4 $ . el segundo
puede ser justificado en trminos de las frecuencias relativas. &upongamos que un
experimento aleatorio se repite N veces. &ea N
i
el n#mero de veces que el resultado
bsico N
i
ocurre $ N
1
el n#mero de veces que el suceso 1 ocurre. %ntonces! dado que los
resultados bsicos son mutuamente exclu$entes! N
1
es justamente la suma de N
i
correspondiente a todos los resultados bsicos en 1! es decir' N
1
(

A
N
i
! $ dividiendo
por el n#mero de repeticiones N! obtenemos' N
1
-N (

A
N
i
-N
7ero bajo el concepto de frecuencia relativa de probabilidad! N
1
-N tiende a 1! $ cada N
i
-N
tiende a 7*N
i
, a medida que N se /ace infinitamente grande. %l tercer postulado!
sustitu$endo 1 por el espacio muestral & en el segundo postulado tenemos que' 7*&, (

S
7*N
i
, donde el sumatorio se extiende a todos los resultados bsicos en el espacio
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
muestral. 7ero dado que 7*N, ( por el tercer postulado! se deduce que'

S
7*N
i
, (
%s decir! la suma de las probabilidades de todos los resultados bsicos en el espacio
muestral es .
Consecuencia de los postulados.
. &i el espacio muestral & est constituido por n resultados bsicos igualmente
probables! N

! N
"
! ...! N
n
! entonces cada una de ellos tiene una probabilidad -n! es
decir' 7*N

, ( -n *i ( ! "! ...! n,.


%s decir! si 7*N
i
, es igual para todo resultado bsico $
n
i
(

7*N
i
, ( ! entonces!
7*N
i
, ( -n para todo resultado.
". &i el espacio muestral & est constituido por n resultados bsicos igualmente
probables $ el suceso 1 est formado por n
1
de estos resultados! entonces! 7*1, ( n
1
-n
8odo resultado bsico tiene probabilidad -n $! 7*1, es justamente la suma de las
probabilidades *cada una es -n, de los n
1
resultados bsicos en 1.
C. &ean 1 $ L dos sucesos mutuamente exclu$entes. %ntonces la probabilidad de la
unin es la suma de las probabilidades individuales! es decir' 7*1L, ( 7*1, + 7*L,
De manera ms general! si %

! %
"
! ...! %
E
son sucesos mutuamente exclu$entes!
*%

%
"
...%
E
, ( 7*%

, + 7*%
"
, + ... + 7*%
E
,
La probabilidad de la unin de 1 $ L es 7*1L, (

B A
7*N
i
, donde el sumatorio se
extiende a todos los resultados bsicos en 1 L. 7ero dado que 1 $ L son
mutuamente exclu$entes! un resultado bsico no puede pertenecer a ambos sucesos!
por lo que el lado derec/o de la ecuacin puede ser dividido en dos partes'

B A
7*N
i
,
(

A
7*N
i
, +

B
7*N
i
, %l lado derec/o de esta ecuacin es 7*1, + 7*L,.
B. &i %

! %
"
! F! %
E
son sucesos mutuamente exclu$entes! la probabilidad de la unin es
7*%

%
"
...%
E
, (
Dado que los sucesos son colectivamente ex/austivos! su unin es la totalidad del
espacio muestral &! $ el resultado se deduce del tercer postulado.
Permutaciones y combinaciones.
%l n#mero de posibles ordenaciones de x objetos es' x*x 6 ,*x 6 ", ... *",*, ( xO
Definicin.
%l n#mero de permutaciones!
n
7
x
! de n objetos tomados de x en x es el n#mero de
posibles ordenaciones cuando x objetos /an de ser seleccionados de un total de n $
dispuestos en orden. %ste n#mero es
n
7
x
(
)! (
!
x n
n

Definicin.
%l n#mero de combinaciones!
n
A
x
! de n objetos tomados de x en x es el n#mero de
posibles elecciones que pueden ser /ec/as. %ste n#mero es'
n
A
x
(
)! ( !
!
x n x
n


Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Re!las de la probabilidad.
&ea 1 un suceso en el espacio muestral &. Dado que 1 $ su complementario A son
mutuamente exclu$entes! 7*1 A, ( 7*1, + 7* A, $! dado que 1 $ A son
colectivamente ex/austivos' 7*1 A, ( . De estas dos ecuaciones se deduce que 7*1,
+ 7* A, ( o 7* A, ( 6 7*1, de modo que la probabilidad de que un suceso no ocurra
es menos la probabilidad de que s ocurra.
&ean 1 $ L dos sucesos. &i 1 $ L son mutuamente exclu$entes! la probabilidad de la
unin es la suma de las probabilidades individuales. 7ara calcular la unin cuando los
sucesos no son mutuamente exclu$entes! sabemos que los sucesos *1 L, $ * A L,
son mutuamente exclu$entes! $ su unin es L. 7or tanto' 7*L, ( 7*1L, + 7* AL,
Los sucesos 1 $ * A L, tambin son mutuamente exclu$entes! $ su unin es 1 L! por
lo que
7*1L, ( 7*1, + 7* AL, Despejando 7* A L, e igualando obtenemos'
7*1 L, ( 7*1, + 7*L, 6 7*1 L,
2egla de la suma de probabilidades.
&ean 1 $ L dos sucesos. La probabilidad de la unin es' 7*1L, ( 7*1, + 7*L, 6 7*1L,
La regla implica que la probabilidad de la unin no es la suma de las probabilidades
individuales! a no ser que los sucesos sean mutuamente exclu$entes! es decir! a no ser
que la probabilidad de la interseccin sea cero.
La posibilidad de que cualquier suceso ocurra es probable que dependa de la ocurrencia
o no ocurrencia de otros sucesos.
Definicin.
&ean 1 $ L dos sucesos. La probabilidad condicional del suceso 1! dado el suceso L!
denominada 7*1-L,! se define como 7*1-L, (
) (
) (
B P
B A P
siempre que 7*L, : 4. De igual
modo! la probabilidad condicional de L dado 1 se define como 7*L-1, (
) (
) (
A P
B A P
siempre que 7*1, : 4.
%sta definicin puede ser explicada en trminos de frecuencias relativas. &upongamos
que un experimento aleatorio es repetido N veces! con N
L
ocurrencias del suceso L $ N
1L
ocurrencias de los sucesos 1 $ L conjuntamente. %ntonces! la proporcin de veces que 1
ocurre! cuando L /a ocurrido es N
1L
-N
L
$ se puede pensar en la probabilidad condicional
de 1 dado L como el lmite de la proporcin cuando el n#mero de rplicas del experimento
se /ace infinitamente grande. 7ero N
1L
-N
L
( *N
1L
-N, - *N
L
-N, $! a medida que N
aumenta! el numerador $ el denominador del lado derec/o de esta expresin tienden a
7*1L, $ 7*L,! respectivamente.
2egla del producto de probabilidades.
&ean 1 $ L dos sucesos. La probabilidad de la interseccin es' 7*1L, ( 7*1PL,.7*L,
8ambin' 7*1L, ( 7*LP1,.7*1,
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Definicin.
&ean 1 $ L dos sucesos. &e dice que estos sucesos son independientes
estadsticamente si $ slo si 7*1L, ( 7*1,.7*L,
&e deduce de la regla del producto que son conclusiones equivalentes'
7*1PL, ( 7*1, si 7*L, : 4
7*LP1, ( 7*L, si 7*1, : 4
De manera ms general! los sucesos %

! %
"
! ...! %
E
son independientes estadsticamente si
$ slo si 7*%

%
"
...%
E
, ( 7*%

,.7*%
"
,...7*%
E
,
&upongamos que creemos que la probabilidad de que un suceso 1 ocurra es 7*1,. &e
nos da a continuacin la informacin adicional de que el suceso L /a ocurrido. &i esto no
cambia mi opinin sobre la probabilidad de ocurrencia de 1! mi evaluacin de la
probabilidad condicional 7*1PL, ser igual a 7*1,.
Probabilidades bivariantes.
Un experimento aleatorio /a de llevarse a cabo! $ el inters se centra en dos grupos
distintos de sucesos. Los llamaremos 1

! 1
"
! ...! 1
/
$ L

! L
"
! ...! L
Q
. Los sucesos 1
i
son
mutuamente exclu$entes $ colectivamente ex/austivos! al igual que los sucesos L
j
. &in
embargo! cualquier suceso 1
i
puede ocurrir conjuntamente con cualquier sucesos L
j
! de
modo que las intersecciones 1
i
L
j
pueden tener lugar. %stas intersecciones son entonces
los resultados elementales del experimento. Dos conjuntos de sucesos! considerados
conjuntamente de esta manera! se denominan bivariantes $ sus probabilidades se llaman
probabilidades bivariantes. &i se pueden asignar probabilidades a todos los sucesos
1
i
L
j
! entonces! la totalidad de la estructura de probabilidad del experimento es conocida
$ las otras probabilidades de inters pueden ser deducidas.
Definicin.
%n el contexto de las probabilidades bivariantes! las probabilidades de la interseccin
7*1
i
L
j
, se denominan probabilidades conuntas. Las probabilidades de los sucesos
elementales! 7*1
i
, o 7*L
j
,! se denominan probabilidades marginales.
Dadas las probabilidades conjuntas! supongamos que necesitamos saber las
probabilidades marginales. Aonsideremos un caso donde el inters reside en el suceso
1
i
. 1/ora 1
i
es la unin de los sucesos mutuamente exclu$entes 1
i
L

! 1
i
L
"
! ...! 1
i
L
Q
.
7or tanto! por la regla de la suma para sucesos mutuamente exclu$entes! la probabilidad
del suceso 1
i
es la suma de las probabilidades de aquellas intersecciones que inclu$en 1
i
!
es decir'
7*1
i
, ( 7*1
i
L

, + 7*1
i
L
"
, + ... + 7*1
i
L
Q
,!
Definicin.
&ean 1 $ L dos atributos! cada uno de los cuales dividimos en categoras que dan lugar a
sucesos mutuamente exclu$ente $ colectivamente ex/austivos que denominamos!
respectivamente! 1

! 1
"
! ...! 1
/
$ L

! L
"
! ...! L
E
. &i todo suceso 1
i
es independiente de todo
suceso L
j
! se dice que los atributos 1 $ L son independientes.
l teorema de 1ayes.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
&ean 1 $ L dos sucesos con probabilidades 7*1, $ 7*L,! respectivamente. La regla del
producto de probabilidades dice que' 7*1L, ( 7*1PL,7*L, $ tambin 7*1L, ( 7*LP
1,7*1,.
Dado que el la0o i0quierdo de las ecuaciones es el mismo! lo mismo sucede con el lado
derec/o! por lo que' 7*LP1,7*1, ( 7*1PL,7*L, Despejando $ suponiendo que la
probabilidad 7*1, no es cero! deducimos el teorema de La$es.
%l teorema de La$es.
&ean 1 $ L dos sucesos. %ntonces' 7*LP1, (
) (
) ( ). | (
A P
B P B A P
&upongamos que una persona est interesada en el suceso L $ se forma una opinin
subjetiva de la probabilidad de que L ocurra3 en este contexto! la probabilidad 7*L, se
denomina probabilidad a priori. &i despus este individuo consigue informacin adicional!
puede provocar una modificacin de su juicio inicial. La probabilidad relevante
correspondiente a L es a/ora la probabilidad condicional de L dado 1! que se denota
probabilidad a posteriori. %l teorema de La$es es un mtodo que permite actuali0ar una
probabilidad a priori cuando se conoce la informacin adicional de que el suceso 1 /a
tenido lugar.
%xiste una expresin alternativa del teorema de La$es. &ean %

! %
"
! ...! %
Q
E sucesos
mutuamente exclu$entes $ colectivamente ex/austivos! $ sea 1 otro suceso cualquiera.
La probabilidad de %
i
dado 1 para alg#n i puede calcularse directamente! utili0ando el
teorema de La$es $ sustitu$endo L por %
i
. &in embargo! el denominador del lado
derec/o de la ecuacin puede expresarse en trminos de las probabilidades
condicionales de 1 dado %
j
$ las probabilidades de los %
j
. Los sucesos %

1! %
"
1! ...!
%
Q
1 son mutuamente exclu$entes $ que su unin es 1. &e deduce que la probabilidad
de 1 es 7*1, ( 7*%

1, + 7*%
"
1, + ... + 7*%
E
1,
1dems! la regla del producto de probabilidades nos dice que 7*%
j
1, ( 7*1P%
j
,7*%
j
, *j (
! "! ...! E, as que sustitu$endo en la ecuacin! tenemos que 7*1, ( 7*1P%

,7*%

, + 7*1P
%
"
,7*%
"
, + ... + 7*1P%
E
,7*%
E
,
Rinalmente! esta reexpresin del teorema de La$es se obtiene sustitu$endo L por %
i
$
7*1, en la primera ecuacin por el lado derec/o de la #ltima.
8eorema de La$es *expresin alternativa,.
&ean %

! %
"
! ... %
E
E sucesos mutuamente exclu$entes $ colectivamente ex/austivos! $
sea 1 otro suceso cualquiera. La probabilidad condicional de %
i
! dado 1 puede ser
expresada como'
7*%
i
P1, (
) ( ) | ( ... ) ( ) | ( ) ( ) | (
) ( ) | (
2 2 1 1
1 1
K K E P E A P E P E A P E P E A P
E P E A P
+ + +
La ventaja de esta reexpresin del teorema reside en el /ec/o de que las probabilidades
que inclu$e son en muc/as ocasiones aquellas de las que se dispone directamente.
2ariables aleatorias discretas y distribuciones de probabilidad.
2ariables aleatorias.
Definicin.
Una variable aleatoria es una variable que toma valores numricos determinados por el
resultado de un experimento aleatorio.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
%s importante distinguir entre una variable aleatoria $ los posibles valores que sta puede
tomar. Usaremos letras ma$#sculas! tales como S! para designar la variable aleatoria $ la
correspondiente min#scula x para designar un valor posible.
Definicin.
Una variable aleatoria es discreta si slo puede tomar una cantidad numerable de valores.
De la definicin se deduce que una variable aleatoria que slo puede tomar un n#mero
finito de variables es discreta. Tncluso si el n#mero de resultados posibles es infinito pero
numerable! la variable aleatoria es discreta.
Definicin.
Una variable aleatoria es continua si puede tomar todos los valores de un intervalo.
7ara las variables aleatorias continuas! no es posible asignar probabilidades a cada valor
concreto.
"istribuciones de probabilidad para variables aleatorias discretas.
&upongamos que S es una variable aleatoria discreta $ que x es uno de sus posibles
valores. La probabilidad de que la variable aleatoria S tome el valor x se representa 7*S (
x,. La distribucin de probabilidad de una variable aleatoria es una representacin de las
probabilidades de todos los resultados posibles.
Definicin.
La funcin de probabilidad! 7
x
*x,! de una variable aleatoria discreta S representa la
probabilidad de que S tome el valor x! como funcin de x. %s decir! 7
x
*x, ( 7*S ( x, donde
la funcin se eval#a en todos los posibles valores de x.
7ropiedades de las funciones de probabilidad de variables aleatorias discretas.
&ea S una variable aleatoria discreta con funcin de probabilidad 7
x
*x,. %ntonces!
. 7
x
*x, : 4 para cada valor x
". Las probabilidades individuales suman ! es decir'

x
7
x
*x, ( donde la notacin
indica la suma sobre todos los posibles valores de x.
La propiedad dice que las probabilidades no pueden ser negativas. La propiedad " se
obtiene como consecuencia del /ec/o de que los sucesos JS ( xK para todos los posibles
valores de x! son mutuamente exclu$entes $ conjuntamente ex/austivos. 7or tanto! las
probabilidades de estos sucesos deben sumar .
Definicin.
La funcin de probabilidad acumulada! R
x
*x
4
,! de una variable aleatoria S representa la
probabilidad de que S no tome un valor superior a x
4
! como funcin de x
4
. %s decir!
R
x
*x
4
, ( 7*S M x
4
, donde la funcin se eval#a en todos los valores de x
4
.
2elacin entre funcin de probabilidad $ funcin de probabilidad acumulada.
&ea S una variable aleatoria con funcin de probabilidad 7
x
*x, $ funcin de probabilidad
acumulada R
x
*x,. %ntonces! R
x
*x
4
, (

0 x x
7
x
*x, donde la notacin indica que la suma es
sobre todos los posibles valores de x que son menores o iguales que x
4
.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
7ropiedades de las funciones de probabilidad acumulada para variables aleatorias
discretas.
&ea S una variable aleatoria discreta con funcin de probabilidad acumulada R
x
*x
4
,.
%ntonces!
. 4 M R
x
*x
4
, M para cada n#mero x
4
". &i x
4
$ x

son dos n#meros tales que x


4
M x

! entonces! R
x
*x
4
, M R
x
*x

,
La propiedad establece que una probabilidad no puede ser menor que 4 ni ma$or que .
la propiedad " implica que la probabilidad de que una variable aleatoria est por debajo
de cierta cantidad no puede superar a la probabilidad de que est por debajo de una
cantidad ma$or.
speranzas de variables aleatorias discretas.
%l valor esperado es la correspondiente medida de centrali0acin de una variable
aleatoria.
Definicin.
%l valor esperado! %*S,! de una variable aleatoria S se define como %*S, (

x
x7
x
*x,
donde la notacin indica que la suma es sobre todos los posibles valores de x. %l valor
esperado de una variable aleatoria se conoce como su media $ se representa
x
.
La definicin de valor esperado puede /acerse en trminos de frecuencias relativas a
largo pla0o. &upongamos que un experimento aleatorio se repite N veces! $ que el
suceso JS ( xK ocurre en N
x
ocasiones. %l promedio de los valores que toma la variable
aleatoria sobre las N repeticiones ser entonces la suma de xN
x
-N sobre todos los
posibles valores de x. Auando el n#mero de repeticiones N tiende a infinito! el coeficiente
N
x
-N tiende a la probabilidad de ocurrencia del suceso JS ( xK! es decir! a 7
x
*x,. 7or tanto!
xN
x
-N tiende a x7
x
*x,. De este modo! el valor esperado puede entenderse como el valor
promedio que tomara una variable aleatoria sobre un n#mero grande de repeticiones.
La nocin de esperan0a no se restringe a la propia variable aleatoria! tambin puede
aplicarse a cualquier funcin de la misma.
Definicin.
&ea S una variable aleatoria discreta con funcin de probabilidad 7
x
*x,! $ sea g*S, una
funcin de S. %ntonces! el valor esperado! %*g*S,,! de esta funcin se define como
%)g*S,. (

x
g*S,7
x
*x,
La varian0a en un conjunto de observaciones numricas! es el promedio de las
diferencias al cuadrado entre las observaciones $ su media. Del mismo modo! para
definir la varian0a de una variable aleatoria! se constru$e un promedio ponderado de las
posibles diferencias con la media al cuadrado3 la ponderacin asociada a *x 5
x
,
"
es la
probabilidad de que la variable aleatoria tome el valor x. La varian0a puede verse como el
valor promedio que tomar la funcin *S 5
x
,
"
sobre un n#mero mu$ grande de
repeticiones del experimento.
Definicin.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
&ea S una variable aleatoria discreta. La esperan0a es la diferencia con la media al
cuadrado *S 5
x
,
"
se denomina varianza! se representa
"
x
! $ se obtiene como'

"
x
( %)*S 5 ,
"
. (

x
*x 5
x
,
"
7
x
*x,
La desviacin tpica!
x
! es la ra0 cuadrada positiva de la varian0a.
La equivalencia entre la frmula alternativa $ la definicin puede verificarse'
x
"
(

x
*x 5

x
,
"
7
x
*x, (

x
*x
"
5 "
x
x +
x
"
,7
x
*x, (

x
x
"
7
x
*x, 5 "
x
x
x7
x
*x, +
x
"

x
7
x
*x,
7ero /emos visto que

x
x7
x
*x, (
x
$

x
7
x
*x, ( ! luego
x
"
(

x
xU"
7
x
*x, 5 "
x
"
+

x
"
(

x
x
"
7
x
*x, 5
x
"
Varian0a de una variable aleatoria discreta *frmula alternativa,.
La varian0a de una variable aleatoria discreta S puede expresarse como

"
x
( %*S
"
, 5
x
"
(

x
x
"
7
x
*x, 5
x
"
Wemos definido la esperan0a de una funcin de una variable aleatoria S. La funcin lineal
a + bS! donde a $ b son constantes fijas! es de particular inters. &ea S una variable
aleatoria que toma el valor x con probabilidad 7
x
*x,! $ consideremos la nueva variable
aleatoria X! definida como X ( a + bS Auando la variable aleatoria S toma el valor x! X
debe tomar el valor a + bx.
?edia $ varian0a de una variable aleatoria X ( a + bS.
&ea S una variable aleatoria con media
x
$ varian0a
x
"
! $ sean a $ b dos constantes.
Definamos la variable aleatoria X ( a + bS. %ntonces! la media $ la varian0a de X son'
x
( %*a + bS, ( a + b
x
$
X
"
( var*a + bS, ( b
"

x
"
$! por tanto! la desviacin tpica de X es

X
( PbP
x
&i X toma valores a + bx con probabilidades 7
x
*x,! su media es' %*X, (
X
(

x
*a +
bx,7
x
*x, ( a

x
7
x
*x, + b

x
x7
x
*x, %ntonces! puesto que el primer sumatoria del lado
derec/o de la ecuacin vale $ el segundo sumatoria es! por definicin! la media de S!
tenemos' %*X, ( a + b
x
.
1dems! la varian0a de X es! por definicin!
X
"
( %)*X 5
X
,
"
. (

x
)*a + bx, 5
X
.
"
7
x
*x,
&ustitu$endo a + b
x
por
X
se obtiene'
X
"
(

x
*bx 5 b
x
,
"
7
x
*x, ( b
"

x
*x 5
x
,
"
7
x
*x,
2esultados.
. 8omando b ( 4! se obtiene que para cualquier constante a! %*a, ( a $ Var*a, ( 4
%s decir! si una variable aleatoria siempre toma el valor a! tendr media a $ varian0a 4.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
". 8omando a ( 4 en estas ecuaciones! tenemos! para cualquier constante b! %*bS, ( b
x
$ Var*bS, ( b
"

x
"
%s decir! si una variable aleatoria se multiplica por una constante! la media queda
multiplicada por la misma constante! $ la varian0a por el cuadrado de esa constante.
C. 8omando a (
x
-
x
! $ b ( -
x
! tenemos' X ( a + bS (
x
x X


luego
% *
x
x X


, ( 5
x
x

+
x
1

x
( 4
Var *
x
x X


, ( *-
x
"
,
x
"
(
%s decir! restndole a una variable aleatoria su media $ dividindola por su desviacin
tpica se obtiene una variable aleatoria con media 4 $ desviacin tpica .
"istribucin con%unta de variables aleatorias discretas.
Definicin.
&ean S e Y dos variables aleatorias discretas. &u funcin de probabilidad conunta
representa la probabilidad de que simultneamente S tome el valor de x e Y tomo el valor
$! como funcin de x e $. &e usa la notacin 7
x!$
*x! $,! de donde' 7
x!$
*x! $, ( 7*S ( x Y (
$,
%n general! si S

! S
"
! ...! S
E
son E variables aleatorias discretas! su funcin de probabilidad
conjunta es' 7
x!x"!...!xE
*x

! x
"
! ...! x
E
, ( 7*S

( x

S
"
( x
"
... S
E
( x
E
,
Definicin.
&ean S e Y dos variables aleatorias conjuntamente distribuidas. %n este contesto! la
funcin de probabilidad de la variable aleatoria S se denomina funcin de probabilidad
marginal! $ se obtiene sumando las probabilidades conjuntas sobre todos los posibles
valores de Y! es decir'
7
x
*x, (

y
7
x!$
*x! $,
1nlogamente! la funcin de probabilidad marginal de la variable aleatoria Y es'
7
$
*$, (

x
7
x!$
*x! $,
%n general! si S

! S
"
! ...! S
E
son variables aleatorias discretas conjuntamente distribuidas!
la funcin de probabilidad marginal de una de ellas se obtiene sumando las
probabilidades conjuntas sobre todos los posibles valores de las dems.
7ropiedades de las funciones de probabilidad conjunta de variables aleatorias discretas.
&ean S e Y variables aleatorias discretas con funcin de probabilidad conjunta 7
x!$
*x! $,.
%ntonces'
. 7
x!$
*x! $, : 4 para cualquier par de valores x e $.
". La suma de las probabilidades conjuntas 7
x!$
*x! $, sobre todos los posibles pares de
valores debe ser .
Definicin.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
&ean S e Y dos variables aleatorias discretas conjuntamente distribuidas. La funcin de
probabilidad condicional de la variable aleatoria Y! dado que la variable aleatoria S toma el
valor x! representa la probabilidad de que Y tomo el valor $! como funcin de $! cuando se
especifica el valor x para S. %sta funcin se representa 7
$Px
*$Px,! $ por la definicin de
probabilidad condicional' 7
$Px
*$Px, (
) (
) , ( ,
x P
y x P
x
y x
1nlogamente! la funcin de
probabilidad condicional de S! dado Y ( $! es' 7
$Px
*$Px, (
) (
) , ( ,
x P
y x P
x
y x

Definicin.
Las variables aleatorias S e Y son independientes si $ slo si su funcin de probabilidad
conjunta es el producto de sus funciones de probabilidad marginal! es decir! si $ slo si'
7
x!$
*x! $, ( 7
x
*x,7
$
*$, para todos los posibles valores x e $.
%n general! las E variables aleatorias S

! S
"
! ...! S
E
son independientes si $ slo si
7
x!x"!...!xE
*x

! x
"
! ...! x
E
, ( 7
x
*x

,7
x"
*x
"
, ... 7
xE
*x
E
,
De la definicin de funcin de probabilidad condicional! se deduce que si las variables
aleatorias S e Y son independientes! entonces! la funcin de probabilidad condicional de Y
dado S es igual que la funcin de probabilidad marginal de Y! es decir! 7
$Px
*$Px, ( 7
$
*$,
1nlogamente! se deduce que 7
xP$
*xP$, ( 7
x
*x,
Definicin.
La funcin de probabilidad conunta acumulada! R
x!$
*x
4
! $
4
,! de un par de variables
aleatorias discretas S e Y representa la probabilidad de que simultneamente S no
exceda del valor x
4
e Y no supere el valor $
4
! como funcin de x
4
e $
4
. %s decir! R
x!$
*x
4
! $
4
,
( 7*S M x
4
Y M $
4
, donde la funcin se eval#a en todos los valores x
4
e $
4
. %sto puede
escribirse R
x!$
*x
4
! $
4
, (

0 x x

0 y y
7
x!$
*x!$, donde la notacin indica que la suma es sobre
todos los pares de valores x e $ que las variables aleatorias pueden tomar
simultneamente! $ que satisfacen x M x
4
e $ M $
4
.
Definicin.
&ean S e Y dos variables aleatorias discretas con funcin de probabilidad conjunta 7
x!$
*x!
$,. La esperanza de una funcin g*S! Y, de estas variables aleatorias se define como
%)g*S! Y,. (

x

y
g*x! $,7
x!$
*x! $,
%n general! si las E variables aleatorias S

! S
"!
...! S
E
tienen funcin de distribucin
conjunta 7
x!x"!...!xE,
*x

! x
"
! ...! x
E
,! entonces! la esperan0a de la funcin g*S

! S
"
! ...! S
E
, es
%)g*S

! S
"
! ...! S
E
,. (

1 x

2 x
...

K x
g*x

! ...! x
E
,7
x!FxE
*x

! F! x
E
,
&upongamos que la variable aleatoria S tiene media
x
! e Y tiene media
$
! $
consideremos el producto *S 5
x
,*Y 5
$
,. &i los valores altos de S tienden a estar
asociados con valores altos de Y! $ valores bajos de S con valores bajos de Y! debemos
esperar que este producto sea positivo! $ para ma$or asociacin con valores bajos de Y! $
valores bajos de S con valores altos de Y! el valor esperado de este producto debe ser
negativo. Una esperan0a 4 para *S 5
x
,*Y 5
$
, implicar ausencia de relacin lineal entre
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
S e Y. %n consecuencia! usaremos el valor esperado de *S 5
x
,*Y 5
$
, como medida de
la relacin lineal en la poblacin.
Definicin.
&ea S una variable aleatoria con media
x
! $ sea Y una variable aleatoria con media
$
. %l
valor esperado de *S 5
x
,*Y 5
$
, se denomina covarianza entre S e Y! $ se representa
Aov*S! Y,. 7ara variables aleatorias discretas' Aov*S! Y, ( %)*S 5
x
,*Y 5
$
,. (

x

y
*x
5
x
,*$ 5
$
,7
x!$
*x! $,
Una expresin equivalente es' Aov*S! Y, ( %*SY, 5
x

$
(

x

y
x$7
x!$
*x! $, 5
x

$
Aovarian0a e independencia estadstica.
&i un par de variables aleatorias son estadsticamente independientes! la covarian0a entre
ellas es 4. sin embargo! el recproco no es necesariamente cierto.
&umas $ diferencias de variables aleatorias.
&ean S e Y un par de variables aleatorias con medias
x
$
$
$ varian0as
x
"
$
$
"
. &e
verifican las siguientes propiedades'
. %l valor esperado de su suma es la suma de sus valores esperados' %*S + Y, (
x
+
$
". %l valor esperado de su diferencia es la diferencia de sus valores esperados' %*S 6 Y,
(
x
5
$
C. &i la covarian0a entre S e Y es 4! la varian0a de su suma es la suma de sus varian0as'
Var*S + Y, (
x
"
+
$
"
B. &i la covarian0a entre S e Y es 4! la varian0a de su diferencia es la suma de sus
varian0as' Var*S 6 Y, (
x
"
+
$
"
&ean S

! S
"
! ...! S
E
E variables aleatorias con medias

!
"
! ...!
E
$ varian0a

"
!
"
"
! ...!

E
"
. &e verifican las siguientes propiedades'
>. %l valor esperado de su suma es' %*S

+ S
"
+ ... + S
E
, (

+
"
+ ... +
E
;. &i la covarian0a entre cada par de variables es 4! la varian0a de su suma es'
Var*S

+ S
"
+ ... + S
E
, (

"
+
"
"
+ ... +
E
"
Los resultados C! B $ ; requiere que las covarian0as entre las variables aleatorias sean 4.
en general! si Aov*S! Y, es la covarian0a entre las variables aleatorias S e Y! puede
probarse que' Var*S + Y, (
x
"
+
$
"
+ " Aov*S! Y, $ Var*S 6 Y, (
x
"
+
$
"
6 " Aov*S! Y,
La distribucin binominal.
&upongamos que un experimento aleatorio tiene slo dos resultados posibles que son
mutuamente exclu$entes $ colectivamente ex/austivos. &ea p la probabilidad de xito3 la
probabilidad de fracaso es! por tanto * 6 p,. La variable aleatoria S toma el valor si el
resultado del experimento es xito $ 4 en caso contrario. La funcin de probabilidad de
esta variable aleatoria es! entonces' 7
x
*4, ( * 6 p, 7
x
*, ( p
%sta distribucin se conoce como la distribucin de #ernoulli.
La media de una variable aleatoria Lernoulli es'
x
( %*S, (

x
x7
x
*x, ( *4,* 6 p, + *,*p,
( p
Y la varian0a'
x
"
( %)*S 5
x
,
"
. (

x
*x 5
x
,
"
7
x
*x, ( *4 6 p,
"
* 6 p, + * 6 p,
"
p ( p* 6 p,
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Aonsideremos el caso en el que un experimento aleatorio! con dos resultados posibles! se
repite varias veces. &upongamos que la probabilidad de xito en cada repeticin es p $
que se reali0an n ensa$os independientes! con lo que el resultado de un ensa$o no influ$e
en el resultado de cualquier otro. %l n#mero de xitos S en las n repeticiones puede ser
cualquier n#mero entero entre 4 $ n! $ estamos interesados en la probabilidad de obtener
exactamente S ( x xitos en n repeticiones.
%l resultado de las n repeticiones es una secuencia de n resultados! cada uno de los
cuales debe ser xito *&, o fracaso *R,. %n las x primeras repeticiones el resultado es
xito! mientras que en las restantes *n 6 x, es siempre fracaso. La probabilidad de xito
en cada repeticin es p! $ la probabilidad de fallo * 6 p,. 7uesto que las n repeticiones
son independientes! la probabilidad de cualquier secuencia de resultados es! por la regla
de multiplicacin de probabilidades! igual al producto de las probabilidades de los
resultados individuales. 7or tanto! la probabilidad de observar la secuencia de resultados
descrita es' pUpU...Up * 6 p,U* 6 p,U...U* 6 p, ( p
x
* 6 p,
n5x
7ero nuestro inters original no era determinar la probabilidad de ocurrencia de una
secuencia particular sino la probabilidad de obtener exactamente x xitos! sin tener en
cuenta el orden de los resultados. %xisten varias secuencias en las que pueden aparecer
x xitos intercalados entre *n 6 x, fracasos. De /ec/o! el n#mero de secuencias de este
tipo es precisamente el n#mero de combinaciones den elementos tomados de x en x!
puesto que podemos elegir x posiciones de un total de n en las que colocar los xitos.
7or tanto! el n#mero de secuencias que contienen x xitos en n repeticiones es
n
A
x
(
)! ( !
!
x n x
n

1dems! estas secuencias son mutuamente exclu$entes! puesto que no


pueden ocurrir dos de ellas simultneamente. Wemos visto que el suceso Jse obtienen x
xitos en n repeticionesK puede ocurrir de
n
A
x
maneras mutuamente exclu$entes! cada
una con probabilidad p
x
* 6 p,
n5x
. 7or tanto! por la regla de la adicin de probabilidades! la
probabilidad buscada es la suma de estas
n
A
x
probabilidades individuales! es decir' 7*x
+xitos en n repeticiones, (
)! ( !
!
x n x
n

p
x
* 6 p,
n5x
La distribucin binominal.
&upongamos que un experimento aleatorio tiene slo dos resultados posibles
mutuamente exclu$entes $ conjuntamente ex/austivos! JxitoK $ JfracasoK! $ que p es la
probabilidad de obtener xito en cada repeticin. &i se reali0an n repeticiones
independientes! la distribucin del n#mero de xitos! S! resultante se denomina
distribucin binomial. &u funcin de probabilidad es' 7
x
*x, (
)! ( !
!
x n x
n

p
x
* 6 p,
n 6
x
para x ( 4! ! "! ...! n
Aonsideremos n ensa$os independientes! cada uno con probabilidad de xito p! $ sea S
i
(
si el resultado del i5simo ensa$o es xito $ 4 si no. Las variables aleatorias S

! S
"
! ...!
S
n
son! entonces! n variables Lernoulli independientes! cada una con probabilidad de
xito p. 1dems! el n#mero total de xitos S es' S ( S

+ S
"
+ ... + S
n
Lo que significa que
la variable aleatoria binomial puede expresarse como suma de variables aleatorias
Lrenoull independientes.
7ara una variable Lernoulli'
%*S
i
, ( p $ Var*S
i
, ( p* 6 p, para i ( ! "! ...! n
7or tanto! para la distribucin binomial'
%*S, ( %*S

+ S
"
+ ... + S
n
, ( %*S

, + %*S
"
, + ... + %*S
n
, ( np
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Aomo las variables aleatorias Lernoulli son independientes! la covarian0a entre ellas es 4!
$'
Var*S, ( Var*S

+ S
"
+ ... + S
n
, ( Var*S

, + Var*S
"
, + ... + Var*S
n
, ( np* 6 p,
?edia $ varian0a de la distribucin binominal.
&ea S el n#mero de xitos en n repeticiones independientes! cada una con probabilidad
de xito p. %ntonces! S sigue una distribucin binominal con media'
x
( %*S, ( np
Y la varian0a'
x
"
( %)*S 5
x
,
"
( np* 6 p,
La distribucin #iper!eomtrica.
%n los casos en los que el n#mero de elementos de la muestra es una proporcin grande
del n#mero total de artculos en la poblacin! la distribucin binomial es inapropiada. La
ra0n es que en estas situaciones no /a$ independencia entre el resultado de un
elemento particular de la muestra $ los restantes. 7ara que la distribucin del n#mero de
xitos en n ensa$os sea binomial! es necesario que los resultados de stos sean
independientes. %ste no ser el caso si el muestreo se reali0a sobre una poblacin
peque@a de elementos.
&upongamos que un conjunto de N elementos! cada uno de los cuales puede etiquetarse
como JxitoK o JfracasoK! contiene & xitos $ *N 6 &, fracasos. &e elige una muestra
aleatoria de n elementos de este conjunto! $ buscamos la probabilidad de que la muestra
contenga x xitos. %n primer lugar! el n#mero total de posibles muestras de n elementos
que pueden elegirse de un total de N es el n#mero de combinaciones'
N
A
n
(
)! ( !
!
n N n
N

%l n#mero de posibles maneras de obtener x xitos en la muestra de un total de & xitos


es'
&
A
x
(
)! ( !
!
x S x
S

7uesto que la muestra contiene x xitos! tambin debe contener *n


6 x, fracasos! $ el n#mero de maneras de elegirlos entre un total de *N 6 &, fracasos es'
N5
&
A
n5x
(
)! ( )! (
)! (
x n S N x n
S N
+

%l n#mero total de muestras de n elementos que contienen


exactamente x xitos $ *n 6 x, fracasos es! por tanto'
&
A
x N5&
A
n5x
(
)! ( !
!
x S x
S
)! ( )! (
)! (
x n S N x n
S N
+

7or #ltimo! puesto que el n#mero de


posibles muestras es
N
A
n
! la probabilidad de obtener x xitos en la muestra es'
7*x xitos, (
n N
x n S N x S
C
C C .
(
)! ( !
!
)! ( )! (
)! (
)! ( !
!
n N n
N
x n S N x n
S N
x S x
S

La distribucin /ipergeomtrica.
&upongamos que se elige una muestra aleatoria de tama@o n de un conjunto de N
elementos. & de los cuales son xitos. La distribucin del n#mero de xitos! S! en la
muestra se denomina distribucin hipergeom$trica. &u funcin de probabilidad es'
7
x
*x, (
n N
x n S xN S
C
C C
(
)! ( !
!
)! ( )! (
)! (
)! ( !
!
n N n
N
x n S N x n
S N
x S x
S

donde x puede tomar valores


enteros entre el mximo de 4 $ )n 6 *N 6 &,. $ el mnimo de n $ &.
La media $ la varian0a de esta distribucin son'
x
( %*S, ( np
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
$
x
"
( %)*S 5
x
,
"
. (

1 N
n N
np* 6 p, donde p ( &-N es la proporcin de xitos en la
poblacin.
&i el tama@o muestral es mu$ peque@o en relacin al n#mero total de elementos! N! las
probabilidades /ipergeomtricas son mu$ parecidas a las binomiales! $ puede usarse la
distribucin binomial en lugar de la /ipergeomtrica. %n este caso! *N 6 n, - *N 6 , est
mu$ prximo a ! por lo que la varian0a de la distribucin /ipergeomtrica est prxima a
np* 6 p,! la varian0a de la distribucin binomial.
La distribucin de Poisson.
. 7ara cada intervalo de tiempo peque@o! representado mediante un peque@o segmento
entre 4 $ t del tiempo temporal! la probabilidad de que ocurra un suceso en ese
intervalo es aproximadamente proporcional a la amplitud del intervalo.
". La probabilidad de ocurrencia de dos o ms sucesos en un intervalo como el descrito
es despreciable en comparacin con la probabilidad de una ocurrencia.
C. Wa$ independencia entre el n#mero de ocurrencias en intervalos no solapados.
&i estas afirmaciones son ciertas! puede probarse que la probabilidad de x ocurrencias en
el intervalo de 4 a t es'
7*x ocurrencias, (
! x
e
x


donde es el n#mero medio de ocurrencias entre 4 $ t! $ e (
"!D<"< es la base de los logaritmos naturales.
La distribucin de 7oisson.
&e dice que la variable aleatoria S sigue una distribucin de Poisson si tiene funcin de
probabilidad' 7
x
*x, (
! x
e
x


7ara x ( 4! ! "! ... donde es cualquier n#mero tal que
: 4
La media de esta distribucin es'
x
( %*S, (
Y la varian0a'
x
"
( %)*S 5
x
,
"
. (
La forma de la funcin de probabilidad de 7oisson depende de la media . La distribucin
de 7oisson aparece de manera natural para representar el n#mero de ocurrencias de un
suceso en un perodo de tiempo. La distribucin de 7oisson puede usarse cuando el
n#mero de ensa$os es grande! pero! al mismo tiempo! la probabilidad de xito en p en
cada ensa$o es mu$ peque@a! con lo cual np tiene un tama@o moderado *la aproximacin
que presentamos aqu es! en general! satisfactoria si np M D,.
1proximacin 7oisson de la distribucin binomial.
&ea S el n#mero de xitos resultante de n ensa$os independientes! cada uno con
probabilidad de xito p. La distribucin del n#mero de xitos S es binomial con media np.
&in embargo! si el n#mero de ensa$os n es grande $ np tiene un tama@o moderado
*preferiblemente np M D,! esta distribucin puede aproximarse bien por la distribucin de
7oisson de media ( np. La funcin de probabilidad de la distribucin aproximada es
entonces'
7
x
*x, (
!
) (
x
np e
x np
7ara x ( 4! ! "! ...
2ariables aleatorias continuas y distribuciones de probabilidad.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
"istribuciones de probabilidad de variables aleatorias continuas.
Definicin.
La funcin de distribucin acumulada R
x
*x, de una variable aleatoria continua S expresa la
probabilidad de que S sea menor o igual que x! como funcin de x! es decir! R
x
*x, ( 7*S M
x,
La funcin de distribucin acumulada para esta variable aleatoria es'
4 si x M a
R
x
*x, ( x si a M x M b
si x : b
7robabilidades de intervalos $ funcin de distribucin acumulada.
&ea S una variable aleatoria continua con funcin de distribucin acumulada R
x
*x,! $ sean
a $ b dos posibles valores de S que verifican a M b. La probabilidad de que S est entre a
$ b es 7*a M S M b, ( R
x
*b, 6 R
x
*a,
La funcin de probabilidad de una variable aleatoria discreta! expresa la probabilidad de
que la variable tome un valor especfico. 7uede construirse una funcin anloga para
variables aleatorias continuas! llamada funcin de densidad.
Runcin de densidad.
&ea S una variable aleatoria continua! $ x un n#mero perteneciente al rango de posibles
valores de S. La funcin de densidad f
x
*x, de la variable S es una funcin que tiene las
siguientes propiedades'
. f
x
*x, : o para todo x
". &upongamos que dibujamos la funcin de densidad. &ean a $ b dos posibles valores
de la variable aleatoria S que verifican que a M b. %ntonces! la probabilidad de que S
est entre a $ b es el rea por debajo de la funcin de densidad entre los dos puntos.
La probabilidad de que una variable aleatoria est entre un par de valores es el rea bajo
la funcin de densidad entre los dos valores. %n primer lugar! teniendo en cuenta que la
variable aleatoria debe tomar alg#n valor! puede deducirse que el rea total por debajo de
la funcin de densidad es *este resultado es anlogo al requerimiento en variables
aleatorias discretas de que la suma de probabilidades individuales sea ,. %n segundo
lugar! sea R
x
*x
4
, la funcin de distribucin acumulada evaluada en x
4
! en otras palabras! la
probabilidad de que la variable aleatoria sea menor o igual que x
4
! es decir! R
x
*x
4
, ( 7*S M
x
4
, que es el rea debajo de la funcin de densidad a la i0quierda de x
4
.
Zreas bajo funciones de densidad continuas.
&i S es una variable aleatoria continua con funcin de densidad f
x
*x, $ funcin de
distribucin acumulada R
x
*x,! entonces'
. %l rea total bajo la curva f
x
*x, es .
". %l rea bajo la curva f
x
*x, a la i0quierda de x
4
es R
x
*x
4
,! donde x
4
es cualquier valor
posible de la variables aleatoria.
Rormalmente! utili0ando notacin integral'


f
x
*x,dx (
La funcin de distribucin es! pues! la integral' R
x
*x
4
, (


0 x
f
x
*x,dx
7or tanto! la funcin de densidad es la derivada de la funcin de distribucin! es decir'
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
f
x
*x, (
dx
x dFx ) (
speranzas de variables aleatorias continuas.
%speran0a de una variable aleatoria continua.
&upongamos que el resultado de un experimento aleatorio puede ser representado
mediante una variable aleatoria continua. &i tenemos N rplicas independientes de este
experimento! entonces! el valor esperado de la variable aleatoria es la media de los
valores obtenidos! cuando el n#mero de rplicas! N! tiende a infinito. Denominaremos el
valor esperado de la variable aleatoria S como %*S,.
1nlogamente! si g*S, es una funcin de la variable aleatoria S! entonces el valor
esperado de esta funcin es la media de los valores obtenidos en sucesivas rplicas
independientes! cuando el n#mero de replicas tiende a infinito. Denominaremos el valor
esperado de g*S, como %)g*S,..
De manera formal! utili0ando notacin integral! expresaremos el valor esperado de S
como'
%*S, (


x.f
x
*x,dx
Y el valor esperado de la funcin g*S, como' %)g*S,. (


g*x,f
x
*x,dx
Definiciones.
&ea S una variable aleatoria continua'
. La media de S! representada por
x
! se define como el valor esperado de S! es decir!

x
( %*S,.
". La varianza de S! representada por
x
"
! se define como la esperan0a del cuadrado de
la diferencia entre la variable $ su media! *S 5
x
,
"
! es decir!
x
"
( %)*S 5
x
,
"
. Una
expresin alternativa para la varian0a es
x
"
( %*S
"
, 5
x
"
.
C. La desviacin tpica de S!
x
! es la ra0 cuadrada de la varian0a.
&ea S una variable aleatoria continua con media
x
$ varian0a
x
"
! sean a $ b constantes
cualesquiera. Definimos la variable aleatoria X como X ( a + bS
%ntonces la media $ varian0a de X son

0
( %*a + bS, ( a + b
x

0
"
( Var*a + bS, ( b
"

x
"

0
( PbP
x
Aomo caso particular de estos resultados! la variable aleatoria X (
x
x X


tiene media 4 $
varian0a .
"istribucin con%unta de variables aleatorias continuas.
Definiciones.
&ean S

! S
"
! ...! S
E
variables aleatorias continuas.
. &u funcin de distribucin acumulada conunta R
x! x"! ...! xQ
*x

! x
"
! ...! x
E
, ( 7*S

M x



S
"
M x
"
... S
E
M x
E
,
". Las funciones de distribucin acumulada R
x
*x

,! R
x"
*x
"
,! ...! R
xQ
*x
E
, de las variables
individuales se llaman funciones de distribucin marginal. 7ara cualquier i! se tiene
que R
xi
*x
i
, es la probabilidad de que S
i
sea menor o igual que x
i
.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
C. &e dice que las variables aleatorias son independientes si $ solo si R
x! x"! ...! xQ
*x

! x
"
! ...!
x
E
, ( R
x
*x

,R
x"
*x
"
, ... R
xQ
*x
E
,
%l concepto de independencia estadstica! en este caso! es exactamente igual que en el
caso discreto. La independencia de un conjunto de variables aleatorias implica que la
distribucin de probabilidad de cada una de ellas no se ve afectada por los valores que
tomen las dems.
La covarian0a se utili0a para cuantificar la asociacin lineal entre un par de variables
aleatorias.
Definicin.
&ean S e Y dos variables aleatorias continuas! con medias
x
$
$
! respectivamente. %l
valor esperado de *S 5
x
,*Y 5
$
, se llama covarianza entre S e Y. %s decir!
Aov*S! Y, ( %)*S 5
x
,*Y 5
$
,.
Una expresin alternativa es Aov*S! Y, ( %*SY, 5
x

$
&i las variables aleatorias S e Y son independientes! entonces su covarian0a es 4. no
obstante! el recproco no es necesariamente cierto.
&umas $ diferencias de variables aleatorias.
&ean S

! S
"
! ...! S
E
E variables aleatorias con medias

!
"
! ...!
x
$ varian0as

"
!
"
"
! ...!

E
"
. &e cumplen las siguientes propiedades'
. La media de la suma es la suma de las medias! es decir! %*S

+ S
"
+ ... + S
E
, (

+
"
+ ... +
E
". &i la covarian0a entre cada par de estas variables aleatorias es 4! entonces! la
varian0a de la suma es la suma de las varian0as! es decir! Var*S

+ S
"
+ ... + S
E
, (

"
+
"
"
+ ... +
E
"
&ean S e Y un par de variables aleatorias con medias
x
$
$
$ varian0as
x
"
$
$
"
. &e
cumplen las siguientes propiedades'
C. La media de su diferencia es la diferencia de las medias! es decir! %*S 6 Y, (
x
5
$
B. &i la covarian0a entre S e Y es 4! entonces! la varian0a de la diferencia es la suma de
las varian0as! es decir! Var*S 6 Y, (
x
"
+
$
"
Los resultados " $ B son vlidos #nicamente si la covarian0a entre las variables es 4. de
forma general! si S e Y son un par de variables aleatorias con varian0as
x
"
$
$
"
! $
covarian0a Aov*S! Y,! puede probarse que'
Var*S + Y, (
x
"
+
$
"
+ "Aov*S! Y,
Var*S 6 Y, (
x
"
+
$
"
6 Aov*A! Y,
La distribucin normal.
La distribucin normal tiene un pico en la media $ va descendiendo gradualmente en los
extremos.
Runcin de densidad de una distribucin normal.
&i la variable aleatoria S tiene densidad f
x
*x, ( *- "
"
,. e
5*x5," - ""
para 5 M x M
donde $
"
son n#meros tales que 5 M M $ 4 M
"
M donde e $ son las
constantes! e ( "!D<"<... $ ( C!B>=...! entonces se dice que S sigue una distribucin
normal.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
7ropiedades de la distribucin normal.
&upongamos que la variable aleatoria S sigue una distribucin normal con parmetros $

"
. se cumplen las siguientes propiedades'
. La media de la variable aleatoria es ! es decir! %*S, ( .
". La varian0a de la variable aleatoria es
"
! es decir! Var*S, ( %)*S 5 ,
"
. (
"
C. La forma de la funcin de densidad es una curva simtrica con forma de campana
centrada en la media .
De estas propiedades puede concluirse que dadas la media $ la varian0a de una variable
aleatoria normal! queda determinada la distribucin especfica dentro de la familia de
distribuciones normales.
Notacin.
&i la variable aleatoria S sigue una distribucin normal con media $ varian0a
"
!
escribiremos S N*!
"
,
Tncrementar la media! dejando constante la varian0a! traslada la funcin de densidad pero
n4 altera su forma. Las funciones con variables aleatorias normales con media com#n
pero diferentes varian0as son simtricas alrededor de la media com#n! pero la que tiene
ma$or varian0a es ms dispersa.
Runcin de distribucin acumulada de una distribucin normal.
&upongamos que S es una variable aleatoria normal con media $ varian0a
"
! es decir!
S N*!
"
,. %ntonces! la funcin de distribucin acumulada R
x
*x
4
, es R
x
*x
4
, ( 7*S M x
4
,
%sto corresponde al rea bajo la funcin de densidad a la i0quierda de x
4
. como ocurre
para cualquier densidad propia! el rea total por debajo de la curva es ! es decir! R
x
*, (

No /a$ una expresin algebraica simple para calcular la funcin de distribucin


acumulada de una variable aleatoria distribuida normalmente.
7robabilidades de rangos para variables aleatorias normales.
&ea S una variable aleatoria normal con funcin de distribucin acumulada R
x
*x,! $ sean a
$ b dos posibles valores de S! que verifican que a M b. %ntonces! 7*a M S M b, ( R
x
*b, 6
R
x
*a,
La probabilidad es el rea por debajo de la funcin de densidad correspondiente entre a $
b.
Las probabilidades de cual%uier distribucin normal pueden expresarse en trminos de las
probabilidades de una normal determinada! para la cual $a se /an calculado $ tabulado
las propiedades.
La distribucin normal estndar.
&ea X una variable aleatoria normal con media 4 $ varian0a 3 es decir X N*4! ,
%ntonces! se dice que X sigue una distribucin normal est"ndar.
&i denominados R
0
*0, a la funcin de distribucin acumulada de esta variable aleatoria! $
aU $ bU son dos n#meros tales que aU M bU! entonces 7*aU M X M bU, ( R
0
*bU, 6 R
0
*aU,
&ea 0
4
un n#mero positivo cualquiera! $ supongamos que se quiere calcular R
0
*50
4
, ( 7*X
M 50
4
, La simetra de la funcin de densidad de la variable aleatoria normal estndar
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
alrededor del 4! implica que el rea por debajo de la curva a la i0quierda de 60
4
es la
misma que el rea por debajo de la curva a la derec/a de 0
4
! es decir 7*X M 50
4
, ( 7*X :
0
4
,
%s ms! por ser el rea total por debajo de la curva igual a ! 7*X : 0
4
, ( 6 7*X M 0
4
, (
6 R
0
*0
4
,
7or tanto! puede deducirse que R
0
*50
4
, ( 6 R
0
*0
4
,
&ea S una variable aleatoria normal con media $ varian0a
"
. restando la media $
dividendo por la desviacin tpica se obtiene una variable aleatoria X con media 4 $
varian0a . 8ambin puede probarse que si S es una variable normal! entonces! X
tambin lo es. 7or tanto! X se distribu$e como una variable aleatoria normal estndar.
&upongamos! entonces! que queremos calcular la probabilidad de que S est entre a $ b.
%sto es equivalente a decir que *S 5 ,- est entre *a 5 ,- $ *b 5 ,-! luego la
probabilidad que se quiere es'
7*a M S M b, ( 7


< <

b
Z
a
(R
0

b
5 R
0

a
Amo /allar probabilidades de intervalos para variables aleatorias normales.
&ea S una variable aleatoria normal con media $ varian0a
"
. %ntonces! la variable
aleatoria X ( *S 5 ,- tiene una distribucin normal estndar3 es decir! X N*4! ,.
De aqu se deduce que si a $ b son n#meros cualesquiera con a M b! entonces'
7*a M S M b, ( 7


< <

b
Z
a
(R
0

b
5 R
0

a
donde X es la variable
aleatoria normal estndar $ R
0
*0, representa su funcin de distribucin acumulada.
l teorema central del lmite.
&ean S

! S
"
! ...! S
n
! n variables aleatorias independientes con idntica distribucin de
media $ varian0a
"
. representaremos su suma por S ( S

+ S
"
+ ... + S
n
La media de una suma es la suma de las medias $ que! para variables aleatorias
independientes! la varian0a de la suma es la suma de las varian0as. 7or tanto! la media $
la varian0a de S son %*S, ( n $ Var*S, ( n
"
1dems! para cualquier variable aleatoria! al restar la media $ dividir por la desviacin
tpica! se obtiene una variable aleatoria de media 4 $ varian0a ! as que la variable
aleatoria X (
) (
) (
X Var
X E X
( *S 5 n, - * n
"
, tiene media 4 $ varian0a . Dividiendo el
numerador $ el denominador de esta expresin por n se obtiene X (
n
n X


donde
n
X
n
X X X
X
n
=
+ + +
=
... 2 1
es el promedio de las S
La informacin crucial que proporciona el teorema central del lmite! es que! sea cual sea
la distribucin de las S
i
*suponiendo que la varian0a
"
sea finita,! cuando el n#mero de
trminos de la suma! n! es grande! la distribucin de X tiende a una distribucin normal
estndar.
8eorema central del lmite.
&ean S

! S
"
! ...! S
n
! n variables aleatorias independientes $ con idntica distribucin de
media $ varian0a
"
. &ean S $ X la suma $ el promedio de estas variables aleatoria!
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
respectivamente. Auando n se /ace grande! la distribucin de X ( *S 5 n, - * n
"
, (
n
n X


tiende a la normal estndar.
%l teorema central del lmite afirma que cualquiera que sea la distribucin com#n de un
conjunto de variables aleatorias! suponiendo que su varian0a sea finita! la suma o el
promedio de un n#mero moderadamente grande de ellas ser una variable aleatoria con
distribucin parecida a la normal.
La distribucin uniforme es simtrica alrededor de la media. &in embargo! el teorema
central del lmite puede aplicarse tambin a variables asimtricas3 $ a su ve0 se extiende
tambin a variables aleatorias discretas.
La distribucin normal como una apro+imacin a las distribuciones binomial y de
Poisson.
&pro+imacin normal a la distribucin binomial.
&i se llevan a cabo n intentos! cada uno con probabilidad p de xito! entonces el n#mero
S de xitos conseguidos tiene una distribucin binomial con media %*S, ( np $ varian0a
Var*S, ( np* 6 p,
La variable aleatoria S poda escribirse como la suma de n variables aleatorias Lernoulli
independientes! es decir! S ( S

+ S
"
+ ... + S
n
donde la variable aleatoria S
i
toma el valor
si el resultado del intento i5simo es JxitoK $ 4 en otro caso! con probabilidades p $ * 6
p,! respectivamente.
&e deduce por tanto! que si el n#mero de intentos n es grande! la distribucin de la
variable X (
) 1 ( ) (
) (
p np
np X
X Var
X E X

es aproximadamente una normal estndar.


&upongamos que queremos calcular que el n#mero de xitos est dentro de un intervalo
dado! a $ b. 8enemos entonces que 7*a M S M b, ( 7

) 1 ( ) 1 ( ) 1 ( p np
np b
p np
np X
p np
np a
( ( 7

) 1 ( ) 1 ( p np
np b
Z
p np
np a
&i el n#mero de intentos es grande! la distribucin de X puede aproximarse mediante la
normal estndar. &i el n#mero de intentos n es de tama@o moderado! entonces puede
conseguirse una mejora a esta aproximacin. %stamos aproximando una distribucin
discreta mediante una distribucin continua. ?ientras que la binomial puede tomar
solamente valores enteros! la variable aleatoria normal est definida en un continuo. 7ara
permitir esta distincin se aplica la correccin de continuidad a la frmula anterior!
reempla0ando a $ b por *a 6 4!>, $ *b + 4!>,! respectivamente. 8enemos entonces' 7*a M
S M b, ( 7


) 1 (
5 , 0
) 1 (
5 , 0
p np
np b
Z
p np
np a
1proximacin de probabilidades binomiales usando la distribucin normal.
&ea S el n#mero de xitos que resultan de n intentos independientes! cada uno con
probabilidad de xito p. &i n es grande $ p no es ni demasiado grande ni demasiado
peque@o! entonces! la siguiente es una buena aproximacin 7*a M S M b, ( 7

) 1 ( ) 1 ( p np
np b
Z
p np
np a
o usando la correccin de continuidad! 7*a M S M b, ( 7


) 1 (
5 , 0
) 1 (
5 , 0
p np
np b
Z
p np
np a
donde X es una distribucin normal estndar.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
La aproximacin simple es generalmente suficiente si n : >4. La calidad de aproximacin
depende tambin de p $ es bastante fiable si np* 6 p, : =.
&pro+imacin normal a la distribucin de Poisson.
&ea la variable aleatoria S el n#mero de veces que ocurre un suceso en determinado
intervalo de tiempo! $ sea el n#mero esperado de ocurrencias en dic/o intervalo.
%ntonces S sigue una distribucin de 7oisson! con media %*S, ( $ varian0a Var*S, ( .
Aonsidrese la situacin en la que el n#mero de ocurrencias esperadas! ! es grande.
&upongamos que el intervalo de tiempo se divide en subintervalos de idntica longitud.
%ntonces el n#mero total de ocurrencias es la suma de las ocurrencias en cada
subintervalo. 7or tanto! vemos que cuando la media de la distribucin de 7oisson es
grande! el n#mero total de ocurrencias puede verse como la suma de un n#mero
moderadamente grande de variables aleatorias! cada una de las cuales representa el
n#mero de ocurrencias en un subintervalo del perodo de tiempo. %ntonces! invocando el
teorema central del lmite! se deduce que cuando es grande! la distribucin de la
variable aleatoria X (


=
X
X Var
X E X
) (
) (
es aproximadamente una normal estndar.
Una ve0 ms! si es de tama@o moderado! ser conveniente aplicar una correccin de
continuidad.
1proximacin de probabilidades de 7oisson usando la distribucin normal.
&ea S una variable aleatoria de 7oisson con media . &i es grande! entonces! la
siguiente es una buena aproximacin 7*a M S M b, ( 7

b
Z
a
o usando la
correccin de continuidad! 7*a M S M b, ( 7

5 , 0 5 , 0 b
Z
a
donde X tiene una
distribucin normal estndar.
La distribucin e+ponencial.
La distribucin exponencial difiere de la normal en dos caractersticas bsicas' se
restringe a variables aleatorias que pueden tomar valores positivos #nicamente! $ su
funcin de densidad no es simtrica alrededor de la media.
La distribucin exponencial.
&i la variable aleatoria S no puede tomar valores negativos $ tiene funcin de densidad
f
x
*x, ( *e
5x-
,- para x : 4! donde es cualquier n#mero positivo $ e ( "!D<"<...!
entonces se dice que S sigue una distribucin e!ponencial.
La funcin de distribucin acumulada es R
x
*x, ( 6 e
5x-
para x : 4
La distribucin tiene media $ varian0a
"
.
$uestreo y distribuciones muestrales.
Llamaremos poblacin al grupo grande del que deseamos obtener informacin $ muestra
al subconjunto de individuos de la poblacin cu$as caractersticas /an sido observadas.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
La principal ra0n para observar una muestra en lugar de la poblacin completa es el
/ec/o de que la recogida de toda la informacin ser! en la ma$ora de las ocasiones!
exageradamente cara.
%l objetivo de extrae una muestra de una poblacin ser! en general! poder /acer
afirmaciones que tengan cierta valide0 sobre la aplicacin completa. 7or tanto! es
importante que la muestra sea representativa de la poblacin3 por eso es importante que
el proceso de seleccin de la muestra est basado en el principio de aleatori0acin.
?uestro aleatorio simple.
&upongamos que se /a de seleccionar una muestra de n objetos de una poblacin de N
objetos. Un procedimiento de muestreo aleatorio simple es aquel en el que todas las
posibles muestras de n objetos tienen la misma probabilidad de ser escogidas. %ste
mtodo se usa con tanta frecuencia que! en muc/os casos! el adjetivo simple se elimina!
$ a las muestras obtenidas por procedimientos de este tipo se las denomina muestras
aleatorias.
%n la prctica! pueden usarse tablas de n#meros aleatorios! bolilleros u ordenadores.
%l principio de aleatori0acin en la seleccin de los miembros de la muestra proporciona
cierta proteccin contra la presencia en la muestra de individuos no representativos de la
poblacin! en el sentido de que! en media! si se extraen repetidas muestras de la
poblacin seg#n este mecanismo! ning#n subgrupo particular debera estar ms
representado en la muestra. 1dems! el concepto de distribucin muestral nos permite
determinar la probabilidad de que la muestra particular que se /a obtenido no sea
representativa en un determinado grado.
&obre la base de la informacin muestral! nuestro objetivo ser /acer inferencias acerca
de la poblacin de la que procede la muestra. La distribucin de probabilidades de los
posibles resultados muestrales proporciona una base para reali0ar inferencias sobre la
poblacin.
%stadsticos $ distribuciones muestrales.
&upongamos que se /a extrado una muestra aleatoria de una poblacin $ que se desea
/acer inferencia sobre ciertas caractersticas de la distribucin de la poblacin. %sta
inferencia estar basada en alg#n estadstico! es decir! en alguna funcin particular de la
informacin muestral. La distribucin muestral! o distribucin en el muestreo! de este
estadstico es la distribucin de probabilidades de los valores que puede tomar el
estadstico a lo largo de todas las posibles muestras con el mismo n#mero de
observaciones que pueden ser extradas de la poblacin.
"istribucin en el muestreo de la media muestral.
[ueremos anali0ar la distribucin muestral de la variable aleatoria X . %n primer lugar!
determinaremos la media de esta distribucin. 7ara variables aleatorias discretas $
continuas! la esperan0a de una suma es la suma de las esperan0as $! por tanto' %*

=
n
i 1
S
i
,
( %*S

, + %*S
"
, + ... + %*S
n
, 7uesto que cada variable aleatoria S
i
tiene media
x
!
podemos escribir %*

=
n
i 1
S
i
, ( n
x
La media muestral es la suma de los valores de la
muestra multiplicada por -n! $! por tanto! su valor esperado ser' %* X , ( %*
n
1

=
n
i 1
S
i
, (
n
1
%*

=
n
i 1
S
i
, (
n
n x
(
x
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
La media de la distribucin en el muestreo de la media muestral es la media poblacional.
%sto nos asegura que! si se extraen repetidas muestras independientes de n
observaciones de una poblacin! entonces! cuando el n#mero de muestras se /ace mu$
grande! el promedio de las medias muestrales se /ace mu$ prximo a la verdadera media
poblacional. 7or supuesto! la media obtenida para una muestra particular puede ser
muc/o ma$or o muc/o menor que la media poblacional. &in embargo! en la media! no
/a$ ra0ones para esperar un valor que sea ma$or o menor que el valor poblacional.
&i el tama@o de la poblacin es mu$ grande con respecto al tama@o muestral! entonces!
una consecuencia del muestreo aleatorio simple es que la distribucin de cada uno de los
valores de la muestra es independiente de la de los otros. %n tal caso! la varian0a de la
suma es la suma de las varian0as $! por tanto! tendremos' Var*

=
n
i 1
S
i
, ( Var*S

, + Var*S
"
,
+ ... + Var*S
n
, 7uesto que cada S
i
tiene varian0a
x
"
! se sigue que Var*

=
n
i 1
S
i
, ( n
x
"
Llegamos as a que la varian0a de la media muestral es Var* X , ( Var *
n
1

=
n
i 1
S
i
, ( -n
"
Var*

=
n
i 1
S
i
, ( n
x
"
-n
"
(
x
"
-n
La varian0a de la distribucin muestral de X decrece a medida que aumenta el tama@o
muestral de n. Auantas ms observaciones tenga la muestra! ms concentrada estar la
distribucin muestral de la media muestral alrededor de la media poblacional.
2epresentaremos por
x
"
la varian0a de la media muestral3 la correspondiente desviacin
tpica! que recibe el nombre de error est"ndar de X ! vendr dada por' x (
n
x
&i el n#mero n de miembros de la muestra no es una fraccin mu$ peque@a del n#mero N
de miembros de la poblacin! no podremos asumir que los valores individuales de la
muestra se distribu$an independientemente unos de otros. %n este caso! Var* X , (
*
x
"
-n,.
1

N
n N
1l trmino *N 6 n,-*N 6 , se le suele dar el nombre de factor de correccin
por poblacin finita.
&e puede probar que! si la poblacin de la que se extrajo la muestra es normal! la media
muestral sigue una distribucin normal. &i el tama@o muestral es una proporcin peque@a
del tama@o poblacional! entonces! restando la media $ dividiendo por el error estndar! se
obtiene una variable aleatoria' X (
n
X X
x
x
x
x

%l teorema central del lmite nos asegura que! incluso cuando la distribucin de la
poblacin no es normal! si el tama@o muestral n es suficientemente grande! la distribucin
de X ser tambin mu$ prxima a la normal estndar.
Distribucin muestral de X .
&ea X la media de una muestra aleatoria den observaciones extradas de una poblacin
con media
x
$ varian0a
x
"
. %ntonces'
. La distribucin muestral de X tiene media
x
! es decir! %* X , (
x
". La distribucin muestral de X tiene desviacin tpica
x
(
n
x
%sta cantidad recibe el
nombre de error est"ndar de X .
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
C. &i el tama@o muestral n no es una fraccin peque@a del tama@o poblacional N!
entonces! el error estndar de X es
x
(
1

N
n N
n
x
B. &i la distribucin de la poblacin es normal! entonces! la variable aleatoria X (
x
x X


sigue una distribucin normal estndar.
>. &i la distribucin de la poblacin no es normal pero el tama@o muestral n es
suficientemente grande! entonces! del teorema central del lmite se sigue que! el
resultado del apartado B es aproximadamente vlido.
"istribucin en el muestreo de una proporcin muestral.
&i se repite n veces un experimento que tiene probabilidad de xito p! entonces! la
variable aleatoria S! que recoge el n#mero total de xitos en las n repeticiones! sigue una
distribucin binomial.
Definicin.
&ea S el n#mero de xitos en una muestra binomial de n observaciones! donde la
probabilidad de xito es p. *%n la ma$ora de las aplicaciones! el parmetro p ser la
proporcin de individuos de una gran poblacin que posean la caracterstica de inters,.
%ntonces! la proporcin de xitos en la muestra \p
x
( S-n recibe el nombre de proporcin
muestral.
La media $ la varian0a de la distribucin muestral de la proporcin muestral pueden
deducirse fcilmente a partir de la media $ la varian0a del n#mero de xitos que! vienen
dadas por %*S, ( np $ Var*S, ( np* 6 p,
De aqu se deduce que %*\p
x
, ( %*S-n, ( -n %*S, ( p %s decir! la media de la proporcin
muestral es la proporcin p de xitos en la poblacin. &u varian0a es Var*\p
x
, ( Var*S-n,
( -n
"
Var*S, (
n
p p ) 1 (
De nuevo! la desviacin tpica de la proporcin muestral! que
es la ra0 cuadrada de su varian0a recibe el nombre de error est"ndar.
&i el n#mero N de individuos en la poblacin no es demasiado grande comparado con el
n#mero de individuos de la muestra! en la expresin de la varian0a de la proporcin
muestral ser necesaria una correccin por poblacin finita. La varian0a ser entonces
Var*\p
x
, (
n
p p ) 1 (
1

N
n N
Aomo una consecuencia del teorema central del lmite! la distribucin del n#mero de
xitos es aproximadamente normal para tama@os muestrales grandes. %sto mismo es
tambin cierto para la proporcin de xitos. 7or tanto! si restamos a la proporcin
muestral su media p $ la dividimos por su error estndar! obtendremos una variable
aleatoria con distribucin normal estndar.
Distribucin en el muestreo de una proporcin muestral.
&ea \p
x
la proporcin de xitos en una muestra aleatoria de n observaciones. %ntonces'
. La distribucin muestral de \p
x
tiene media p! es decir %*\p
x
, ( p
". La distribucin muestral de \p
x
tiene desviacin tpica
\p
(
n
p p ) 1 (
La cantidad
\p
recibe el nombre de error estndar de \p
x
.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
C. &i el n#mero n de individuos de la muestra no es una proporcin peque@a del n#mero
N de individuos de la poblacin! entonces! el error estndar de \p
x
es
\p
(
1
) 1 (


N
n N
n
p p
B. &i el tama@o muestral es grande! entonces! la variable aleatoria X (
p
x p p
^
^

se
distribu$e aproximadamente como una normal estndar.
%n general! la aproximacin es satisfactoria para muestras de >4 observaciones o ms.
La calidad de la aproximacin depender tambin de p3 lo idea es que se verifique np* 6
p, : =.
Ntese que para p fijo! el error estndar de la proporcin muestral disminu$e a medida
que crece el tama@o muestral. %sto implica que! al aumentar el tama@o muestral! la
distribucin de \p
x
se concentra ms alrededor de su media.
"istribucin en el muestreo de la varianza muestral.
&upongamos que se extrae una muestra de n observaciones de una poblacin con media
desconocida
x
$ varian0a desconocida
x
"
. 2epresentaremos las observaciones
muestrales por S

! S
"
! ...! S
n
. La varian0a poblacional es la esperan0a
x
"
( %)*S 5
x
,
"
. $!
por tanto! una cantidad en la que evidentemente deberamos fijarnos sera en la media de
los *S

5
x
,
"
para los n individuos de la muestra. &in embargo! la media poblacional
x
es
desconocida! por lo que en la prctica esta cantidad no podr ser calculada. %s natural!
entonces! sustituir la desconocida
x
por la media muestral X ! $ considerar la media de
los *S

5 X ,
"
. de /ec/o! la varian0a muestral se define como s
x
"
(

n
i
n
1
1
1
*S
i
5 X ,
"
Definicin.
&ea S

! S
"
! ...! S
n
una muestra aleatoria de una poblacin. La cantidad s
x
"
(

n
i
n
1
1
1
*S
i
5
X ,
"
recibe el nombre de varianza muestral. &u ra0 cuadrada! s
x
! se denomina
desviacin tpica muestral.
La conclusin de que el valor esperado de la varian0a muestral es la varian0a poblacional!
es general. &in embargo! para poder caracteri0ar completamente su distribucin
muestral! necesitaremos saber ms acerca de la distribucin de la poblacin. %n muc/as
aplicaciones prcticas! el supuesto de que la distribucin de la poblacin es normal resulta
ra0onable. %n tal caso! puede probarse que la variable aleatoria )*n 6 ,s
x
"
. -
x
"
( s
x
"
( )

=
n
i 1
*S
i
5 X ,
"
. -
x
"
sigue una distribucin conocida con el nombre de distribucin

&
'distribucin (hi cuadrado) con 'n * +) grados de libertad. %sto slo es cierto cuando el
tama@o muestral es una proporcin peque@a del tama@o de la poblacin.
%stas distribuciones slo estn definidas para valores positivos de la variable aleatoria.
Un miembro concreto de la familia A/i cuadrado viene caracteri0ado por un #nico
parmetro! al que llamaremos grado de libertad! para el que /abitualmente se usa el
smbolo . &i una variable aleatoria sigue una distribucin
"
con grados de libertad! se
representar por
"

. La media $ la varian0a de esta distribucin son! respectivamente! el


Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
n#mero de grados de libertad $ el doble del n#mero de grados de libertad! es decir! %*
"

,
( $ Var*
"

, ( "
%n nuestro contexto! la variable aleatoria *n 6 ,s
x
"
-
x
"
sigue una distribucin
"
*n5,
! $! por
tanto! su media es %)*n 6 ,s
x
"
-
x
"
. ( *n 6 , 7or tanto tenemos *n 6 , -
x
"
( %*s
x
"
, ( *n
6, de donde %*s
x
"
, (
x
"
como antes. 7ara /allar la varian0a de s
x
"
! usamos que Var)*n
6 ,s
x
"
. -
x
"
( "*n 6 , 7or consiguiente *n 6 ,
"
-
x
B
Var*s
x
"
, ( "*n 6 , $! en
consecuencia! Var*s
x
"
, ( "
x
B
- *n 6 ,
Las propiedades de la distribucin
"
pueden usarse tambin para calcular la varian0a de
la distribucin muestral de la varian0a muestral.
%l parmetro de la distribucin
"
recibe el nombre de grados de libertad. 7ara entender
esta terminologa! observemos que la varian0a muestral involucra en su definicin a la
suma de los cuadrados de las cantidades *S

5 X ,! *S
"
5 X ,! ...! *S
n
5 X , %sto supone
que estas n pie0as de informacin intervienen en el clculo de la varian0a muestral. &in
embargo! no son pie0as de informacin independientes! puesto que su suma /a de ser 4!
seg#n se deduce de la definicin de X . 7or tanto! si conocemos *n 6 , cualesquiera de
los *S
i
5 X ,! podemos calcular el otro a partir de los *n 6 , primeros.
7or ejemplo! dado que

=
n
i 1
*S
i
5 X , ( 4 se tiene que S
n
5 X ( 5

=
1
1
n
i
*S
i
5 X , Las n
cantidades *S
i
5 X , son equivalentes a un conjunto de *n 6 , pie0as independientes de
informacin. 7odemos pensar en esta situacin de la forma siguiente' queremos /acer
inferencia sobre la desconocida
x
"
. &i la media poblacional
x
fuese conocida! nuestra
inferencia podra estar basada en la suma de cuadrados de *S

5
x
,! *S
"
5
x
,! ...! *S
n
5
x
,
%stas cantidades son independientes unas de otras! $ podramos decir que tenemos n
grados de libertad para la estimacin de
x
"
. &in embargo! dado que en la prctica la
media poblacional se pierde! $ nos quedamos con *n 6 , observaciones independientes
para /acer inferencia sobre la varian0a poblacional. &e dice por ello que los grados de
libertad disponibles son *n 6 ,.
Distribucin muestral de la varian0a muestral.
&ea s
x
"
a varian0a muestral de una muestra aleatoria de n observaciones extradas de
una poblacin con varian0a
x
"
. %ntonces!
. La distribucin muestral de s
x
"
tiene media
x
"
! es decir! %*s
x
"
, (
x
"
". La varian0a de la distribucin muestral de s
x
"
depende de la distribucin de la
poblacin. &i dic/a distribucin es normal! entonces! Var*s
x
"
, ( "
x
B
- *n 6 ,
C. &i la distribucin poblacional es normal! entonces! *n 6 ,s
x
"
-
x
"
se distribu$e cono
una
"
*n5,
Una poblacin normal se ver ms afectada por desviaciones del supuesto de normalidad
de la distribucin poblacional. Auando se quieren calcular probabilidades relativas a la
media muestral! el teorema central del lmite asegura que! para muestras moderadamente
grandes! desviaciones peque@as de la /iptesis de normalidad de la poblacin de la que
se extrae la muestra tienen un efecto peque@o en la valide0 de las probabilidades
calculadas. 7or esta ra0n! se dice que las inferencias basadas en la media muestral son
robustas frente a desviaciones del supuesto de normalidad de la poblacin! mientras que
las inferencias basadas en la varian0a poblacional no lo son.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
stimacin puntual.
*ntroduccin.
Aualquier inferencia que se /aga sobre la poblacin tendr que basarse necesariamente
en estadsticos muestrales! es decir! en funciones de la informacin muestral.
Definiciones.
Un estimador de un parmetro poblacional es una variable aleatoria que depende de la
informacin de la muestra $ cu$as reali0aciones proporcionan aproximaciones al valor
desconocido del parmetro. &e llama estimacin a una reali0acin especfica de esta
variable aleatoria.
7ara estudiar la estimacin de un parmetro desconocido! deben considerarse dos
posibilidades. 7rimero! podramos calcular! en base a los datos de la muestra! un valor
como "representativoK o como el Jms representativoK. 1lternativamente! podramos
intentar encontrar un intervalo o rango! en el cual estemos casi seguros de que est el
verdadero parmetro.
Definiciones.
Un estimador puntual de un parmetro poblacional es una funcin de la nuestra que da
como resultado un #nico valor. La correspondiente reali0acin se llama estimacin
puntual del parmetro.
stimadores inses!ados y su eficiencia.
Designaremos al parmetro que se quiere estimar $ \ al correspondiente estimador
puntual. %ste estimador se dice que es insesgado! si la media de su distribucin muestral
es el parmetro desconocido .
Definiciones.
&e dice que el estimador \ es un estimador insesgado del parmetro! si la media de la
distribucin muestral de \ es ! es decir %*\, (
Diremos que la correspondiente estimacin puntual se obtiene mediante un procedimiento
de estimacin insesgado.
La notacin de esperan0as indica que si repetimos el proceso de muestreo muc/as
veces! en promedio! el valor que se obtiene de un estimador insesgado ser igual al
parmetro poblacional.
7ara tres de los estimadores considerados!
%* X , (
x
%*s
x
"
, (
x
"
%*\p
x
, ( p
7or tanto! podemos decir que la media! la varian0a $ la proporcin muestrales son
estimadores insesgados de los correspondientes parmetros poblacionales. %s por esta
ra0n! por la que al definir la varian0a muestral dividimos la suma de los cuadrados de las
discrepancias por *n 6 , en lugar de n. La media de la distribucin de la desviacin tpica
muestral no es la desviacin tpica poblacional. 7or tanto! la desviacin tpica muestral no
es un estimador insesgado de la desviacin tpica poblacional.
%stimadores insesgados.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
. La media! la varian0a $ las proporciones muestrales son estimadores insesgados de
los correspondientes parmetros poblacionales.
". %n general! la desviacin tpica muestral no es un estimador insesgado de la
desviacin tpica poblacional.
Definicin.
&ea \ un estimador de . %l sesgo de \ se define como la diferencia entre su media $ !
es decir! &esgo*\, ( %*\, 5
De esto se deduce que el sesgo de un estimador insesgado es .
%n muc/os problemas prcticos! pueden obtenerse diferentes estimadores insesgados! $
debe encontrase alg#n mtodo que nos permita elegir entre ellos. %n este contexto! es
natural preferir el estimador cu$a distribucin est ms concentrada alrededor del valor
del parmetro poblacional que se est estimando. Los valores de este estimador difieren
del verdadero parmetro con menos probabilidad que los otros estimadores. &i usamos la
varian0a como medida de dispersin! introduciremos el concepto de eficiencia de un
estimador como criterio para preferir un estimador a otro.
Definiciones.
&ean \

$ ]
"
dos estimadores insesgados de ! obtenidos en nuestras del mismo
tama@o! entonces!
. &e dice que \

es m"s eficiente que \


"
se Var*\

, M Var*\
"
,
". La eficiencia relativa de un estimador con respecto al otro es el cociente de sus
varian0as! es decir! %ficiencia relativa (Var*\
"
, - Var*\

,
Definicin.
&i \ es un estimador insesgado de ! $ no /a$ ning#n otro estimador insesgado que
tenga menor varian0a! entonces se dice que \ es el estimador insesgado m"s eficiente o
de mnima varianza de .
leccin de un estimador puntual.
%xisten problemas de estimacin para los cuales no /a$ un estimador insesgado que sea
satisfactorio. %n este tipo de problemas /a$ muc/o que ganar a cambio del sacrificio de
aceptar un peque@o sesgo. Una medida de la proximidad esperada de un estimador \ al
parmetro es su error cuadr"tico medio! la esperan0a del cuadrado de la diferencia
entre el estimador $ el parmetro! es decir! %A? ( %)*\ 5 ,
"
.
7uede probarse que %A?*\, ( Var*\, + )&esgo*\,.
"
7uede deducirse que! en
ocasiones! se puede obtener un error cuadrtico medio ms peque@o pasando de un
estimador insesgado a otro sesgado! si esto permite conseguir una reduccin suficiente
en la varian0a del estimador. &in embargo! este enfoque es impracticable! $a que el error
cuadrtico medio depender del valor real de ! que es desconocido. %n algunos casos
se puede probar que un estimador tiene menor error cuadrtico medio que toro para todos
los valores posibles del parmetro. %n este caso se dice que el estimador inferior es
inadmisible.
&ea el parmetro que se quiere estimar $ \
n
el estimador puntual basado en una
muestra de tama@o n. 7uesto que estamos interesados en la proximidad del estimador al
parmetro! vamos a considerar la probabilidad de que \
n
difiera de en menos de !
donde es un n#mero positivo! es decir! 7)P\
n
5 P M .
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
&i para cualquier positivo! no importa lo peque@o que sea! esta probabilidad tiende a
cuando el tama@o muestral n tiende a infinito! se dice que el estimador es consistente. De
manera informal! lo que esto significa es que si utili0amos un estimador consistente con
una muestra infinita! obtendremos el resultado correcto.
La desviacin tpica muestral es consistente para la desviacin tpica poblacional *esto
tambin es cierto en el caso de la media $ la varian0a para sus correspondientes
parmetros poblacionales,. 8ambin la proporcin muestral es consistente para la
proporcin poblacional.
Un estimador que sea consistente $ que su distribucin lmite tenga mnima varian0a es el
meor asintticamente normal. De /ec/o! existe un procedimiento conocido como
m"!imo verosimilitud para encontrar estimadores puntuales.
stimacin por intervalos.
*ntervalos de confianza.
La b#squeda de un estimador por intervalos es la b#squeda de un rango de valores entre
los que posiblemente se encuentre la cantidad que se estima. Auanto ma$or sea la
muestra! menor ser el intervalo que recoge nuestra incertidumbre sobre el verdadero
valor del parmetro! siempre que las otras condiciones permane0can iguales.
Definiciones.
Un estimador por intervalos de un parmetro poblacional es una regla *basada en
informacin muestral, para determinar un rango! o un intervalo! en el cual posiblemente se
encuentre dic/o parmetro. La estimacin correspondiente se denomina estimacin por
intervalos.
7odemos definir intervalos de confian0a del porcentaje que nosotros queramos! siempre
menor! por supuesto! del 449. &upongamos que las variables aleatorias 1 $ L son tales
que 7*1 M M L, ( 5 donde es un n#mero cualquiera entre 4 $ . entonces! si se
extraen repetidamente muestras aleatorias de la poblacin $ se calcula este intervalo! una
proporcin * 5 ,! o 44* 5 ,9! de estos intervalos contendrn al parmetro . Un
intervalo calculado de esta manera se denomina un intervalo de confian0a del 44* 5 ,9
para .
Definiciones.
&ea un parmetro desconocido. &upongamos que basndonos en la informacin
muestral! podemos encontrar dos variables aleatorias 1 $ L tales que 7*1 M M L, ( 5
&i representamos las reali0aciones particulares de 1 $ L por a $ b! entonces! el intervalo
de a a b se denomina intervalo de confianza del +,,'+ - ). para . La cantidad * 5 ,
se denomina contenido probabilstico o nivel de confianza del intervalo.
&i se extraen muestras aleatorias de la poblacin un n#mero elevado de veces! el
parmetro estar contenido en un 44* 5 ,9 de los intervalos calculados de este
modo. %l intervalo de confian0a obtenido de esta manera se escribe a M M b
*ntervalos de confianza para la media de una distribucin normal: varianza
poblacional conocida.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Tmaginemos que se extrae una muestra aleatoria de una distribucin normal con media
desconocida $ varian0a conocida! $ que nuestro objetivo es /allar un intervalo de
confian0a para la media poblacional.
&i representamos por S

! S
"
! ...! S
n
una muestra aleatoria de n observaciones de una
poblacin normal con media $ varian0a conocida
"
! $ por X la media muestral!
entonces! los intervalos de confian0a para la media poblacional estn basados en el
resultado por el que la variable aleatoria X (
n
X


tiene una distribucin normal
estndar.
Un intervalo de confian0a para la media poblacional estar basado en el valor observado
de la media muestral! es decir! en una observacin extrada de una distribucin muestral.
Notacin.
&ea X una variable aleatoria estndar $ un valor tal que 4 M M . Llamaremos
entonces 0
4
al n#mero que verifica 7*X : 0
4
, (
Dado que 7*X : 0
4
, ( ! entonces! R
0
*0
4
, ( 7*X M 0
4
, ( 5
&upongamos a/ora que necesitamos un intervalo de confian0a del 44* 5 ,9 para la
media poblacional. %mpleando la notacin $a introducida! tenemos que 7*X : 0
-"
, ( -"
$ por la simetra de la densidad normal alrededor de la media 7*X M 50
-"
, ( -"
&e deduce! por tanto! que 7*50
-"
M X M 0
-"
, ( 5 -" 5 -" ( 5
Wemos encontrado un rango de valores de la variable aleatoria normal estndar con un
contenido probabilstico especfico. %sta informacin puede ser empleada para elaborar
un intervalo de confian0a con el mismo contenido probabilstico para la media poblacional.
8enemos que' 5 ( 7*50
-"
M X M 0
-"
, ( 7*50
-"
M
n
X


M 0
-"
, ( 7

< <

n
z
X
n
z

2 / 2 /
( 7

+ < <

n
z
X
n
z
X

2 / 2 /
&e deduce de la definicin de intervalos de confian0a que si x es el valor especfico
observado de la media muestral! entonces! un intervalo de confian0a del 44* 5 ,9 para
la media poblacional viene dado por
n
z
x
n
z
x

2 / 2 /
+ < <
Tntervalos de confian0a para la media de una poblacin normal' varian0a poblacional
conocida.
&upongamos que tenemos una muestra aleatoria de n observaciones procedentes de una
distribucin normal con media $ varian0a
"
. &i
"
es conocida $ el valor observado de
la media muestral es x ! entonces! un intervalo de confian0a del 44* 5 ,9 para la
media poblacional viene dado por
n
z
x
n
z
x

2 / 2 /
+ < <
donde 0
-"
es el n#mero que
verifica 7*X : 0
-"
, ( -" $ la variable aleatoria X tiene una distribucin normal estndar.
Wemos visto que un intervalo de confian0a del 44* 5 ,9 para la media poblacional es
n
z
x
n
z
x

2 / 2 /
+ < <
Aomo se podra intuir! la media muestral x est en el centro del
intervalo. La longitud! ^! del intervalo! es decir! la distancia entre los extremos! es ^ (
n
z 2 / 2
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
7uede comprobarse! entonces! que la longitud de un intervalo de confian0a depende de
su contenido probabilstico! la desviacin tpica poblacional $ el n#mero de observaciones
de la muestra. %n particular! se verifican los siguientes resultados'
. Dado un contenido probabilstico $ un tama@o muestral! cuanto ma$or sea la
desviacin tpica poblacional ! ma$or longitud tendr el intervalo de confian0a para la
media poblacional. %sto resulta convincente intuitivamente! dado que! siempre que las
otras condiciones permane0can intactas! cuanto ms dispersa est la distribucin de la
poblacin alrededor de su media! ms incierta ser nuestra inferencia sobre la media.
%sta incertidumbre adicional se refleja en unos intervalos de confian0a de ma$or
longitud.
". Dado un contenido probabilstico $ una desviacin tpica poblacional! cuanto ma$or
sea el tama@o de la muestra n! ms corto ser el intervalo de confian0a para la media
poblacional. Una ve0 ms! esta conclusin resulta intuitiva. Auanta ma$or
informacin obtenemos sobre una poblacin! ms precisa debe ser nuestra inferencia
sobre su media. %sta precisin adicional se refleja en unos intervalos de confian0a
ms cortos.
C. Dada una desviacin tpica poblacional $ un tama@o muestral! cuanto ma$or sea el
contenido probabilstico * 5 ,! ma$or ser la longitud del intervalo de confian0a para
la media poblacional. Auanto ma$or sea * 5 ,! menor ser $! por tanto! ma$or ser
0
-"
. en efecto! a cambio de una ma$or certidumbre en nuestras declaraciones de
probabilidad! obtenemos una menor precisin de dic/as afirmaciones. %sto se refleja
en unos intervalos de confian0a ms largos para los parmetros de la poblacin! $a
que el contenido probabilstico aumenta.
&i el tama@o de la muestra es grande! ninguno de los requisitos resulta mu$ restrictivo.
%n este caso! por el teorema central del lmite! estos intervalos de confian0a siguen
siendo aproximadamente vlidos incluso cuando la distribucin de la poblacin no es
normal. 1dems! cuando el tama@o de la muestra es grande! la desviacin tpica
muestral ser un estimador lo suficientemente bueno de la desviacin tpica poblacional
como para permitirnos emplear el primero en lugar del segundo sin afectar seriamente el
contenido probabilstico de los intervalos.
Tntervalos de confian0a para la media poblacional' tama@os muestrales grandes.
&upongamos que tenemos una muestra de n observaciones procedentes de una
distribucin con media . &ean x $ s
x
la media muestral observada $ la desviacin tpica!
respectivamente. %ntonces! si n es grande! una buena aproximacin de un intervalo de
confian0a del 44* 5 ,9 para viene dada por
n
s z
x
n
s z
x
2 2 / 2 2 /
+ < <
%n la ma$or parte de los casos esta aproximacin seguir siendo adecuada incluso
cuando la distribucin de la poblacin no es normal.
Aonsideramos que n ( C4 observaciones o ms constitu$en una muestra JgrandeK.
La distribucin 3 de 4tudent.
%n el caso en el que la desviacin tpica poblacional sea desconocida es natural
considerar la variable aleatoria que resulta de sustituir el valor desconocido por la
desviacin tpica muestral! s
x
! obtenindose' t (
n s
X
x

%sta variable aleatoria no sigue
una distribucin normal estndar. &in embargo! es conocida $ es de /ec/o un miembro
de una familia de distribuciones denominada t de /tudent.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
La distribucin t de &tudent.
Dada una muestra de n observaciones con media X $ desviacin tpica s
x
! procedente
de una poblacin normal con media ! la variable aleatoria t (
n s
X
x

sigue una
distribucin t de /tudent con 'n * +) grados de libertad.
%l n#mero de grados de libertad coincide con el correspondiente a la distribucin A/i
cuadrado basada en el mismo tama@o muestral. Rormalmente! la variable aleatoria t de
&tudent con grados de libertad se define como t

( X - *

"
-, donde X es una variable
aleatoria normal estndar!

"
es una variable aleatoria A/i cuadrado con grados de
libertad $ X $

"
son independientes.
Notacin.
2epresentaremos por t

la variable aleatoria que sigue una distribucin t de &tudent con


grados de libertad. 1dems! t
!
ser el valor para el cual 7*t

: t
!
, (
%n las aplicaciones ms usuales! necesitaremos encontrar el valor t
!
correspondiente a
una probabilidad determinada .
Utili0aremos a/ora la distribucin t de &tudent para calcular intervalos de confian0a para
la media de una poblacin normal. &e deduce que 7*t

: t
!-"
, ( -"
1dems! debido a la simetra de la funcin de densidad de la distribucin t de &tudent
alrededor de su media 4! 7*t

M 5 t
!-"
, ( -"
Rinalmente! dado que las probabilidades de sucesos mutuamente exclu$entes $
colectivamente ex/austivos suman ! se deduce que 7*5t
!-"
M t

M t
!-"
, ( 6 7*t

: t
!-"
, 6
7*t

M 5 t
!-"
, ( 5 -" 5 -" ( 5
*ntervalos de confianza para la media de una distribucin normal: varianza
poblacional desconocida.
7odemos emplear la distribucin t de &tudent para derivar intervalos de confian0a para la
media de una poblacin normal cuando la varian0a es desconocida.
&upongamos que disponemos de una muestra aleatoria de n observaciones procedentes
de una poblacin normal con media $ varian0a desconocida! $ que buscamos intervalos
de confian0a para la media poblacional.
&ean X $ s
x
"
la media $ la varian0a muestrales! respectivamente. %ntonces! la variable
aleatoria t
n5
(
n s
X
x

sigue una distribucin t de &tudent con *n 6 , grados de libertad.
&upongamos que queremos calcular un intervalo de confian0a del 44* 5 ,9 para la
media poblacional. 8enemos que 5 ( 7*5 t
n5!-"
M t
n5
M t
n5!-"
, ( 7*5t
n5!-"
M
n s
X
x

M t
n5
!-"
, ( 7

< <

n
s t
X
n
s t x n x n 2 / , 1 2 / , 1

( 7

+ < <


n
s t
X
n
s t
X
x n x n 2 / , 1 2 / , 1


7or tanto! de la definicin de intervalos de confian0a se deduce que si x $ s
x
son los
valores observados para la media $ la desviacin tpica muestrales! entonces! un intervalo
de confian0a del 44* 5 ,9 para la media poblacional viene dado por
n
s t
x
n
s t
x
x n x n 2 / , 1 2 / , 1


+ < <

Cedido por el TURCO


FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Tntervalos de confian0a para la media de una poblacin normal' varian0a poblacional
desconocida.
&upongamos que tenemos una muestra aleatoria de n observaciones procedentes de una
distribucin normal con media $ varian0a desconocida. &i la media $ la desviacin tpica
muestrales observadas son! respectivamente! x $ s
x
! entonces! un intervalo de confian0a
del 44* 5 ,9 para la media poblacional viene dado por
n
s t
x
n
s t
x
x n x n 2 / , 1 2 / , 1


+ < <

donde t
n5!-"
es el valor que verifica 7*
tn5
: t
n5!-"
, ( -" $ la variable aleatoria t
n5
sigue
una distribucin t de &tudent con *n 6 , grados de libertad.
*ntervalos de confianza para proporciones de la poblacin 5muestras !randes6.
&upongamos a/ora que estamos interesados en la proporcin de miembros de la
poblacin que poseen un determinado atributo.
&itundonos en el marco de la distribucin binomial \p
x
representa la proporcin de
JxitosK en n intentos independientes! cada uno con probabilidad de JxitoK p. La variable
aleatoria X (
n p p
p px
/ ) 1 (
^

sigue aproximadamente una distribucin normal.


Desgraciadamente! este resultado no nos permite por si solo el clculo de intervalos de
confian0a para la proporcin poblacional! $a que el denominador depende del parmetro p
desconocido!. &in embargo! si el tama@o muestral es grande! podemos conseguir una
buena aproximacin sustitu$endo p por su estimador puntual \p
x
! es decir!
n
p p
n
p p x x ) ^ 1 ( ^ ) 1 (

7or tanto! para tama@os muestrales grandes! la variable


aleatoria
n p p
p p
Z
x x
x
/ ) ^ 1 ( ^
^

=
sigue aproximadamente una distribucin normal. 7odemos!
pues! utili0ar este resultado para la construccin de intervalos de confian0a para la
proporcin poblacional.
Aomo $a /emos /ec/o anteriormente! definiremos 0
-"
como el valor para el cual 7*X :
0
-"
, ( -" donde la variable aleatoria X sigue una distribucin normal. %ntonces! 5 (
7*50
-"
M X M 0
-"
, ( 7*50
-"
M
n p p
p p
x x
x
/ ) ^ 1 ( ^
^

M 0
-"
, ( 7*50
-"

n
p p x x ) ^ 1 ( ^
M \p
x
6 p M 0
-"
n
p p x x ) ^ 1 ( ^
, ( ( 7*\p
x
5 0
-"

n
p p x x ) ^ 1 ( ^
M p M \p
x
+ 0
-"

n
p p x x ) ^ 1 ( ^
,
7or lo que se deduce que si la proporcin muestral observada es \p
x
! un intervalo de
confian0a aproximado al 44* 5 ,9 para la proporcin poblacional viene dado por \p
x
5
0
-"

n
p p x x ) ^ 1 ( ^
M p M \p
x
+ 0
-"

n
p p x x ) ^ 1 ( ^
Tntervalos de confian0a para la proporcin poblacional *?uestras grandes,.
&ea \p
x
la proporcin observada de JxitosK en una muestra aleatoria de n observaciones
procedentes de una poblacin con una proporcin p de xitos. %ntonces! si n es grande!
un intervalo de confian0a del 44* 5 ,9 para la proporcin poblacional viene dado por
\p
x
5 0
-"

n
p p x x ) ^ 1 ( ^
M p M \p
x
+ 0
-"

n
p p x x ) ^ 1 ( ^
donde 0
-"
es el valor para el cual 7*X
: 0
-"
, ( -" $ la variable aleatoria X tiene una distribucin normal.
Los intervalos de confian0a construidos de este modo son generalmente bastante fiables
cuando se basan en muestras con nK B4 o ms observaciones.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Los intervalos de confian0a para la proporcin poblacional estn centrados en la
proporcin muestral. &iempre que las dems condiciones permane0can intactas! cuanto
ma$or sea el tama@o muestral n! menor ser la longitud del intervalo de confian0a.
*ntervalos de confianza para la varianza de una poblacin normal.
Tmaginemos que tenemos una muestra de n observaciones procedentes de una poblacin
normal con varian0a
"
! $ representamos por s
x
"
la varian0a muestral. La variable
aleatoria
"
n5
( )*n 6 ,s
x
"
. -
"
sigue una distribucin A/i cuadrado con *n 6 , grados de
libertad.
Notacin.
Denominaremos
"

la variable aleatoria que tiene una distribucin A/i cuadrado con


grados de libertad.
"
!
ser el valor para el cual 7*
"

:
"
!
, (
8enemos que 7*
"

:
"
!-"
, ( - " De manera similar! se define
"
!5-"
como el valor que
verifica 7*
"

:
"
!5-"
, ( 5 -" $! por tanto! 7*
"

M
"
!5-"
, ( -"
Rinalmente! 7*
"
n!5-"
M
"

M
"
!-"
, ( 5 -" 5 -" ( 5
7ara calcular intervalos de confian0a para la varian0a poblacional! tenemos que para la
distribucin A/i cuadrado con *n 6, grados de libertad
5 ( 7*
"
n5!5-"
M
"
n5
M
"
n5!-"
, ( 7*
"
n5!5-"
M )*n 6 ,s
x
"
. -
"
M
"
n5!-"
, ( 7G)*n 6 ,s
x
"
. -
*
"
n5!-"
, M
"
M )*n 6 ,s
x
"
. - *
"
n5!5-"
,H
7or tanto! si s
x
"
es el valor observado de la varian0a muestral! un intervalo de confian0a
del 44* 5 ,9 vendr dada por G)*n 6 ,s
x
"
. - *
"
n5!-"
, M
"
M )*n 6 ,s
x
"
. - *
"
n5!5-"
,H
Tntervalos de confian0a para la varian0a de una poblacin normal.
&upongamos que disponemos de una muestra aleatoria de n observaciones procedentes
de una poblacin normal con varian0a
"
. &i la varian0a muestral observada es s
x
"
!
entonces! un intervalo de confian0a del 44* 5 ,9 para la varian0a poblacional vendr
dado por G)*n 6 ,s
x
"
. - *
"
n5!-"
, M
"
M )*n 6 ,s
x
"
. - *
"
n5!5-"
,H donde
"
n5!-"
es el valor que
verifica 7*
"
n5
:
"
n5!-"
, ( -" $
"
n5!5-"
es el valor para el cual 7*
"
n5
M
"
n5!5-"
, ( -" $
la variable aleatoria
"
n5
sigue una distribucin A/i cuadrado con *n 6 , grados de
libertad.
Wa$ que advertir el peligro de seguir este procedimiento cuando la distribucin de la
poblacin no es normal. La valide0 del estimador por intervalos para la varian0a depende
en ma$or medida de la /iptesis de normalidad que el correspondiente a la media
poblacional.
*ntervalos de confianza para la diferencia de medias de dos poblaciones normales.
7ara comparar las medias poblacionales! se extrae una muestra aleatoria de las dos
poblaciones $ la inferencia sobre la diferencia entre ambas medias se basa en los
resultados muestrales. %l mtodo apropiado para anali0ar esta informacin depende del
procedimiento empleado al seleccionar las muestras. Nosotros consideraremos las dos
posibilidades siguientes'
. Datos pareados' en este procedimiento! las muestras se eligen por pares! una de cada
poblacin. La idea es que! aparte del aspecto objeto de estudio! los elementos de
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
cada uno de estos pares deben estar relacionados! de manera que la comparacin
pueda ser establecida directamente.
". ?uestras independientes' en este mtodo se extraen dos muestras independientes de
cada una de las dos poblaciones de inters! de manera que los miembros de una
muestra no tienen necesariamente relacin con los miembros de la otra.
*ntervalos de confianza basados en datos pareados.
De manera general! supongamos que tomamos una muestra aleatoria de n pares de
observaciones que representamos por *x

! $

,! *x
"
! $
"
,! ...! *x
n
! $
n
,! procedentes de dos
poblaciones con medias
x
$
$
. 1s! x

! x
"_...! x
n_ corresponden a las observaciones con
media
x
! e $

! $
"
! ...! $
n
a las observaciones con media
$
.
Nos encontramos en una situacin en la que podemos plantearnos el clculo de un
intervalo de confian0a para una media poblacional *
x
5
$
,! dada una muestra aleatoria
*los valores de las diferencias d
i
, de esa poblacin. &i la distribucin poblacional asumida
es normal! el mtodo para el clculo de intervalos de confian0a para la media de una
distribucin normal! con varian0a poblacional desconocida! puede aplicarse directamente!
$a que las diferencias en los datos pareados constitu$en una muestra aleatoria de una
poblacin cu$a media es igual a la cantidad que estamos intentado estimar.
Tntervalos de confian0a para la diferencia de medios' datos pareados.
&upongamos que disponemos de una muestra aleatoria de datos pareados procedentes
de distribuciones con medias
x
$
$
. &ean d $ s
d
la media $ la desviacin tpica
muestrales para las n diferencias d
i
( x
i
6 $
i
. &i se asume que la distribucin de las
diferencias es normal! entonces! un intervalo de confian0a del 44* 5 ,9 para *
x
5
$
,
viene dado por
n
s t
d
n
s t
d
d n
y x
d n 2 / , 1 2 / , 1


+ < <

donde t
n5!-"
es el valor para el cual
7*
tn5
: t
n5!-"
, ( -" $ la variable aleatoria t
n5
sigue una distribucin t de &tudent con *n 6
, grados de libertad.
*ntervalos de confianza basados en muestras independientes.
Tmaginemos que disponemos de una muestra aleatoria de n
x
observaciones procedentes
de una poblacin con media
x
$ varian0a
"
x
! $ de una muestra aleatoria independiente
de n
$
observaciones de una poblacin con media
$
$ varian0a
$
"
. &ean X e Y las
medias muestrales respectivas.
Aomo un primer paso! veamos el caso en el que las dos distribuciones poblacionales son
normales con varian0as conocidas. Dado que el objeto de inters es la diferencia entre
las dos medias poblacionales! resulta ra0onable basar la inferencia en la diferencia entre
las medias muestrales correspondientes. %sta variable aleatoria tiene media %* X 5 Y ,
(%* X , 6 %* Y , (
x
5
$
$! dado que las muestras son independientes! varian0a Var* X 5
Y , ( Var* X , + Var* Y , (
x
"
-n
x
+
$
"
-n
$
1dems! se puede probar que su distribucin es normal. 7or tanto! la variable aleatoria
X ( )* X 5 Y , 6 *
x
5
$
,. - )*
x
"
-n
x
+
$
"
-n
$
,. tiene una distribucin normal estndar.
Tntervalos de confian0a para la diferencia de medias' muestras independientes *Varian0as
conocidas o tama@os de muestras grandes,.
&upongamos que disponemos de muestras aleatorias independientes de n
x
$ n
$
observaciones procedentes de distribuciones normales con medias
x
$
$
! $ varian0as
x
"
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
$
$
"
. &i las medias muestrales observadas son x e
y
! entonces! un intervalo de
confian0a del 44* 5 ,9 para *
x
5
$
, viene dado por * x 5
y
, 5 0
-"
*
x
"
-n
x
+
$
"
-n
$
, M
x
5
$
M * x 5
y
, + 0
-"
*
x
"
-n
x
+
$
"
-n
$
, donde 0
-"
es el valor para el cual 7*X : 0
-"
, ( -"
$ la variable aleatoria X sigue una distribucin normal estndar.
&i el tama@o de las muestras n
x
$ n
$
es grande! entonces! sustitu$endo en la expresin
anterior las varian0as poblacionales s
x
"
$ s
$
"
por las muestrales! se obtiene una buena
aproximacin a un intervalo de confian0a del 44* 5 ,9 para *
x
5
$
,. 7ara muestras
grandes! esta aproximacin seguir siendo vlida incluso cuando las distribuciones
poblacionales no sean normales.
8reinta observaciones en cada muestra son! en general! suficientes para reali0ar esta
aproximacin.
7ara /allar un intervalo cuando los tama@os muestrales no son grandes $ se requiere un
intervalo de confian0a para la diferencia de medias de dos poblaciones normales! $ si se
puede asumir que las varian0as poblacionales son iguales! se puede emplear un mtodo
bastante sencillo.
&upongamos que disponemos de dos muestras aleatorias de n
x
$ n
$
observaciones
procedentes de dos poblaciones con medias
x
$
$
! $ varian0a com#n desconocida
"
. la
inferencia sobre las medias poblacionales se basa en la diferencia * X 5 Y , entre las dos
medias muestrales. %sta variable aleatoria tiene una distribucin normal con media *
x
5

$
, $ varian0a Var*
X
5
Y
, ( Var*
X
, + Var*
Y
, (
"
-n
x
+
"
-n
$
(
"

+
y x n n
1 1
(
"

+
y x
y x
n n
n n
7or tanto! se verifica que la variable aleatoria X ( )* X 5 Y , 6 *
x
5
$
,. - G)
"

+
y x
y x
n n
n n
.H tiene una distribucin normal estndar. &in embargo! debido a que esta
varian0a es la misma para ambas poblaciones! pueden emplearse los dos conjuntos de
informacin muestral para estimarla. %l estimador es s
"
( )*n
x
6 ,s
x
"
+ *n
$
6 ,s
$
"
. - *n
x
+ n
$
6 ", donde s
x
"
$ s
$
"
son las dos varian0as muestrales. 2eempla0ando la varian0a
desconocida
"
por su estimador s
"
! obtenemos la variable aleatoria t (
s
y x
y x
y x
n n
n n
Y X
+
) ( ) (
7uede demostrar que esta variable aleatoria sigue una distribucin t
de &tudent con *n
x
+ n
$
6 ", grados de libertad.
Tntervalo de confian0a para la diferencia de medias de dos poblaciones normales'
?uestras independientes! varian0as poblaciones iguales.
&upongamos que disponemos de dos muestras aleatorias independientes con n
x
$ n
$
observaciones que proceden de dos poblaciones normales con medias
x
$
$
! $ varian0a
com#n desconocida. &i las medias $ varian0as muestrales observadas son x !
y
! $ s
x
"
!
s
$
"
! entonces! un intervalo de confian0a del 44* 5 ,9 viene dado por * x 5
y
, 6 t
nx+n$5"!
-"

s
y x
y x
n n
n n +
M
x
5
$
M * x 5
y
, + t
nx+n$5"! -"

s
y x
y x
n n
n n +
donde s
"
( )*n
x
6 ,s
x
"
+ *n
$
6 ,s
$
"
. -
*n
x
+ n
$
6 ", $ t
nx+n$5"! -"
es el valor que verifica 7*t
nx+n$5"
: t
nx+n$5"! -"
, ( -" donde la
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
variable aleatoria t
nx+n$5"
sigue una distribucin t de &tudent con *n
x
+ n
$
6 ", grados de
libertad.
*ntervalos de confianza para la diferencia entre dos proporciones poblacionales
5muestras !randes6.
&upongamos que una muestra de n
x
observaciones de una poblacin con una proporcin
p
x
de KxitosK da lugar a una proporcin muestral \p
x
! $ que se obtiene una proporcin
muestral \p
$
al examinar una muestra aleatoria independiente de n
$
observaciones
procedentes de una poblacin con proporcin p
$
de JxitosK. Dado que estamos
interesados en la diferencia poblacional *p
x
6 p
$
,! parece lgico estudiar el
comportamiento de la variable aleatoria *\p
x
5 \p
$
,. &u media es %*\p
x
5 \p
$
, ( %*\p
x
, 6
%*\p
$
, ( p
x
6 p
$
$! debido a que las muestras se extrajeron independientemente! la
varian0a Var*\p
x
5 \p
$
, ( Var*\p
x
, + Var*\p
$
, (
y
y y
x
x x
n
p p
n
p p ) 1 ( ) 1 (
+

1dems! si los tama@os muestrales son grandes! la distribucin de esta variable aleatoria
es aproximadamente normal! por lo que si le restamos su media $ la dividimos por la
desviacin tpica! el resultado es una variable aleatoria normal estndar. 7or otra parte!
para tama@os de muestra grandes! esta aproximacin sigue siendo vlida aun cuando se
sustitu$an las proporciones poblacionales desconocidas por sus equivalentes muestrales.
1s pues! la variable aleatoria
y
y y
x
x x
y x y x
n
p p
n
p p
p p p p
Z
) ^ 1 ( ^ ) ^ 1 ( ^
) ( ) ^ (^


=
sigue aproximadamente una distribucin normal estndar.
%ste resultado permite la construccin de intervalos de confian0a para la diferencia entre
dos proporciones poblacionales cuando los tama@os de muestra son grandes.
Tntervalos de confian0a para la diferencia entre proporcione poblaciones *?uestras
grandes,.
&ea \p
x
la proporcin de xitos observadas en una muestra aleatoria de tama@o n
x
procedente de una poblacin con proporcin de xitos p
x
! $ sea \p
$
la proporcin de xitos
observada en una muestra aleatoria independiente procedente de una poblacin con
proporcin p
$
de xitos. %ntonces! sui los tama@os muestrales son grandes *al menos B4
observaciones,! un intervalo de confian0a del 44* 5 ,9 viene dado por *\p
x
5 \p
$
, 5 0
-"
y
y y
x
x x
n
p p
n
p p ) ^ 1 ( ^ ) ^ 1 ( ^
+

M p
x
6 p
$
M *\p
x
5 \p
$
, + 0
-"

y
y y
x
x x
n
p p
n
p p ) ^ 1 ( ^ ) ^ 1 ( ^
+

donde
0
-"
es el valor que verifica 7*X : 0
-"
, ( -" $ la variable aleatoria X sigue una distribucin
normal estndar.
Cmo estimar el tama7o de la muestra.
%n algunas situaciones el investigador puede ser capa0 de fijar por adelantado la amplitud
del intervalo de confian0a! eligiendo un tama@o muestral lo suficientemente grande como
para garanti0ar dic/a amplitud.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
*ntervalos para la media de una distribucin normal: varianza poblacional
desconocida.
Auando tomamos una muestra aleatoria de n observaciones procedentes de una
poblacin normal con media $ varian0a conocida
"
! un intervalo de confian0a del 44*
5 ,9 viene dado por
n
z
x
n
z
x

2 / 2 /
+ < <
donde x es la media muestral observada $
0
-"
es el valor crtico apropiado de la distribucin normal. %ste intervalo est centrado en
la media muestral $ recorre una distancia
n
z
L
2 /
=
a cada lado de la media muestral!
de manea que L es la mitad de la longitud del intervalo. &upongamos a/ora que el
investigador quiere fijar L de antemano. 8enemos que
L
z
n
2 /
=
$ elevando al
cuadrado de los dos lados de esta ecuacin! obtenemos n ( *0
"
-"

"
, - L
"
.
%sta eleccin del tama@o muestral nos garanti0a que el intervalo de confian0a tendr una
amplitud L a cada lado de la media muestral.
8ama@o muestral de los intervalos de confian0a para la media de una distribucin normal'
varian0a poblacional conocida.
&upongamos que disponemos de una muestra aleatoria de una poblacin normal con
varian0a conocida
"
. entonces! un intervalo de confian0a del 44* 5 ,9 para la media
poblacional tiene una amplitud L a cada lado de la media muestral! si el n#mero de
observaciones es n ( *0
"
-"

"
, - L
"
. donde 0
-"
es el valor para el cual 7*X : 0
-"
, ( -" $ X
sigue una distribucin normal estndar.
Naturalmente! el n#mero de observaciones de la muestra tiene que ser entero. &i el
n#mero n resultante no es un entero! lo redondeamos por exceso para garanti0ar que
nuestro intervalo de confian0a no exceda la amplitud requerida.
*ntervalos para la proporcin poblacional.
%n una muestra aleatoria de n observaciones! un intervalo de confian0a del 44* 5 ,9
viene dado por \p
x
5 0
-"

n
p p x x ) ^ 1 ( ^
M p M \p
x
+ 0
-"

n
p p x x ) ^ 1 ( ^
, donde \p
x
es la
proporcin muestral observada. %ste intervalo est centrado en la proporcin muestral $
recorre una distancia L ( 0
-"

n
p p x x ) ^ 1 ( ^
a cada lado de la proporcin muestral. 1/ora
bien! esta frmula no puede ser aplicada directamente para construir un intervalo de
confian0a con una longitud determinada! $a que depende de la proporcin muestral! la
cual no se conoce de antemano. &in embargo! independientemente del resultado! \p
x
* 5
\p
x
, no puede ser ma$or que 4!"> cuando el valor de la proporcin muestral es 4!>. de
este modo! el ma$or valor que puede alcan0ar L es L
U
! el cual viene dado por L
U
( 0
-"
n
z
n
2 / 5 , 0 25 , 0
=
&upongamos que un investigador quiere elegir un tama@o muestral lo suficientemente
grande como para garanti0ar que el intervalo de confian0a no tendr una amplitud ma$or
que L
U
a cada lado de la proporcin muestral. 8enemos que
*
2 / 5 , 0
L
z
n

=
$ elevando
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
esta cantidad al cuadrado obtenemos n ( *4!">0
"
-"
, - *L
U
"
, %sta expresin proporciona el
tama@o muestral que buscamos.
8ama@o muestral de los intervalos de confian0a para la proporcin muestral.
&upongamos que tomamos una muestra aleatoria procedente de una poblacin.
%ntonces! un intervalo de confian0a del 44* 5 ,9 para la proporcin poblacional! que
tiene una amplitud mxima L a cada lado de la proporcin muestral! vendr garanti0ado
por un n#mero de observaciones n ( *4!">0
"
-"
, - *L
U
"
,
Contraste de #iptesis.
Denotemos por el parmetro poblacional de inters. &upongamos que se formula una
/iptesis sobre este parmetro $ que esta /iptesis se considerar cierta a no ser que se
produ0ca suficiente evidencia en contra! lo cual puede entenderse como mantener la
/iptesis. %n el contexto del contraste de /iptesis estadstico! se conoce como hiptesis
nula. Auando se recoge informacin muestral! esta /iptesis es ju0gada! o contrastada.
&i la /iptesis no es cierta! entonces! debe ser cierta alguna /iptesis alternativa! as
cuando el investigador elabora un contraste formula una hiptesis alternativa frente a la
cual se contrasta la /iptesis nula. La /iptesis nula se denotar W
4
$ la /iptesis
alternativa W

.
Una /iptesis! nula o alternativa! puede designar un #nico valor! llamado
4
para el
parmetro poblacional . %n este caso! se dice que la /iptesis es simple. La notacin
simblica para una /iptesis de este tipo es W
4
' (
4
Una /iptesis tambin puede designar un rango de valores para el parmetro poblacional
desconocido. Una /iptesis de este tipo se denomina compuesta $ ser cierta para ms
de un valor del parmetro poblacional.
%n muc/as aplicaciones! se contrasta una /iptesis nula! digamos! W
4
' (
4
frente a una
alternativa compuesta. %n algunos casos! slo interesan alternativas a un lado de la
/iptesis nula. 7or ejemplo! podemos querer constatar esta /iptesis nula frente a la
/iptesis alternativa de que el verdadero valor de es ma$or que
4
! lo cual puede
escribirse como W

' :
4
7or el contrario! la alternativa de inters puede ser W

' M
4
Las /iptesis alternativas de este tipo se denominan alternativas unilaterales. Ntras
posibilidad es que queramos contrastar esta /iptesis nula simple frente a la alternativa
general de que el valor de es cualquiera distinto de
4
! es decir' W

'
4
`sta se
conoce como alternativa bilateral.
Despus de especificar unas /iptesis nula $ alternativa! $ de recoger informacin
muestral! debe tomarse una decisin sobre la /iptesis nula. Las dos posibilidades son
aceptar la /iptesis nula o rechazarla a favor de la alternativa. Aon el fin de llegar a una
de estas conclusiones! se adopta una regla de decisin basada en la evidencia muestral.
&i slo se dispone de una muestra de la poblacin! entonces el parmetro poblacional no
se conocer con exactitud. 7or consiguiente! no se puede saber con seguridad si la
/iptesis nula es cierta o falsa. 7or tanto! cualquier regla de decisin adoptada tiene
cierta probabilidad de llegar a una conclusin errnea sobre el parmetro poblacional de
inters. De /ec/o! pueden cometerse dos tipos de errores. Wa$ dos posibles estados de
la naturale0a 6 la /iptesis nula es cierta o es falsa. Un error que se puede cometer!
llamado error de 0ipo I! es rec/a0ar una /iptesis nula cierta. &i la regla de decisin es
tal que la probabilidad de rec/a0ar la /iptesis nula cuando es cierta es ! entonces! se
llama nivel de significacin del contraste. 7uesto que la /iptesis tiene que ser aceptada
o rec/a0ada! la probabilidad de aceptar la /iptesis nula cuando es cierta es * 5 ,. %l
otro error posible! llamado error de 0ipo II! ocurre cuando se acepta una /iptesis nula
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
falsa. &upongamos que para una determinada regla de decisin particular! la probabilidad
de cometer este error! cuando la /iptesis nula es falsa! se nota por . %ntonces! la
probabilidad de rec/a0ar una /iptesis nula falsa es * 5 ,! $ se denomina potencia del
contraste.
7or supuesto! lo ideal sera que las probabilidades de los dos tipos de error fuesen lo ms
peque@as posible. &in embargo! /a$ una clara compensacin entre los dos. Auando se
/a tomado una muestra! cualquier modificacin de la regla de decisin que /aga menos
verosmil rec/a0ar una /iptesis nula cierta! inevitablemente! se traducir en ma$or
verosimilitud de aceptar esta /iptesis cuando es falsa.
1l disminuir la probabilidad de cometer un error de 8ipo T! /emos aumentado la
probabilidad de cometer un error de 8ipo TT. La #nica manera de disminuir
simultneamente las dos probabilidades de error ser obtener ms informacin sobre el
verdadero parmetro de la poblacin! tomando una muestra ma$or. Wabitualmente lo que
se /ace en la prctica! es fijar la probabilidad de cometer un error de 8ipo T a un nivel
deseado! es decir! se fija el nivel de significacin.
Wemos visto que! puesto que la regla de decisin queda determinada por el nivel de
significacin elegido! el concepto de potencia no forma parte directa en la decisin de
rec/a0ar la /iptesis nula.
8erminologa de contraste de /iptesis.
Wiptesis Nula *W
4
,' una /iptesis que se mantiene como cierta si no se obtiene suficiente
evidencia de lo contrario.
Wiptesis 1lternativa *W

,' una /iptesis frente a la cual se contrasta la /iptesis nula $


que se considerar cierta si la nula resulta falsa.
Wiptesis &imple' una /iptesis que especifica un #nico valor para el parmetro
poblacional de inters.
Wiptesis Aompuesta' una /iptesis que especifica un rango de valores para el parmetro
poblacional.
1lternativa Unilateral' una /iptesis alternativa que recoge todos los posibles valores de
un parmetro poblacional a un lado u otro *es decir! ma$ores que o menores que, del
valor especificado por una /iptesis nula simple.
1lternativa Lilateral' una /iptesis alternativa que recoge todos los posibles valores de un
parmetro poblacional distintos del valor especificado por una /iptesis nula simple.
Decisiones de un Aontraste de Wiptesis' se formula una regla de decisin que conduce al
investigador a aceptar o rec/a0ar la /iptesis nula basndose en la evidencia muestral.
%rror de 8ipo T' rec/a0ar una /iptesis nula cierta.
%rror de 8ipo TT' aceptar una /iptesis nula falsa.
Nivel de significacin' la probabilidad de rec/a0ar una /iptesis nula que es cierta *esta
probabilidad a veces se expresa como un porcentaje! con lo que nos referimos a un
contraste de nivel de significacin como un contraste de nivel 449,.
7otencia' la probabilidad de rec/a0ar una /iptesis nula que es falsa.
Contrastes para la media de una distribucin normal: 2arianza poblacional
conocida.
Aomencemos con el problema de contrastar la /iptesis nula de que la media poblacional
es igual a cierta valor!
4
. esta /iptesis se representa W
4
' (
4

&upongamos que la /iptesis alternativa de inters es que la media poblacional supera
este valor especfico! es decir! W

' :
4
%s natural que el contraste sobre la media poblacional se base en la media muestral X .
%n particular! uno desconfiara de la veracidad de una /iptesis nula! frente a esta
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
alternativa! si la media muestral observada fuese muc/o ma$or que
4
. buscamos la
forma de un contraste con un nivel de significacin prefijado. %s decir! queremos una
regla de decisin tal que la probabilidad de rec/a0ar la /iptesis nula! cuando es cierta!
sea . %l contraste se apo$a en el /ec/o de que la variable aleatoria X (
n
X

0
tiene
distribucin normal estndar. 1/ora! se rec/a0ar la /iptesis nula si la media muestral
es muc/o ma$or que el valor
4
postulado para la media poblacional. 7or tanto! W
4
ser
rec/a0ada si se observa un valor alto para la variable aleatoria. [ueremos fijar en la
probabilidad de rec/a0ar la /iptesis nula cuando es cierta. Denotamos por 0

el n#mero
para el cual 7*X : 0

, ( [ue significa que cuando la /iptesis nula es cierta! la


probabilidad de que la variable aleatoria sea ma$or que 0

es . 7or tanto! denotando x


como la media muestral observada $ suponiendo que adoptamos la siguiente regla de
decisin' 2ec/a0ar W
4
si
n
x

0
: 0

entonces! la probabilidad de rec/a0ar W


4
cuando es
cierta ser ! luego es el nivel de significacin del contraste basado en esta regla de
decisin.
Un contraste para la media de una poblacin normal' varian0a poblacional conocida.
&upongamos que disponemos de una muestra aleatoria de n observaciones de una
poblacin normal con media $ varian0a
"
conocida. &i la media muestral observada es
x ! entonces! un contraste con nivel de significacin de de la /iptesis nula W
4
' (
4
frente a la alternativa W

' :
4
se obtiene con la regla de decisin 2ec/a0ar W
4
si
n
x

0
: 0

donde 0

es el n#mero para el cual 7*X : 0


4
, ( $ X es una variable
aleatoria normal estndar.
1l rebajar el nivel de significacin! estamos reduciendo la probabilidad de rec/a0ar una
/iptesis nula cierta $! en consecuencia! estamos modificando la regla de decisin para
/acer menos verosmil que se rec/ace la /iptesis mula! tanto si es cierta como si no.
Nbviamente! cuanto menor sea el nivel de significacin al cual puede rec/a0arse una
/iptesis nula! ma$or ser la duda sobre su veracidad. %n lugar de contrastar /iptesis
con niveles de significacin asignados de antemano! los investigadores suelen denominar
el menor nivel de significacin al cual puede rec/a0arse la /iptesis nula.
Definicin.
%l menor nivel de significacin al cual puede rec/a0arse una /iptesis nula se denomina
valor crtico o p-valor del contraste.
&upongamos que en lugar de una /iptesis nula simple! queremos contrastar la /iptesis
nula compuesta W
4
' M
4
frente a la alternativa W

' :
4
al nivel de significacin .
7ara la regla de decisin desarrollada en el caso de la /iptesis nula simple! vimos que si
la media de la poblacin es precisamente
4
! entonces! la probabilidad de rec/a0ar la
/iptesis nula es . 7ara esta misma regla de decisin! si la verdadera media de la
poblacin es menor que
4
parece a#n menos verosmil rec/a0ar la /iptesis nula. 7or
tanto! usar esta regla de decisin en el presente contexto garanti0a que la probabilidad de
rec/a0ar la /iptesis nula compuesta cuando es cierta es como muc/o .
Un contraste para la media de una distribucin normal *varian0a conocida,' /iptesis nula
$ alternativa compuesta.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
%l procedimiento adecuado para contrastar! al nivel de significacin de ! la /iptesis nula
W
4
' M
4
frente a la alternativa W

' :
4
es exactamente el mismo que cuando la
/iptesis nula es W4' (
4
.
Aonsideremos a/ora el problema de contrastar la /iptesis nula simple W
4
' (
4
frente
a la alternativa compuesta de que la verdadera media es menor que
4
! es decir! W

' M

4

%n esta situacin! se suscitara una duda sobre la /iptesis nula si la media muestral
fuese muc/o menor que la media poblacional postulada. Una ve0 ms! si la /iptesis
nula fuera cierta! la variable aleatoria seguira una distribucin normal estndar. para
conseguir un contraste con nivel de significacin slo necesitamos advertir que 7*X M
50

, ( si X es una variable aleatoria normal estndar. 7or tanto! si x es la media


muestral observada! la regla de decisin adecuada es 2ec/a0ar W
4
si
n
x

0
M 50


Aontraste para la media de una distribucin normal' varian0a poblacional conocida.
&upongamos que disponemos de una muestra aleatoria de n observaciones de una
poblacin normal con media $ varian0a conocida
"
. si la media muestral observada es
x ! un contraste con nivel de significacin para cualquiera de las dos /iptesis nula
siguientes W
4
' (
4
o W
4
' :
4
frente a la alternativa W

' M
4
se obtiene con la
regla de decisin 2ec/a0ar W
4
si
n
x

0
M 50
4
Aonsideremos a/ora el contraste de la /iptesis nula W
4
' (
4
frente a la alternativa
bilateral W

'
4
1qu! se asume que el investigador no tiene una poderosa ra0n para sospec/ar
desviaciones /acia un solo lado de la media poblacional postulada. &e pondr en duda la
/iptesis nula si se observa una media muestral muc/o ma$or o muc/o menor que
4
.
una ve0 ms! si la /iptesis nula es cierta! la variable aleatoria tiene distribucin normal
estndar. para obtener un contraste con nivel de significacin ! obsrvese que bajo la
/iptesis nula 7*X : 0
-"
, ( -" $ 7*X M 50
-"
, ( -"
7or tanto! la probabilidad de que X sea ma$or que 0
-"
o menor que 0
-"
es . De aqu se
sigue que con la regla de decisin 2ec/a0ar W
4
si
n
x

0
es ma$or que 0
-"
o menor que
50
-"
se obtiene un contraste de nivel .
Aontraste para la media de una distribucin normal frente a una alternativa bilateral'
varian0a poblacional conocida.
&upongamos que disponemos de una muestra aleatoria de n observaciones de una
poblacin normal con media $ varian0a conocida
"
. &i la media muestral observada es
x ! entonces! un contraste con nivel de significacin de de la /iptesis nula W
4
' (
4
frente a la alternativa bilateral W

'
4
se obtiene con la regla de decisin 2ec/a0ar W
4
si
n
x

0
: 0
-"
o
n
x

0
M 50
-"
Aontrastes para la media' tama@os muestrales grandes.
&upongamos que disponemos de una muestra aleatoria de n observaciones de una
poblacin con media $ varian0a
"
. &i el tama@o de la muestra n es grande *C4 o ms,!
los procedimientos de contraste desarrollados para el caso en el que la varian0a
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
poblacional es conocida pueden emplearse cuando es desconocida! reempla0ando
"
por
la varian0a muestral observada s
x
"
. adems! estos procedimientos resultan
aproximadamente vlidos incluso si la distribucin de la poblacin no es normal.
Contrastes para la media de una distribucin normal: 2arianza poblacional
desconocida.
&upongamos el problema de una muestra aleatoria de n observaciones tomadas de una
poblacin normal en el que se quiere contrastar una /iptesis sobre la media poblacional
. &in embargo! la varian0a poblacional es desconocida.
Wemos visto que si la media $ la varian0a muestrales se denotan por X $ s
x
"
! la variable
aleatoria t
n5
(
n s
X
x

sigue una distribucin t de &tudent con *n 6 , grados de libertad.
Aontraste para la media de una distribucin normal' varian0a poblacional desconocida.
&upongamos que disponemos de una muestra aleatoria de n observaciones de una
poblacin normal con media . &i la media muestral $ la desviacin tpica observadas son
x $ s
x
"
! entonces los siguientes contrastes tienen nivel de significacin '
1. 7ara contrastar una de las /iptesis nulas W
4
' (
4
o W
4
' M
4
frente a la
alternativa W

' :
4
la regla de decisin es 2ec/a0ar W
4
si
n s
x
x
0
: t
n5t!
2. 7ara contrastar una de las /iptesis nulas W
4
'
4
o W
4
' :
4
frente a la
alternativa W

' M
4
la regla de decisin es 2ec/a0ar W
4
si
n s
x
x
0
M 5t
n5!
3. 7ara contrastar la /iptesis nula W
4
' (
4
frente a la alternativa bilateral W

'
4
la regla de decisin es 2ec/a0ar W
4
si
n s
x
x
0
: t
n5t!
o
n s
x
x
0
M 5t
n5!
1qu! t
n5!
es el n#mero para el cual 7*t
n5
: t
n5!
, ( donde la variable aleatoria t
n5
sigue
una distribucin t de &tudent con *n 6 , grados de libertad.
Contrastes para la varianza de una distribucin normal.
%s natural basar los contrastes de /iptesis sobre la varian0a poblacional
"
en la
varian0a muestral s
x
"
. la base para desarrollar los contrastes particulares se apo$a en el
/ec/o de que la variable aleatoria
"
n5
( )*n 6 ,s
x
"
. -
"
sigue una distribucin A/i
cuadrado con *n 6 , grados de libertad. &i la /iptesis nula es que la varian0a de la
poblacin es igual a cierto valor especfico
4
"
! es decir! W
4
'
"
(
4
"
entonces! cuando la
/iptesis nula es cierta! la variable aleatoria
"
n5
( )*n 6,s
x
"
. -
4
"
sigue una distribucin
A/i cuadrado con *n 6, grados de libertad. &i la /iptesis alternativa es que la
verdadera varian0a supera a
4
"
! deberamos desconfiar de la /iptesis nula si la varian0a
muestral observada fuese muc/o ma$or que
4
"
. por tanto! rec/a0aramos la /iptesis
nula si observramos un valor alto de
"
n5
. 7or el contrario! si la /iptesis alternativa es
que la varian0a de la poblacin es menor que el valor que se especifica en la /iptesis
nula! sta se rec/a0ara para valor bajo. 7or #ltimo! para la alternativa bilateral de que la
varian0a poblacional difiere de
4
"
! rec/a0aramos la /iptesis nula s observramos
valores de
"
n5
inusualmente altos o bajos.
Denotamos por
"
!
el n#mero tal que la probabilidad de que una variable aleatoria A/i
cuadrado con grados de libertad lo supere es . %s decir! 7*
"

:
"
!
, ( De donde
se deduce que 7*
"

M
"
!5
, ( $ que 7*
"

:
"
!-"
, o
"

M
"
!5-"
, (
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Aontraste para la varian0a de una poblacin normal.
&upongamos que disponemos de una muestra de n observaciones de una poblacin
normal con varian0a
"
. si la varian0a muestral observada es s
x
"
! entonces! los siguientes
contrastes tienen nivel de significacin '
1. 7ara contrastar una de las /iptesis nulas W
4
'
"
(
4
"
o W
4
'
"
M
4
"
frente a la
alternativa W

'
"
:
4
"
la regla de decisin es 2ec/a0ar W
4
si )*n 6 ,s
x
"
. -
4
"
:
"
n5!
2. 7ara contrastar una de las /iptesis nulas W
4
'
"
(
4
"
o W
4
'
"
:
4
"
frente a la
alternativa W

'
"
M
4
"
la regla de decisin es 2ec/a0ar W
4
si )*n 6 ,s
x
"
. -
4
"
M
"
n5!5

3. para contrastar la /iptesis nula W


4
'
"
(
4
"
frente a la alternativa bilateral W

'
"

4
"
la regla de decisin es 2ec/a0ar W
4
si )*n 6 ,s
x
"
. -
4
"
:
"
n5!-"
o )*n 6 ,s
x
"
. -
4
"
M

"
n5!5-"
1qu!
"
n5!
es el n#mero para el cual 7*
"
n5
:
"
n5!
, ( donde la variable aleatoria
"
n5
sigue una distribucin A/i cuadrado con *n 6 , grados de libertad.
Contrastes para la proporcin poblacional 5$uestras !randes6.
La inferencia sobre la proporcin poblacional se basa en la proporcin de individuos de
una muestra aleatoria que poseen el atributo de inters.
Denotando por p la proporcin poblacional $ por \p
x
la proporcin en una muestra
aleatoria de n observaciones! sabemos que si el tama@o de la muestra es grande!
entonces es una buena aproximacin decir que la variable aleatoria X (
n p p
p px
/ ) . 1 (
^
tiene
una distribucin normal estndar. La distribucin muestral de la proporcin muestral es
aproximadamente normal cuando el tama@o muestral es grande! de acuerdo con el
teorema central del lmite.
&i la /iptesis nula es que la proporcin es igual a cierto valor especfico p
4
! resulta que
cuando esta /iptesis es cierta! la variable aleatoria X (
n p p
p px
/ ) . 1 (
^
0 0
0
sigue una
distribucin normal estndar.
Aontraste para la proporcin poblacional *8ama@os muestrales grandes,.
&upongamos que disponemos de una muestra aleatoria de n observaciones de una
poblacin! una proporcin p de cu$os miembros posee un atributo particular. %ntonces! si
el n#mero de observaciones de la muestra es grande *B4 o ms, $ la proporcin muestral
observada es \p
x
! los siguientes contrastes tienen nivel de significacin '
1. 7ara contrastar una de las /iptesis nulas W
4
' p ( p
4
o W
4
' p M p
4
frente a la
alternativa W

' p : p
4
la regla de decisin es 2ec/a0ar W
4
si
n p p
p px
/ ) 1 (
^
0 0
0

: 0

2. 7ara contrastar una de las /iptesis nulas W


4
' p ( p
4
o W
4
' p : p
4
frente a la
alternativa W

' p M p
4
la regla de decisin es 2ec/a0ar W
4
si
n p p
p px
/ ) 1 (
^
0 0
0

M 50

3. 7ara contrastar la /iptesis nula W


4
' p ( p
4
frente a la alternativa bilateral W

' p p
4
la regla de decisin es 2ec/a0ar W
4
si
n p p
p px
/ ) 1 (
^
0 0
0

: 0
-"
o
n p p
p px
/ ) 1 (
^
0 0
0

M 50
-"
1qu! 0

es el n#mero para el cual 7*X : 0

, ( donde la variable aleatoria 0



tiene
distribucin normal estndar.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Contrastes para la diferencia entre dos medias.
Contrastes basados en datos pareados.
Aontrastes para la diferencia de medias' datos pareados.
&upongamos que disponemos de una muestra aleatoria de n pares de observaciones de
distribuciones con medias
x
$
$
. Denotemos por d $ por s
d
la media muestral $ la
desviacin tpica observadas para las n diferencias *x
i
6 $
i
,. &i la distribucin poblacional
de las diferencias es normal! entonces! los siguientes contrastes tienen nivel de
significacin '
1. 7ara contrastar una de las /iptesis nulas W
4
'
x
5
$
( D
4
o W
4
'
x
5
$
M D
4
frente a
la alternativa W

'
x
5
$
: D
4
la regla de decisin es 2ec/a0ar W
4
si
n s
D d
d
0
: t
n5!
2. 7ara contrastar una de las /iptesis nulas W
4
'
x
5
$
( D
4
o W
4
'
x
5
$
: D
4
frente a
la alternativa W

'
x
5
$
M D
4
la regla de decisin es 2ec/a0ar W
4
si
n s
D d
d
0
M 5t
n5!
3. 7ara contrastar la /iptesis nula W
4
'
x
5
$
( D
4
frente a la alternativa bilateral W

'
x
5

$
D
4
la regla de decisin es 2ec/a0ar W
4
si
n s
D d
d
0
M 5t
n5!-"
o
n s
D d
d
0
: t
n5!-"
1qu! t
n5!
es el n#mero para el cual 7*t
n5
: t
n5!
, ( donde la variable aleatoria t
n5
sigue
una distribucin t de &tudent con *n 6 , grados de libertad.
Auando queremos contrastar la /iptesis nula de que las dos medias poblacionales son
iguales! tomamos D
4
( 4 en las frmulas.
Contrastes basados en muestras independientes.
&upongamos que disponemos de una muestra aleatoria de n
x
observaciones de una
poblacin normal con media
x
$ varian0a
x
"
! $ una muestra aleatoria! independiente de
la anterior de n
$
observaciones de una poblacin normal con media
$
$ varian0a
$
"
.
&i se denotan las medias muestrales por Y e X ! entonces la variable aleatoria X (
y
y
x
x
y x
n n
Y X
2 2
) ( ) (


+

tiene una distribucin normal estndar. aracias al teorema central
del lmite! si los dos tama@os muestrales son grandes! el resultado sigue siendo una
buena aproximacin cuando se sustitu$en las varian0as poblacionales por las muestrales!
incluso cuando las distribuciones poblacionales no son normales.
Aontrastes para la diferencia de medias' muestras independientes *Varian0as conocidas o
tama@os muestrales grandes,.
&upongamos que disponemos de muestras independientes de n
x
$ n
$
observaciones de
distribuciones normales con medias
x
$
$
! $ varian0as
x
"
$
$
"
. si las medias muestrales
observadas son
y e x
! entonces! los siguientes contrastes tienen nivel de significacin
'
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
1. 7ara contrastar una de las /iptesis nulas W
4
'
x
5
$
( D
4
o W
4
'
x
5
$
M D
4
frente a
la alternativa W

'
x
5
$
: D
4
la regla de decisin es 2ec/a0ar W
4
si
y
y
x
x
n n
D y x
2 2
0

+

: 0

2. 7ara contrastar una de las /iptesis nulas W


4
'
x
5
$
( D
4
o W
4
'
x
5
$
: D
4
frente a
la alternativa W

'
x
5
$
M D
4
la regla de decisin es 2ec/a0ar W
4
si
y
y
x
x
n n
D y x
2 2
0

+

M 50

3. 7ara contrastar la /iptesis nula W


4
'
x
5
$
( D
4
frente a la alternativa bilateral W

'
x
5

$
D
4
la regla de decisin es 2ec/a0ar W
4
si
y
y
x
x
n n
D y x
2 2
0

+

M 50
-"
o
y
y
x
x
n n
D y x
2 2
0

+

: 0
-"
&i los tama@os muestrales n
x
$ n
$
son grandes *C4 o ms,! entonces! para obtener
contrastes al nivel de significacin para la diferencia de medias! resulta una buena
aproximacin reempla0ar las varian0as poblacionales por las muestrales! s
x
"
$ s
$
"
. para
tama@os muestrales grandes! estas aproximaciones resultan satisfactorias incluso cuando
las distribuciones poblacionales no son normales.
Aontrastes para la diferencia de medias de dos poblaciones normales' muestras
independientes! varian0as poblacionales iguales.
&upongamos que disponemos de muestras independientes de n
x
$ n
$
observaciones de
distribuciones normales con medias
x
$
$
! $ una varian0a com#n. &i las varian0as
muestrales observadas son s
x
"
$ s
$
"
! un estimador de la varian0a poblacional com#n se
obtiene mediante s
"
( )*n
x
6 ,s
x
"
+ *n
$
6 ,s
$
"
. - *n
x
+ n
$
6 ",
%ntonces! si las medias muestrales son
y e x
! los siguientes contrastes tienen nivel de
significacin '
1. 7ara contrastar una de las /iptesis nulas W
4
'
x
5
$
( D
4
o W
4
'
x
5
$
M D
4
frente a
la alternativa W

'
x
5
$
: D
4
la regla de decisin es 2ec/a0ar W
4
si
s
y x
y x
n n
n n
D y x
+
0
: t
nx+n$5
"!
2. 7ara contrastar una de las /iptesis nulas W
4
'
x
5
$
( D
4
o W
4
'
x
5
$
: D
4
frente a
la alternativa W

'
x
5
$
M D
4
la regla de decisin es 2ec/a0ar W
4
si
s
y x
y x
n n
n n
D y x
+
0
M 5t
nx+n$5
"!
3. 7ara contrastar la /iptesis nula W
4
'
x
5
$
( D
4
frente a la alternativa bilateral W

'
x
5

$
D
4
la regla de decisin es 2ec/a0ar W
4
si
s
y x
y x
n n
n n
D y x
+
0
M 5t
nx+n$5"!-"
o
s
y x
y x
n n
n n
D y x
+
0
:
t
nx+n$5"! -"
1qu! t
nx+n$5"!
es el n#mero para el cual 7*t
nx+n$5"
: t
nx+n$5"!
, ( donde t
nx+n$5"
tiene una
distribucin t de &tudent con *n
x
+ n
$
6 ", grados de libertad.
Contrastes para la diferencia entre dos proporciones 5muestras !randes6.
&upongamos que disponemos de dos muestras aleatorias independientes. La primera
consta de n observaciones de una poblacin cu$a proporcin de JxitosK es p
x
$ la
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
proporcin muestral resultante es \p
x
. La segunda consta de n
$
observaciones de una
poblacin cu$a proporcin de JxitosK es p
$
$ la proporcin muestral resultante es \p
$
.
&i los tama@os de las muestras son grandes! entonces es una buena aproximacin
considerar que la variable aleatoria X (
y
y y
x
x x
y x y x
n
p p
n
p p
p p p p
) 1 ( ) 1 (
) ( ) ^ (^


tiene una distribucin
normal estndar! en virtud del teorema central del lmite.
&upongamos que queremos contrastar la /iptesis de que las proporciones poblacionales
p
x
$ p
$
son iguales. &i denotamos por p
4
su valor com#n! entonces! bajo esta /iptesis!
tenemos que X (
=

y x
y x
n
p p
n
p p
p p
) 1 ( ) 1 (
) ^ (^
0 0 0 0

y x
y x
y x
n n
n n
p p
p p
) 1 (
) ^ (^
0 0
sigue!
aproximadamente! una distribucin normal estndar.
Rinalmente! la proporcin com#n desconocida p
4
puede estimarse mediante el estimador
\p
4
*que utili0a las dos proporciones muestrales, dado por \p
4
(
y x
y y x x
n n
p n p n
+
+ ^ ^
2eempla0ando el valor desconocido p
4
por \p
4
se obtiene una variable aleatoria cu$a
distribucin est prxima a la normal estndar! dado que los tama@os muestrales son
grandes.
Aontrastes para la igualdad de dos proporciones poblacionales *?uestras grandes,.
Denotemos por \p
x
la proporcin de xitos en una muestra aleatoria de n
x
observaciones
de una poblacin cu$a proporcin de xitos es p
x
$ \p
$
la proporcin de xitos observados
en una muestra aleatoria independiente de n
$
observaciones de una poblacin cu$a
proporcin de xitos es p
$
. &i se formula la /iptesis de que las proporciones
poblacionales son iguales! un estimador de la proporcin com#n se obtiene mediante \p
4
(
y x
y y x x
n n
p n p n
+
+ ^ ^
%ntonces! si los tama@os muestrales son grandes *B4 o ms,! los siguientes contrastes
tienen nivel de significacin '
1. 7ara contrastar una de las /iptesis nulas W
4
' p
x
5 p
$
( 4 o W
4
' p
x
5 p
$
M 4 frente a la
alternativa W

' p
x
5 p
$
: 4 la regla de decisin es 2ec/a0ar W
4
si

y x
y x
y x
n n
n n
p p
p p
) ^ 1 ( ^
) ^ (^
0 0
: 0

2. 7ara contrastar una de las /iptesis nulas W


4
' p
x
5 p
$
( 4 o W
4
' p
x
5 p
$
: 4 frente a la
alternativa W

' p
x
5 p
$
M 4 la regla de decisin es 2ec/a0ar W
4
si

y x
y x
y x
n n
n n
p p
p p
) ^ 1 ( ^
) ^ (^
0 0
M 50

3. 7ara contrastar la /iptesis nula W


4
' p
x
5 p
$
( 4 frente a la alternativa bilateral W

' p
x
5
p
$
4 la regla de decisin es 2ec/a0ar W
4
si

y x
y x
y x
n n
n n
p p
p p
) ^ 1 ( ^
) ^ (^
0 0
M 50
-"
o

y x
y x
y x
n n
n n
p p
p p
) ^ 1 ( ^
) ^ (^
0 0
: 0
-"
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
Contraste de i!ualdad de varianzas de dos poblaciones normales.
&ea s
x
"
la varian0a muestral de una muestra aleatoria de n
x
observaciones de una
poblacin normal con varian0a
x
"
! $ s
$
"
la varian0a muestral de una muestra aleatoria
independiente de n
$
observaciones de una poblacin normal con varian0a
$
"
. %ntonces!
la variable aleatoria R ( *s
x
"
-
x
"
, - *s
$
"
-
$
"
, sigue una distribucin conocida como
distribucin 1.
2ecordemos que los grados de libertad asociados con la varian0a muestral s
x
"
son *n
x
6 ,
$ con s
$
"
! *n
$
6 ,. La variable aleatoria R tiene una funcin de densidad asimtrica!
definida slo para valores no negativos.
La distribucin R.
&upongamos que se toman muestras aleatorias independientes de n
x
$ n
$
observaciones
de dos poblaciones normales con varian0a
x
"
$
$
"
. si las varian0as muestrales son s
x
"
$
s
$
"
! entonces! la variable aleatoria R ( *s
x
"
-
x
"
, - *s
$
"
-
$
"
, tiene distribucin 1 con *n
x
6 ,
grados de libertad en el numerador $ *n
$
6 , grados de libertad en el denominador.
Una distribucin R con

grados de libertad en el numerador $


"
grados de libertad en el
denominador se denotar R
!".
Denotaremos por R
!"!
el n#mero para el cual 7*R
!"
:
R
!"!
, (
Aontrastes de igualdad de varian0a de dos poblaciones normales.
&ean s
x
"
$ s
$
"
las varian0as muestrales observadas en dos muestras aleatorias
independientes de n
x
$ n
$
observaciones de poblaciones normales con varian0as
x
"
$
$
"
.
&i s
x
"
es ma$or que s
$
"
! entonces los siguientes contrastes tienen nivel de significacin '
. 7ara contrastar una de las /iptesis nulas W
4
'
x
"
(
$
"
o W
4
'
x
"
M
$
"
frente a la
alternativa W

'
x
"
:
$
"
la regla de decisin es 2ec/a0ar W
4
si s
x
"
- s
$
"
: R
nx5!n$5!
". 7ara contrastar la /iptesis nula W
4
'
x
"
(
$
"
frente a la alternativa bilateral W

'
x
"

$
"
la regla de decisin es 2ec/a0ar W
4
si s
x
"
-s
$
"
: R
nx5!n$5!-"
donde s
x
"
es la ma$or de
las dos varian0as muestrales.
1qu! R
nx5!n$5!
es el n#mero para el cual 7*R
nx5! n$5
: R
nx5!n$5!
, ( donde R
nx5!n$5
tiene
una distribucin R con *n
x
6 , grados de libertad en el numerador $ *n
$
6 , grados de
libertad en el denominador.
$edicin de la potencia de un contraste.
Contrastes para la media de una distribucin normal: varianza poblacional
conocida.
&upongamos que contrastamos la /iptesis nula de que la media de una poblacin
normal es igual a cierto valor especfico
4
. La probabilidad! ! de cometer un error de
8ipo TT depender de la verdadera media poblacional. %sta probabilidad puede calcularse
como sigue'
. 7ara la regla de decisin del contraste! determinar el rango de valores de la media
muestral que conducen a la aceptacin de la /iptesis nula.
". 7ara el valor

de inters de la media poblacional! /allar la probabilidad de que la


media muestral pertene0ca al intercalo de aceptacin determinada anteriormente! para
muestras de n observaciones de una poblacin con media

.
Cedido por el TURCO
FACULTAD DE CIENCIAS ECONOMICAS
FRANJA MORADA - CONDUCCION
La funcin de potencia tiene las siguientes propiedades'
. &i todo lo dems permanece igual! cuanto ms lejos se /alle la verdadera media

de
la media postulada
4
! ma$or ser la potencia del contraste.
". &i todo lo dems permanece igual! cuanto menor sea el nivel de significacin del
contraste! menor ser la potencia. %n otras palabras! al reducir la probabilidad de
cometer un error de 8ipo T aumentamos la de cometer un error de 8ipo TT.
C. &i todo lo dems permanece igual! cuanto ma$or sea la varian0a de la poblacin!
menor ser la potencia del contraste. 8enemos menos esperan0as de detectar
peque@as desviaciones de la media postulada cuando /a$ muc/a variabilidad en la
poblacin.
B. si todo lo dems permanece igual! cuanto ma$or sea el tama@o de la muestra! ma$or
ser la potencia del contraste. Auanta ms informacin se obtenga de la poblacin!
/abr ma$ores posibilidades de detectar cualquier desviacin de la /iptesis nula.
Contrastes para proporciones poblacionales 5muestras !randes6.
7odemos contrastar Qa /iptesis nula de que la proporcin de elementos de una
poblacin que poseen un atributo es una cantidad especfica p
4
.
La probabilidad ! de incurrir en un error de 8ipo TT para una proporcin poblacional dada
se /alla de la siguiente manera'
. 1 partir de la regla de decisin del contraste! /allar el intervalo de valores de la
proporcin muestral que condice a la aceptacin de a /iptesis nula.
". 7ara el valor p

de inters de la proporcin poblacional! /allar la probabilidad de que la


proporcin poblacional se encuentre en el intervalo de aceptacin determinado
anteriormente para muestras de n observaciones cuando la proporcin poblacional es
p

.
Cedido por el TURCO

You might also like