Clases Teoricas 2013

20
Ctedra: Probabilidad y Estadstica

Carrera: Ingeniera en Sistemas de informacion
Materia: Probabilidades y Estadsticas

Cuaderno de Clases

Prof.Adjunto Arturo Eduardo Lpez
Prof.Adjunto Mara Ins Pastorino
Prof.JTP Silvia Bravo
Prof.JTP Jos Alberto Ibrahim

Ao 2013

21

PROBABILIDAD Y ESTADSTICA
PROGRAMA ANALTICO

Tema 1: Estadstica Descriptiva:
Frecuencias de una muestra - Distribuciones y propiedades de las frecuencias -
Representaciones grficas: grficas de lneas, histogramas y polgonos de frecuencias
- Medidas de posicin: modo, mediana, media y sus propiedades. Medidas de
variabilidad: varianza y desviacin estndar y sus propiedades. Medida de asimetra.

Tema 2: Introduccin a la Probabilidad:
Concepto de Probabilidades - Definiciones de Espacio muestral, Sucesos o eventos -
Definicin Clsica o de Laplace - Relacin entre frecuencia y probabilidad -
Formulacin axiomtica de probabilidad - Consecuencias de los axiomas - Probabilidad
condicional - Eventos independientes -Teorema de Bayes.

Tema 3: Variables Aleatorias:
Definicin de variables aleatorias - Tipo de variables - Distribuciones Discretas y
Continuas y sus correspondientes: Funciones de Probabilidad y Distribucin -
Propiedades - Distribuciones Discretas: Uniforme, Bernoulli, Binomial, Hipergeomtrica
- Distribuciones Continuas: Rectangular, t-Student, Chi-cuadrado, F-Snedecor - Uso de
tablas estadsticas.

Tema 4: Caractersticas de Variables Aleatorias:
Esperanza matemtica de una variable aleatoria y de una funcin - Propiedades de la
esperanza matemtica - Definiciones: media, varianza, desvo estndar, sesgo -
Propiedades de media, varianza, desvo estndar - Media y Varianza de las
distribuciones estudiadas. Teoremas de combinacin lineal de variables - Variable
aleatoria estandarizada - Variable aleatoria normal estandarizada

Tema 5: Conceptos bsicos de la Inferencia Estadstica:
Poblacin y Muestra y sus correspondientes caractersticas - Muestreo en general -
Distribucin muestral de algunos estadsticos: Media muestral, variable estandarizada,
Suma de cuadrados de v.a. normales estndares. Suma de v.a. con distribucin chi-
cuadrado - Distribucin de la variable (n-1)S/\n y otras - Teorema Central del Lmite.

Tema 6: Estimacin de Parmetros:
Concepto de estimacin puntual de parmetros - Propiedades de los estimadores:
Insesgamiento y Eficiencia - Concepto de estimacin por Intervalos de confianza -
Intervalos de confianza para la media y la varianza de una poblacin - Intervalos de
Confianza para las diferencias de medias y el cociente de varianzas de dos
poblaciones.

Tema 7: Test de Hiptesis Paramtricos:
Conceptos de prueba o test de hiptesis, hiptesis nula y alternativa, regin crtica,
nivel de significacin, errores Tipo I y II - Test unilaterales y bilaterales - Efectos de
cambios en el tamao de la muestra - Test de hiptesis sobre media y varianza de una
poblacin - Test de hiptesis para diferencia de medias y cociente de varianzas de dos
poblaciones.

22

Bibliografa

- Probabilidad y Estadstica para Ingenieros
R.E.Walpole, R.H.Myers y S.L.Myers - Ed. Pearson - Prentice Hall - 1999 Mxico

- Estadstica para Ingenieros
Bowker y Lieberman - Ed. Prentice Hall - 1986 - Mjico

- Probabilidad y Estadstica en Ingeniera Civil
Jack R. Benjamn - Ed. McGraw Hill - Madrid

- Estadstica Bsica en Administracin. Conceptos y Aplicaciones
Mark L. Berenson y David M. Levine - Ed. Pearson - Prentice Hall - 1999 Mxico

- Introduccin a la Estadstica Matemtica
E. Kreyszig - Ed. Limusa - Mjico

Nota: A lo largo del desarrollo de la materia se trabajar simultneamente con distintos
software de estadstica y/o planillas de clculo, realizando las aplicaciones segn los
temas desarrollados.
.
Importante

Para el desarrollo de los distintos temas que comprende la presente materia,
se realizar para cada tema un resumen orientador que le permita al estudiante tener
una gua y que debe ser leda conjuntamente con las distintas bibliografas
recomendadas en clase.

Es importante que en todos los casos recurran a los libros para estudiar y
analizar en detalle cada uno de los temas que abarca la materia, puesto que incluso
varios de los mismos no se encuentran en el resumen que daremos. El estudiante
deber tomar este desarrollo como una gua para su correspondiente estudio en la
bibliografa recomendada tanto en cada Tema como en la Bibliografa general.

Es necesario chequear siempre todos los temas consignados en el
Programa Analtico.

Gua de Estudio
Grandes Temas de la Estadstica

Ahora bien los temas principales son:

1. Estadstica Descriptiva
2. Probabilidades
3. Estadstica Inferencial

23
Clase N 1
Estadstica Descriptiva
En este tema es importante distinguir y organizar la tarea que significa la recoleccin de
los datos u observaciones.
Antes de comenzar con este captulo, incorporemos las definiciones de Poblacin y
Muestra.
La recopilacin de datos la realizaremos a partir de una Poblacin o Universo, cuyo
concepto nos lleva a pensar en un conjunto cualquiera de objetos, personas o
acontecimientos, mediciones u observaciones. En algunas oportunidades obtener los
datos de una poblacin puede ser fcil, por ej., los estudiantes de una clase de
estadstica que tienen 20 aos, en este caso se trata de una poblacin finita y pequea,
pero en otras oportunidades podemos encontrarnos frente a poblaciones infinitas, por
ej., el nmero de observaciones o mediciones de la distancia entre 2 alcantarillas, es
claro que no podemos definir esto en un nmero finito ya que podemos medir la misma
distancia indefinidamente, es decir sera una poblacin infinita.

Como sera imposible pretender trabajar con un conjunto infinito de
mediciones, es que trabajaremos con Muestras, esta se define como un subconjunto
de la Poblacin en estudio que contiene elementos representativos de la misma.

Ahora bien, consideremos que tenemos ya planteado el problema de
investigacin y debemos llevar a cabo su anlisis. Una vez planteado el problema
debemos ver qu necesitamos:

1. Recopilar datos concernientes al problema planteado
2. Organizar los datos recopilados para la presentacin
3. Presentar los datos organizados en una forma fcil de leer
4. Analizar los datos presentados
5. Interpretar los resultados del anlisis lo cual nos conducir a una conclusin y
no olvidemos que una buena interpretacin le permitir al usuario tomar
decisiones

Es muy importante realizar una muy buena determinacin del tamao de la
muestra, para poder dar luego una opinin acerca del experimento o investigacin, que
se lleva a cabo, es decir que sus resultados nos servirn para describir, estimar o
predecir las caractersticas de la poblacin en estudio.
Tipos de Datos:

Continuas: son medibles, ej. Peso, talla, altura, temperatura,
tenemos asociados los nmeros reales.

Discretas: recuentos, ej, nmeros de hijos, nmeros de personas,
tenemos asociados los nmeros naturales.

Variables

24
Distribucin de Frecuencias
Conceptos de Frecuencias Absoluta, Relativa y Relativa Acumulada:
Consideremos el experimento de pesar 10 prismas de teodolito, cuyos datos son:

0.53 0.51 0.52 0.50 0.52 0.53 0.54 0.55 0.53 0.54

con estos datos as como estn dados sera imposible trabajar por lo tanto ordenamos
los mismos en una tabla de menor a mayor: Escribimos los valores no repetidos en la
1ra. Columna, agrupamos de acuerdo al comportamiento de los valores x
j
, se tiene as
lo que llamaremos distribucin de frecuencias.

Ahora podemos ver claramente que 3 prismas de los 10 pesan 0.53 gr, slo
1 pesa 0.50 gr y tambin podemos asegurar que ningn prisma pes ms de 0.55 gr.

Calcularemos ahora las frecuencias, podemos ver que en el ejemplo hay n
(=10) observaciones, de las cuales hay m (=6) valores numricamente distintos, tal que
se cumple que m s n.

Ahora bien, el N de veces que se presenta una observacin x
j
se llama
frecuencia absoluta de esa observacin x
j
. En la columna de conteo colocamos
tantas marcas como frecuencia absoluta tengamos de esta forma estaremos
aplicando el llamado mtodo de Tukey, tambin conocido con el nombre de diagrama
de tallo y hojas. Si ahora observamos este diagrama podemos apreciar el
comportamiento grfico de la distribucin de frecuencias.

Consideremos ahora el siguiente cociente: fcia. absoluta de x
j

f(x
j
) =
n total de observaciones

definimos as la frecuencia relativa.

x
j

Conteo Fcia.
Absoluta
f
Fcia. Relativa
f(x
j
)
Fcia. Relativa
Acumulada
0.50 I 1 0.1 0.1
0.51 I 1 0.1 0.2
0.52 I I 2 0.2 0.4
0.53 I I I 3 0.3 0.7
0.54 I I 2 0.2 0.9
0.55 I 1 0.1 1
f = 10 f(x
j
) = 1

En nuestro ej. la frecuencia relativa de x
4
= 0.53 es f(0.53) = 3 / 10 = 0.3. De
esta forma determinamos las frecuencias relativas para este caso.

25
Para obtener la frecuencia relativa acumulada de una determinada x = x
j
,
sumamos todas las frecuencias relativas correspondientes a los valores de las
observaciones que son menores o iguales al elegido x
j
, es decir:

F(x) = x
j

xjsx

volvamos al ejemplo y hagamos x = x
3
,entonces

F(x
3
) = x
j
= f(x
1
) + f(x
2
) + f(x
3
) = 0.1 + 0.1 + 0.2 = 0.4
xjsx3

Las propiedades de la funcin frecuencia relativa son: 1) 0 s f(x
i
) s 1 y 2) f(x
i
) = 1
x
i

Para el ejemplo que acabamos de ver utilizamos una variable continua, ya
que eran pesos de prismas de un teodolito. Los mismos conceptos se pueden aplicar a
variables discretas.
Representaciones grficas
Otros tipos de grficos que representan los datos de manera tal que nos
puede dar una idea del tipo de distribucin, de acuerdo al tipo de variables son:

1. Histogramas (v. continua)
2. Polgonos de frecuencias (v. continua)
3. Diagramas de lneas (v. discreta)
El histograma es una grfica compuesta por rectngulos, cuya base tiene
como centro el valor observado y como valor la unidad y de altura el valor
correspondiente de frecuencia relativa y el rea que encierra cada rectngulo es igual a
la fraccin con que ocurre el valor x
i
respectivo.
La suma de las reas de todos los rectngulos debe ser igual a 1, de
acuerdo a la segunda propiedad de funcin frecuencia.
En cuanto al polgono de frecuencia debemos conectar por medio de lneas
rectas los puntos medios de la parte superior de los rectngulos expuestos en el
histograma y conserva la misma rea que el histograma.
El histograma correspondiente al ejemplo del peso de los prismas es:

0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.5 0.51 0.52 0.53 0.54 0.55
F
c
i
a
.

R
e
l
a
t
i
v
a

Valores
Histograma
Dist. De
Frecuencias

x
j

Fcia. Relativa
f(x
j
)
0.50 0.1
0.51 0.1
0.52 0.2
0.53 0.3
0.54 0.2
0.55 0.1

26
Incluir las prcticas correspondientes a este tema
Clase N 2 Medidas de las observaciones
Algunos de los distintos tipos de medidas de las observaciones o datos que
nos permiten saber algo respecto de ellas son:

a) Posicin
b) Variabilidad
c) Asimetra
a) Medidas de Posicin:
Estas pueden ser Modo, Mediana y Media, tambin hay
otras como las cuartilas (4 partes), decilas (10 partes), percentiles (100 partes), valor
mnimo, valor mximo, etc.
Las que usaremos ms frecuentemente son:
Modo:
Es el valor de la observacin o dato que aparece ms frecuentemente. El
modo puede no estar perfectamente determinado y adems puede haber uno o ms
modos, o sea que habr distribuciones unimodales, bimodales, etc.

Mediana:
Es el valor que divide el conjunto de observaciones o datos ordenados, en
dos partes iguales, es decir el 50 % a cada lado de ese valor.

Consideremos el siguiente conjunto de datos: x1, x2, x3, x4, ... , xn
son n datos, ahora los ordenamos de menor a mayor, para simbolizar los datos
ordenados pondremos entre parntesis los nmeros, es decir que tendremos:
x(1), x(2), x(3), x(4), ... , x(n)

Ahora deberemos tener en cuenta si n es par o impar para la determinacin
de la mediana:

i) Si n es impar
La mediana ser el valor del dato ordenado con subndice (n+1), o sea que: M
e
=
X
((n+1))
el cual es el valor central de los datos ordenados.

ii) Si n es par
En este caso la mediana no es nica, ya que tomar cualquier valor entre los dos
centrales entre los datos ordenados

X
(n)
< M
e
< X
((n+1))

En general es acostumbra tomar como mediana al valor que resulta de la media
aritmtica de los dos valores centrales, en consecuencia:

M
e
=

[X
(n)
+ X
((n+1))
]

27
Media:
Dado un conjunto de observaciones o datos la media viene dada por

n
x
i
x =
i=1

n
Propiedades de la Media:

1. a x = a x

2. b + x = b + x

3. a x + b = a x + b

b) Medidas de Variabilidad:
Supongamos haber mandado a dos personas a realizar
cierta observacin y nos entregan los siguientes datos:

10 20 60 y 28 29 33

Como podemos observar ambas tienen n = 3 y x = 30 . A pesar de
haber obtenido los dos la misma media, existe una diferencia esencial entre ellas, si
miramos las observaciones hechas por la primera persona podemos apreciar que los
valores se encuentran ms separados unos de otros, cosa que no sucede con las
observaciones hechas por la segunda persona, adems cada valor en el primer caso,
se encuentran ms separado de la media que en el segundo caso:

10 30, 20 30, 60 30 y 33 30, 28 30, 29 30

Con este ejemplo se ve claramente que la media de los datos no es una
medida que nos permita apreciar la calidad de los datos, en consecuencia se hace
necesario buscar una medida de variabilidad que pueda apreciar la diferencia de
calidad entre dos conjuntos de datos.

Es obvio que lo que nosotros necesitamos es escoger una cantidad que
mida la desviacin de los datos x
1
, x
2
, x
3
, x
4
, ... , x
n
con relacin a la media, de tal forma
que sean tenidos en cuenta todos los datos.

En base a lo arriba detallado pasamos a definir algunas de las medidas de
variabilidad, puede en el libro ver otras medidas que tambin son importantes.
Varianza
Definida como:
1
n
Var (x) = ( x
i
- x )
2

n - 1
i = 1

28

Desviacin o dispersin estndar:
Se define como la raz cuadrada positiva de la
varianza, es decir o (x) = + \ Var (x).

Propiedades de la Varianza

1. Var (x + a ) = Var (x) a = constante
2. Var (b x ) = b
2
Var (x) b = constante
3. Var (b x + a ) = b
2
Var (x)

Frmulas sin error de redondeo:

Volvamos a la frmula para la varianza:
S
2
=
1
) (
1
2
_
=
n
x x
n
i
i

Es conveniente escribir la ecuacin de la varianza de forma tal de no
introducirse "error de redondeo", es decir

S
2
=
(
(
(
(
(
|
.
|
\
|

i
i
i
i
n n
x
x
2
2
1
1

Si observa esta ecuacin se dar cuenta que la misma est slo en funcin de las
observaciones y no debe realizarse ninguna diferencia contra la media que pueda
nuevamente ocasionar error de redondeo. Como ejercicio adicional puede realizar el
desarrollo de la frmula anterior y llegar a esta ltima.

c) Medida de Asimetra: Sesgo: Se propone como medida de asimetra la
siguiente
X - M
0

=
o
es decir, que mediremos el sesgo con respecto al modo de la distribucin, vlido para
distribuciones unimodales y tendremos:
> 0 X - M
0
> 0 X > M
0
sesgo positivo
= 0 X - M
0
= 0

X = M
0
No hay sesgo
< 0 X - M
0
< 0 X < M
0
sesgo negativo

29
Observaciones:
No olvidemos que podemos expresar la media, la varianza y cualquier
otra medida en trminos de frecuencia relativa o tambin en forma directa de los datos.
Podemos tambin definir otras medidas de variabilidad que estudiaremos de cualquiera
de los libros que tengamos a mano.

Si revisamos los manuales de nuestras calculadoras veremos algunas de las
frmulas aqu planteadas, ya que estn en trminos de los datos y de esta forma
cometemos menos errores de clculo.

30
Clase N 3: Probabilidades y sus Distribuciones de Probabilidades:

Conceptos fundamentales de Probabilidades:

Hasta ahora trabajamos slo con los datos y con las definiciones de
frecuencias y medidas de una muestra o conjunto de datos y a travs de ellos
pudimos obtener informacin del comportamiento de los datos.

Ahora bien, la informacin que obtuvimos era slo de la muestra, o sea tan
slo del conjunto de datos que tenamos, pero sera interesante que pudiramos
obtener a partir de ellos una informacin general de toda la poblacin a la cual
pertenecen los mismos.

Para poder sacar conclusiones de las poblaciones debemos primero
desarrollar modelos matemticos de esas poblaciones y para ello es necesaria la
Teora de Probabilidades.

Una vez que hayamos visto los conceptos fundamentales de probabilidades,
se deducirn las distribuciones de probabilidades ms importantes. Estas son
distribuciones de los conjuntos de datos o muestra, que son empricas.

Muestra y Poblacin:

Cada experimento aleatorio nos permite obtener una sucesin de elementos
que forman lo que llamaremos una poblacin. Esta poblacin puede ser finita (conteo
de personas) o infinita (nmero de iguanas en Santiago del Estero).
A todo subconjunto de una poblacin lo llamaremos muestra.

Frecuencia y Probabilidad:

Hasta ahora manejamos ejemplos sacados de la experiencia y por lo tanto
sus resultados tambin eran obtenidos de la experiencia, es decir resultados empricos.

Todos los estudios fueron hechos en base a la funcin frecuencia , llamada
tambin probabilidad experimental o probabilidad estadstica.

A pesar de todo podramos tambin considerar ejemplos sin tener en cuenta
la experiencia, sino ciertas hiptesis y en este caso los estudios se harn bajo el
nombre de probabilidad terica.

Ahora bien, a la probabilidad experimental no se la puede conocer si no hay
ensayos u observaciones, mientras que a la probabilidad terica la podemos conocer
antes de hacer las observaciones, ms an, prescindiendo de ellas, esto sera trabajar
con un modelo.

31

La importancia prctica fundamental del clculo de probabilidades estriba en
que la probabilidad experimental y la probabilidad terica, cuando sta se puede
calcular y bajo condiciones muy amplias, tiende a coincidir cuando el nmero de
experimentos es grande. Si en un problema de lanzamientos de monedas se repite el
experimento un gran nmero de veces y se calcula la frecuencia relativa, ella tiende a
coincidir con la probabilidad terica, para saber el valor de la misma no hace falta
realizar el experimento o ensayo, ni repetirlo.

Sea p ( 0 < p < 1 ) la probabilidad de xito de un evento A en un
experimento aleatorio. Sea X la variable que indica el nmero de xitos en n ensayos
independientes. Entonces, la frecuencia relativa X/n converge a la probabilidad p
(puede ser usada indistintamente P). Es decir:
f (A) ~ p (A) = P (A)
Definicin de Probabilidad:

La probabilidad de un cierto evento A, P(A) es igual a la razn entre el
nmero de casos favorables (las veces que ocurre A) y el nmero de casos posibles.
Esto siempre que todos los casos sean igualmente posibles.
Supongamos que en un experimento de n casos, todos igualmente posibles,
podemos dividir en dos clases a estos casos, es decir, en k casos que me interesan y
en n k casos que no me interesan y ahora queremos saber cul es la probabilidad de
obtener los casos que me interesan y para ello hacemos:

A = nmeros de casos que me interesan

y por lo tanto
k n casos favorables
P(A) = =
n n casos posibles
o viceversa:
n k
P(no A) =
n
Definiciones:
Espacio Muestral, Experimento, Sucesos o Eventos, consideremos un
ejemplo, una bolsa con 5 bolillas que estn numeradas del 1 al 5, extraemos 2.

Al extraer 2 cintas podemos obtener los siguientes resultados:

(1,2) ; (1,3) ; (1,4) ; (1,5) ; (2,3) ; (2,4) ; (2,5) ; (3,4) ; (3,5) ; (4,5)

en este caso son diez resultados, al conjunto de todos ellos lo llamaremos espacio
muestral , es decir que:

S = { (1,2) ; (1,3) ; (1,4) ; (1,5) ; (2,3) ; (2,4) ; (2,5) ; (3,4) ; (3,5) ; (4,5) }

32

Ahora bien, supongamos que 3 de las 5 bolillas son verdes, es decir la 1, 2 y
3 y las bolillas 4 y 5 son rojas. Podemos realizar las extracciones siguientes:

A = ninguna bolilla verde = { (4,5) }
B = 1 verde y 1 roja = {(1,4) ; (1,5) ; (2,4) ; (2,5) ; (3,4) ; (3,5) }
C = ambas verdes = {(1,2) ; (1,3) ; (2,3) }

Como podemos observar A, B y C son conjuntos de resultados pero al
mismo tiempo son subconjuntos de S. A cada subconjunto de S lo llamaremos
evento.

Es decir que, el experimento consiste en la extraccin de 2 bolillas, cada
extraccin es un resultado y el conjunto de resultados u observaciones es el espacio
muestral , es decir que lo podemos definir como el conjunto de todos los resultados
posibles de un experimento y en consecuencia los eventos sern subconjuntos del
espacio muestral.

Aqu ser necesario realizar un repaso de la teora de conjuntos, en especial
las operaciones entre conjuntos.

Axiomas de Probabilidad:

1) Si E es un evento cualquiera en un espacio muestral S, entonces: 0 s P(E) s 1
2) Al espacio muestral S le corresponde: P(S) = 1
3) Si A y B son eventos mutuamente excluyentes de S, es decir A B = C, entonces:
P (A B) = P(A) + P (B)

Consecuencias de los axiomas:

Algunas de ellas son:

a) Si E
1
, E
2
, E
3
, ... , E
n
son mutuamente excluyentes, entonces:
P (E
1
E
2
E
3
... E
n
) = P(E
1
) + P(E
2
) + P(E
3
) + ... + P(E
n
)
b) Si A y B son eventos cualesquiera subconjuntos del espacio muestral S,
entonces:
P (A B) = P(A) + P (B) - P (A B)
c) Si E es un evento cualquiera y E
c
su complemento, ambos de S,
entonces:
P(E) = 1 - P(E
c
)

33
Probabilidad Condicional:
En ciertos casos es necesario a veces calcular la probabilidad de un evento sabiendo
que ha ocurrido otro primero y en este caso la llamaremos probabilidad condicional y
se representa

P(A/B) y se lee: probabilidad de A dado B, siempre que A B = C:

P(A B)
P(A / B) = con P(B) = 0
P(B)

y
P(A B)
P(B / A) = con P(A) = 0
P(A)

Ejemplo:
En una caja hay 13 bolillas de las cuales 5 son defectuosas. Se extraen 2 al
azar. Encontrar la probabilidad de ninguno de los dos defectuosos.
Los eventos a considerar son:

A : 1ra. extraccin, bolilla no defectuosa
B : 2da. extraccin, bolilla no defectuosa

y la probabilidad que nos interesa es de A B, es decir que queremos la probabilidad
de que las dos extracciones de bolillas no defectuosas o sea:
P(A B) = P(B / A) . P(A)

Veamos primero a qu es igual P(A)? Hay 13 bolillas de las cuales 5 son defectuosas
y en consecuencia 8 son no defectuosas, por lo tanto P(A) = 8 / 13.

Ahora queremos calcular la P(B / A), es decir la probabilidad de B dado que
ya ocurri A, es decir que como ya ocurri A, de los 8 defectuosos quedaron 7 y de los
13 quedaron 12, entonces: P(B / A) = 7 / 12, o sea que

P(A B) = P(B / A) . P(A) = 7 / 12 . 8 / 13 = 36 %

Eventos Independientes:
Se dice que dos eventos son independientes si se verifica que:

P(B / A) = P(B)
y
P(A / B) = P(A)
o bien si se verifica:
P(A B) = P(A) . P(B)

34
Una vez adquiridos los conceptos fundamentales de probabilidades
estudiaremos las distribuciones de probabilidades. Tenemos dos tipos de
distribuciones: distribuciones discretas y distribuciones continuas .
Evidentemente que si la distribucin es continua o discreta depender del
tipo de variable que tengamos, por ejemplo si queremos saber el nmero de hijos por
familia (5 hijos, 6 hijos, ...), el nmero de jalones disponibles para una nivelacin,
estamos frente a una variable discreta y por lo tanto tendremos una distribucin
discreta. Si por el contrario queremos saber la estatura de los alumnos del curso
(1.64m, 1.78m, ..) o una determinada distancia, tendremos valores que representarn a
una variable continua y por lo tanto ser una distribucin continua .

35
Clase N 4: Variable Aleatoria y Distribuciones de Probabilidades
Discretas y Continuas

Variable Aleatoria:
Consideremos el experimento de arrojar dos monedas al azar, el
espacio muestral ser:
S = { (S, C) (C, S) (C, C) (S, S) }
Consideremos el evento:
X = nmero de caras , si volvemos al espacio muestral S
veremos que a cada elemento le corresponde un nmero:
(S, C) (C, S) (C, C) (S, S)
1 1 2 0
En consecuencia X puede tomar los valores 0 , 1 , 2 , y hasta el momento
los eventos se describan con sale cara o bolillas defectuosas , en cambio ahora
diremos nmero de caras o nmeros de bolillas defectuosas, es decir que el
espacio muestral no era numrico en cambio ahora tendremos un espacio muestral
numrico.
Antes hubiramos dicho:
A : ninguna cara y su probabilidad se expresara : P(A) = 1/4

ahora diremos:
X = nmero de caras y su probabilidad se expresar P(X =O) = 1/4

Logramos as introducir una funcin X tal que al espacio muestral S , que era no
numrico le hacemos corresponder un espacio muestral S numrico, que pueden ser
los nmeros reales, es decir que:
X : S = { (S, C) (C, S) (C, C) (S, S) } S = { 0, 1, 2 }

a esta funcin X la llamaremos variable aleatoria (v.a.) , entonces:
Una v. a. X es
una funcin de valor numrico que asigna un nmero real a cada punto del espacio
muestral.
La palabra variable indica que puede tomar diversos valores y aleatoria
porque sus valores dependen del azar.
Ahora bien, cuando ponamos P(A), P era una funcin cuyo dominio es el
conjunto de los sucesos o espacio muestral y cuyo rango es el intervalo [0, 1] de los
nmeros reales, es decir P : S 9 , al definir X, logramos que sea tal que
P : 9 9 .
Una variable aleatoria puede ser discreta o continua, sus definiciones, no
rigurosas, son:
v.a. continua:
Se dice que una v.a. es continua si el nmero de valores posibles que la
v.a. puede tomar es un continua de valores.

v.a. discreta:
Una v.a. discreta puede asumir valores de nmeros naturales.

36

Distribuciones de Probabilidades Discretas:
Volvamos al ejemplo del lanzamiento de las 2 monedas, ahora nuestro espacio
muestral ser:
S = { 0, 1, 2 }
Realicemos la siguiente tabla:

X p(X) = P(X=x) P(Xsx) = F(x)
0 1/4
1 2/4 1/4 + 2/4 = 3/4
2 3/4 + 1/4 = 1
p(x) = 1

donde p(x) = P(X=x) es la funcin de probabilidades , que se define como:

Sea X una v.a. discreta
p( x
i
) x = x
i

p(x) =
0 x = x
i

y sus propiedades son:
1) p(x) > 0
n
2) p( x
i
)
i =1
y la
F(x) = P ( X s x ) es la funcin de distribucin que en el caso discreto ser:

F(x) = P ( X s x ) = p( x
i
)

x s x
i
1. montona no decreciente
2. P(a < X s b) = F(b) - F(a)
3. F(x) = 0 x : x < x
1

F(x) = 1 x : x > x
n

Realicemos el grfico de la funcin de probabilidad, es decir, el diagrama de lnea que
nos mostrar la distribucin de probabilidades correspondiente al ejemplo del
lanzamiento de las dos monedas:
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0 1 2
P
r
o
b
a
b
i
l
i
d
a
d
e
s

Valores de la v.a.
Diagrama de Lneas
Distribucin de
Probabilidades

37

Como ejercicio realice la grfica de la funcin de distribucin, como
referencia acuda a los libros de apoyo.

Distribuciones de Probabilidades Continuas:
Supongamos una ruleta con una escala continua, es decir en lugar de
numerarla con los nmeros naturales, la numeramos con los reales entre el 0 y el 1.

Supongamos una ruleta con una escala continua, es decir en lugar de
numerarla con los nmeros naturales, la numeramos con los reales entre el 0 y el 1.
Ahora tiramos el marcador y despus de dar
algunas vueltas se detendr en algn punto
entre 0 y 1, es decir tomar un valor
perteneciente al intervalo [0,1], entonces
ahora se transforma en un juego continuo.
Como vemos en la figura el marcador recorri
una superficie x desde el cero hasta su
parada en x, en consecuencia aqu
necesitamos definir la funcin de
distribucin y estar dada por:

F(x) = P ( X s x ) = x , con x : 0 s x s 1

Definamos en forma general la funcin de distribucin para una v.a. X
continua:

x

F(x) = P ( X s x ) = } f(t) dt
-

donde f es la funcin de densidad de probabilidad o funcin de densidad de la v.a.
X.

Consideremos por simplicidad que f es continua, salvo en un nmero finito
de valores de t. De hecho F(x) es tambin continua para cualquier valor de x y por lo
tanto podemos aplicar el 1er. teorema del Clculo Integral, podremos entonces
conseguir la funcin de densidad tal que: F (x) = f(x).

Sea X una v.a. continua

f( x

) x : a < x s b
f(x) =
0 otro x

x
1
0
F(x)

1
0 1

21

1. f(x) > 0

+
2. } f(t) dt = 1
-

y las propiedades de la funcin de distribucin en este caso ser:

1. montona no decreciente
b
2. P(a < X s b) = F(b) - F(a) = } f(t) dt = F(b) - F(a)

a
3. F(-) = 0 y F(+) = 1
Consideremos los siguientes intervalos:
a s X < b ; a < X < b ; a s X s b ; a < X s b
ahora tomemos a x discreta, es decir tomar valores pertenecientes a los naturales,
obviamente todos sern distintos pero si por el contrario x pertenece a los reales o sea
que es continua, todos los intervalos son iguales.
Observacin:
Si en el caso discreto queramos calcular, por ejemplo, P( X = x
1
)
obtendramos el valor que le corresponde cuando X = x
1
, mientras que si x fuera
continua la P( X = x
1
) = 0, lo cual nos indica que si x es continua la probabilidad en un
punto es cero, es decir que P( X = x
1
) = f(x
1
) puesto que la probabilidad en continua
est dad por el rea correspondiente, lo cual nos lleva a tener en cuenta que para este
caso diremos que queremos conocer la probabilidad en un entorno de x
1
y no la
probabilidad en x
1
.
Algunos Distribuciones de Probabilidades:

Aqu tan slo realizaremos un cuadro resumen de las principales distribuciones:

Distribuciones Parmetros Media = E(X) Varianza = Var(X)

Uniforme
Binomial
Hipergeomtrica
Poisson

k
n , p
N , D , n

( k+1)
n.p
n. (D/N)

1/12 (k
2
1)
n.p.(1-p)
C
N-n, N-1
n.(D/N).(1 - D/N)

Rectangular
Exponencial
Normal
Normal Estndar

a , b

, o

(a+b)
1/

0

1/12 (b-a)
2

1/
2

o
2
1

Nota:
C
N-n, N-1
es la combinatoria de N-n tomados de N-1 formas. Los conceptos de
Media y Varianza los veremos en el captulo siguiente.

22

Es importante realizar y analizar las grficas correspondientes a cada una de
las distribuciones, dando a los parmetros de las distribuciones los distintos valores
que los mismos pueden tomar; ver estos temas en las distintas bibliografas a su
alcance.

Es importante observar que no todas las distribuciones son simtricas y
adems en el uso de las tablas debe siempre observar la grfica que se encuentra en
la presentacin de cada tabla, ya que ella indica la forma que debe usar la misma.

Estudie y analice todas las medidas de probabilidades: media, varianza y
desviacin estndar de las observaciones, varianza y desviacin estndar de la media
de las observaciones, covarianza.

Incluir las prcticas correspondientes a estos temas

23

Clases N 5 y Clase N 6: Distribucin Normal o Gaussiana
La distribucin Normal o Gaussiana fue introducida por C.F. Gauss en relacin con la
Teora de Errores, es la distribucin continua ms importante ya que, por ejemplo:
a) muchas variables aleatorias vinculadas con experimentos u observaciones prcticas
tienen distribucin normal
b) hay variables que se distribuyen normalmente en forma aproximada
c) hay variables con distribucin desconocida y sin embargo se las puede tratar como
aproximadamente normal, bajo ciertas condiciones
d) ciertas variables que son bsicas para justificar pruebas estadsticas, necesitan
estar distribuidas normalmente
Es claro que, a medida que avancemos en nuestro estudio, veremos todas las
aplicaciones e importancia de la Distribucin Normal.
Sea X v.a. con funcin de densidad
( )
e
2
x
2
1
2
1
x f
|
.
|
\
|
o

t o
=

es la "Distribucin Normal o Gaussiana", en este caso diremos que X est "distribuida
normalmente" y en adelante la simbolizaremos como X ~ N (, o
2
).

En la Teora de Errores la llamaremos "curva de errores de Gauss".
Consideremos un estudio analtico de la funcin:
como podemos ver f est definida
para todo valor de X, es decir para todos los reales y adems es continua y simtrica
respecto a x = , sus derivadas son:

( ) = x ' f
|
.
|
\
|
o

t o

|
.
|
\
|
o

x
2
1
e
2
x
2
1
2

ahora bien si hacemos f '(x) = 0, tendremos que x = y si realizamos la segunda
derivada y veremos que la funcin presenta un mximo en este punto, la derivada
segunda est dada por:
f
"
(x) =
|
.
|
\
|
o

t o

|
.
|
\
|
o

2 2
2
1
3
1
2
1 x
e
x

y si hacemos f
"
(x) = 0 x = o son los puntos de inflexin.
f(x)
De acuerdo al estudio analtico
la grfica de la distribucin normal f()
o gaussiana estar dada por

0 x - o x + o x

24

Siendo la media y o la desviacin estndar de la distribucin normal y
si determinamos el valor de la funcin para x = tendremos que f() =
t o 2
1

sera el valor de la ordenada en el mximo de la funcin y si observamos este valor
depende ntegramente del valor de o y a valores mayores de o tendremos mayores
valores en la ordenada y a menores valores de o tendremos mayores valores en la
ordenada. Esto responde con el significado de la desviacin estndar.

Funcin de Distribucin
Dada la funcin de densidad de la distribucin Normal

( )
e
2
x
2
1
2
1
x f
|
.
|
\
|
o

t o
=

la correspondiente funcin de distribucin ser
( ) ( ) dt
2
1
x X P x F
x
2
t
2
1
e }

|
.
|
\
|
o

t o
= s =

como podemos ver esta integral representa el rea bajo la curva normal desde - hasta
la recta en x.

La resolucin de esta integral no es elemental pero podemos realizar
cambios de variables tales como

o

=
t
y dt
1
dy
o
=

ahora veremos como vara y para la variacin de t, cuando

t vemos que y y si
x t entonces
o

x
y

en consecuencia
( )
|
.
|
\
|
o

u =
t
=
}
o

x
dy
2
1
x F
x
2
2
y
e

llegando as a la relacin bsica

( )
|
.
|
\
|
o

u =
x
x F

25

La integral ( ) dy
2
1
x F
x
2
2
y
e }
o

t
= est expresada en trminos de la
integral dada por ( ) dy
2
1
z
z
2
2
y
e }

t
= u cuyos valores se encuentran tabulados y
se conoce como Distribucin Normal Estndar con media 0 y desviacin estndar 1.

Si analizamos la expresin que acabamos de encontrar
( ) ( ) z
x
x F u =
|
.
|
\
|
o

u = es fcil ver que para cada par de valores y o
tendremos un valor para z y de esa forma podremos determinar el valor de F(x),
haciendo uso de la tabla de la Distribucin Normal Estndar.

As
( ) ( ) ( )
|
.
|
\
|
o

u
|
.
|
\
|
o

u = = s <
a b
a F b F b x a P (o)

Aplicacin
a) Consideremos a = - o y b = + o y reemplacemos en (o)
( ) ( ) ( ) =
|
.
|
\
|
o
o
u
|
.
|
\
|
o
o +
u = o o + = o + s < o F F x P
= u(1) - u(-1) = ( ) 1 z 1 P s < = 0.6827 ~ 68%

es decir que
( ) % 68 x P = o + s < o

esto nos dice que si sumamos y restamos una vez la desviacin estndar (el error), el
68% de las observaciones estarn dentro de estos lmites.

b) Sea a = - 2o y b = + 2o
( ) ( ) ( ) =
|
.
|
\
|
o
o
u
|
.
|
\
|
o
o +
u = o o + = o + s < o
2 2
2 F 2 F 2 x 2 P
= u(2) - u(-2) = ( ) 2 z 2 P s < = 0.9545 ~ 95%
es decir que
( ) % 95 2 x 2 P = o + s < o

26

esto nos dice que si sumamos y restamos dos veces la desviacin estndar (el error),
el 95% de las observaciones estarn dentro de estos lmites.
c) Sea a = - 3o y b = + 3o
( ) ( ) ( ) =
|
.
|
\
|
o
o
u
|
.
|
\
|
o
o +
u = o o + = o + s < o
3 3
3 F 3 F 3 x 3 P
= u(3) - u(-3) = ( ) 3 z 3 P s < = 0.9973 ~ 99%
es decir que
( ) % 99 3 x 3 P = o + s < o

esto nos dice que si sumamos y restamos tres veces la desviacin estndar (el error),
el 99% de las observaciones estarn dentro de estos lmites. Como vemos aqu casi
tenemos dentro de los lmites - 3o y + 3o, que llamaremos lmites tres sigmas.

ndice de precisin:
Consideremos como "error verdadero" a c = x - , en este
caso la funcin de densidad quedar expresada como:

( )
e
2
2
1
2
1
f
|
.
|
\
|
o
c
t o
= c

- o c = 0 o c
x =
si c = 0 , es decir x = entonces f(0) =
t o 2
1
, donde llamaremos "ndice de
precisin" a h =
t o 2
1
, este nombre responde al comportamiento de o como
decamos en pargrafos anteriores.
Como podemos ver
o
1
h , es claro que a mayor valor de o, o lo que
es lo mismo, a mayor dispersin de las observaciones (los x
i
) con respecto a la ,
tendremos menor precisin en las observaciones y a menor dispersin mayor precisin.

o = 0.5 o = 1

h =
t o 2
1

27

o = 1.5

c = 0 c
x =

Si ponemos la funcin de densidad normal en trminos de la precisin h y
del error verdadero c, tendremos:
( )
e
2 2
h
h
f
c
t
= c

28

Clase N 7: Conceptos Bsicos de la Inferencia Estadstica:

Para dar comienzo a este tema es importante establecer las siguientes definiciones:

Concepto Idea Intuitiva

Poblacin

Muestra

Parmetro

Estadstico

Conjunto de mediciones de una caracterstica, para los
individuos de un grupo bien definido (Ej.: Todos los
habitantes de Santiago, todas las iguanas de Jujuy)

Subconjunto de la poblacin

Es una caracterstica de la poblacin, en general es
desconocido. Ej.: , o, o
2
, etc.

Es una caracterstica de la muestra. Ej.: x , S
2
, S, etc.

Al ser los parmetros desconocidos se hace necesario estimar sus valores y
para ello recurriremos a los estadsticos, que si podremos calcular a partir de los
valores muestrales, por ejemplo S
2
estimar al parmetro o
2
, esto significa que a partir
de valores muestrales podremos inferir algo de la poblacin; esto significa que
podremos decir algo a cerca de la poblacin.

Para comprender este concepto pensemos en el siguiente ejemplo:
Supongamos que el gerente de un supermercado quiere tener una idea de Cunto es
el promedio diario que gasta la gente en su supermercado? Para ello seleccionar una
muestra de 500 clientes y determina que el gasto promedio es de
x = $37.10, esta sera la media
muestral y le sirve al gerente para saber que toda la gente (poblacin de compradores)
de su supermercado gasta por da un promedio de $37.10.

En repetidas oportunidades habremos dicho o diremos que hay necesidad
de seleccionar una muestra representativa de la poblacin. Una muestra que tergiverse
la poblacin presentar un error de muestreo y nos proporcionar estimados
imprecisos de los parmetros de la poblacin.

Debe cuidarse especialmente el no cometer lo que se llama sesgo muestral
El sesgo resulta de la tendencia a favorecer la seleccin de ciertas muestras sobre
otras en la recoleccin de los datos de una muestra.

Transcribiremos un ejemplo de sesgo muestral, dado por A. Webster,
ocurrido en las elecciones presidenciales en USA en 1936.:
Franklin Roosevelt era el candidato
demcrata contra Alf Landon, candidato republicano. Una encuesta de los

votantes realizada por la revista Literary Digest (la cual hace mucho tiempo
dej de publicarse) revel que Landon ganara de manera arrolladora.
Cuando pas la ebullicin despus de las elecciones, los editores de la
Literary Digest intentaron determinar realmente por qu pudieron estar tan
equivocados.
Pronto descubrieron su equivocacin.
Al seleccionar gente para la muestra tomaron nombres de dos fuentes: el
directorio telefnico y el propio registro electoral. Vale la pena recordar que en
1936 la nacin se encontraba en medio de la Gran Depresin. La mayora de
las personas culpaba, acertada o equivocadamente, a los republicanos por
su catstrofe econmica y se rehusaron a votar por cualquiera que tuviera
afiliacin con ese partido. Literary Digest escogi personas que estaban
siendo menos afectadas por las duras condiciones financieras y que podan
adquirir un telfono y una suscripcin regular a la revista. Por tanto, las
personas utilizadas en la encuesta no eran representativas de la muestra
como un todo. La muestra tenda a favorecer en su eleccin a los votantes
que no estaban en contra de los republicanos de manera categrica. No es de
sorprender entonces que la revista ya no est en circulacin.

De esta misma forma podramos dar muchos ejemplos en los cuales los
errores cometidos en las conclusiones finales se deben a la mala seleccin de la
muestra, por ello, se deben tomar todos los recaudos necesarios en la seleccin de los
datos de la muestra utilizando mtodos de muestreo que permitan minimizar los
errores.

Sera imposible en este curso incluir toda la teora de muestreo pero si es
importante tener en cuenta que existe y que aqu tan slo daremos un vistazo, con
algunos de los mtodos de muestreo, algunos de ellos tiles si trabajramos con datos
catastrales, por ejemplo, otros con mediciones u observaciones realizadas o a realizar:

Muestreo aleatorio simple:
Tomar una muestra aleatoria simple garantiza que
cada muestra de algn tamao dado tenga la misma probabilidad de ser
seleccionada.

Una muestra aleatoria simple puede obtenerse simplemente enumerando las
observaciones o datos en papelitos idnticos, colocndolos en una bolsa o
sombrero y sacando un nmero deseado de papelitos.

Debe tenerse en cuenta que de acuerdo al problema planteado tambin
podr combinarse los distintos mtodos de muestreo.

Muestreo con reemplazo o reposicin
Esto es cuando el objeto extrado al azar se
vuelve a colocar en el conjunto dado y se mezcla para volver a extraer al azar el
siguiente objeto.

Muestreo sin reemplazo o reposicin
En este caso se extrae un objeto al azar y se
deja, afuera, por separado y luego se vuelve a mezclar y se extrae al azar el siguiente
objeto.

Distribuciones Muestrales:
Las poblaciones generalmente son demasiado grandes
para ser estudiadas en su totalidad y en consecuencia debemos seleccionar una
muestra, a partir de la cual sacaremos conclusiones sobre la poblacin
correspondiente. Como dijimos anteriormente, calculamos la media muestral, el
estadstico x , que ser el estimador de la media poblacional correspondiente, el
parmetro .; o sea que el estadstico se usa como el estimador del parmetro.
entonces cuando a partir de una muestra sacamos alguna conclusin o inferencia
sobre la poblacin estaremos haciendo estadstica inferencial.

Sin embargo el valor estadstico depende de la muestra tomada y cada
muestra puede tener una media diferente o sea que si de una misma poblacin
sacamos varias muestras y de ellas sus correspondientes medias muestrales
podremos tener una distribucin de las mismas

Es importante tener en cuenta que el error de muestreo es la diferencia entre
el parmetro poblacional y el estadstico de la muestra utilizado para estimar el
correspondiente parmetro. Por ejemplo en el caso de las medias el error ser x - .
Ahora podemos definir distribucin muestral como todos los valores posibles
que puede tomar un estadstico y la probabilidad relacionada con l.

Teorema del Lmite Central (T.L.C.):
De acuerdo a lo que acabamos de ver siempre
es posible tomar muestras, las cuales nos permitirn obtener una distribucin de
medias muestrales. Ahora bien si la distribucin de la poblacin correspondiente a
estas muestras est normalmente distribuida, por lo tanto las medias muestrales
tambin tendrn distribucin normal.

Ahora nos preguntamos qu distribucin tendran las medias muestrales si
no conocemos la distribucin de la poblacin a la cual pertenecen? La respuesta esta
pregunta estar dada por el T.L.C. que nos dice:
Para una poblacin cualquiera, a
medida que el tamao de la muestra n aumenta, la distribucin de las medias
muestrales se aproxima a una distribucin muestral con media X y un error estndar
o
x
= ( o / n )

Clase N 8: Estimacin Puntual e Intervalo de confianza para , con
conocido

Debemos ser conscientes de que las poblaciones son generalmente muy
grandes o infinitas, como para ser estudiadas en su totalidad. Sus tamaos requieren
que se selecciones muestras, las cuales son usadas luego para hacer la respectiva
inferencia sobre la poblacin correspondiente.

As por ejemplo, estimaremos la media poblacional ( ), a partir de la media
muestral ( x ), estimaremos con S y S
2
a los parmetros o y o
2
respectivamente y a
estas estimaciones las podremos hacer, por:
a) estimador puntual
b) estimador por intervalo

Debemos tener bien clara la definicin de estimador :
Un estimador puntual
utiliza un nmero nico o valor para localizar una estimacin del parmetro. Un
intervalo de confianza denota un rango dentro del cual puede encontrarse el parmetro,
y el nivel de confianza que el intervalo contiene del parmetro.

El valor que obtuvimos en el ejemplo de $37.10 es un estimador puntual ya
que utiliza un estadstico, la media muestral, para estimar el parmetro, media
poblacional, con un solo valor.

Ahora bien, sabemos que si hiciramos una estimacin por intervalo la
misma especificara el rango dentro del cual est el parmetro desconocido. El gerente,
por ejemplo, puede decidir que la media poblacional est en algn sitio entre $35 y $37.
Tal intervalo con frecuencia es acompaado de una afirmacin con el nivel de
confianza que se da para su exactitud. Razn por la cual se llama intervalo de
confianza.

Es importante distinguir que las estimaciones por intervalos tienen grandes
ventajas sobre las estimaciones puntuales, ya que, al estimar, por ejemplo, a por x
cometemos un error e
x
, sin embargo en la estimacin puntual no podemos saber qu
tan grande es el error de muestreo, mientras que el intervalo de confianza nos permite
explicar esta discrepancia.

Para expresar el estimador puntual ponemos: x , mientras que para
expresar el estimador por intervalo de confianza ponemos: x - e
x
s s x + e
x
. Es
necesario analizar bien estos conceptos en la bibliografa recomendada.

En ambos libros propuestos para este tema, complementndose entre s,
podrn leer y analizar de manera comprensible y fcil, ms an pudiendo reafirmar
cada uno de los puntos con ejemplos desarrollados por los autores.

Una vez analizados los distintos intervalos de confianza del tema presente
podrn analizar los ejemplos aplicados al rea de administracin o economa que se
dan a continuacin.

Ejemplo 1 : Intervalo de Confianza para con o conocida

Consideremos un vendedor inmobiliario, quin adems quiere vender un
terreno para la edificacin de un gran centro comercial. Entonces decide estimar en la
zona de influencia el ingreso promedio por familia como indicador de las ventas
esperadas. Se toma una muestra de n = 100 familias pertenecientes al rea en
cuestin, obtenindose una media x = $35500.00 se supone que la desviacin
estndar poblacional o = $7200.00.

Recordemos que queremos estimar el promedio de ingreso de las familias
por lo tanto necesitamos el intervalo de confianza del 95% para con desviacin
estndar poblacional o conocida, es decir se sabe por algn otro estudio que la
variabilidad en los ingresos puede ser considerada con el valor de $7200, en este caso
el intervalo que utilizaremos es:

x - z
o/2
(o / n ) s s x - z
o/2
(o / n )

adems sabemos que el nivel de confianza es = 0.95 y como = 1 - o, podremos
calcular o/2 = (1 0.95)/2 = 0.025, con este valor ingresamos a la tabla de la normal y
obtendremos que z
o/2
= z
0.025
= 1.96, en consecuencia el intervalo ser:

35500 (1.96)
100
7200

o bien
35500 - (1.96)
100
7200
s s 35500 + (1.96)
100
7200

34088.80 s s 36911.20

Una vez obtenido el resultado numrico es muy importante realizar la interpretacin del
mismo:
El vendedor inmobiliario puede interpretar el resultado diciendo que puede
tener el 95% de confianza de que el ingreso promedio real por familia est entre los
$34088.80 y $36911.20.

No olvidemos que de todos modos la verdadera media no la conocemos y que
lo nico que hacemos aqu es estimarla entre los valores mencionados con el 95% de
confianza, lo que significa que hay un 5% que nos dice que podemos cometer error.
Recordemos que decir el 95% significa que de cada 100 intervalos, slo 95 pueden

contener el verdadero valor y obviamente que habr 5 intervalos de cada 100 que no
contendr la media poblacional.

Tambin debemos tener en cuenta que podramos seleccionar otras muestras
de familias que viven en la misma zona y no obtener el mismo valor para el ingreso
promedio x , lo que generara intervalos de confianza distintos y el 95% de ellos
contendr a la media poblacional .

Clase N 9: Intervalo de confianza para , con desconocido

Ejemplo 2 : Intervalo de Confianza para con o desconocida

Una empresa del medio acaba de registrar las declaraciones de pago de
impuestos de sus clientes y a partir de ello quiere estimar la cantidad promedio que
deben Renta de la Provincia. De entre todos sus clientes seleccion una muestra de 25
clientes y la cantidad promedio que adeudan a Rentas es x = $652.68 y como la
desviacin estndar poblacional o no la conoce debe estimarla de la muestra y obtiene
s = $217.43.

Ahora bien la empresa quiere estimar la media poblacional de la deuda a
Rentas con el 99% de confianza, por lo tanto el intervalo de confianza teniendo en
cuenta que o es desconocida y n = 25 (o sea n s 30) , por lo estudiado en las
distribuciones muestrales sabemos que tenemos que utilizar la distribucin t student,
es decir
x - t
o/2, n -1
(s / n ) s s x - t
o/2, n -1
(s / n )

con un nivel de confianza = 0.99 y como = 1 - o, calculamos o/2 = (1-0.99)/2 =
0.005, con este valor y los grados de libertad de t, gl = n-1 = 25-1=24, ingresamos a la
tabla t-student y obtendremos que t
o/2, 24
= t
0.005, 24
= 2.797, en consecuencia el intervalo
ser:
652.68 (2.797)
25
43 . 217

o bien
652.68 - (2.797)
25
43 . 217
s s 652.68 + (2.797)
25
43 . 217

531.05 s s 774.31

Ahora realizaremos la interpretacin del mismo:
La citada Empresa puede tener el 99%
de confianza en que la cantidad promedio que deben sus clientes a Rentas est entre
$531.05 y $774.31.

Supongamos que ahora la Empresa quiere saber cul sera el resultado con el
95% de confianza en lugar del 99% ya calculado; para este caso tendremos t
o/2, 24
=
t
0.025, 24
= 2.064, el intervalo sera:

652.68 (2.064)
25
43 . 217
o bien 609.19 s s 696.17
Bueno, cul sera la diferencia? Si observamos ambos intervalos y
calculamos la amplitud para ambos: A
99%
= 243.26 y A
95%
= 86.98

podemos ver claramente que el intervalo del 95% de confianza es ms
estrecho que el del 99% con lo cual tenemos mayor precisin.
Imaginemos que como profesor les pido que la nota promedio que Uds.
obtengan est entre el 0 y el 100 %; evidentemente no habra posibilidades de que
alguno no cumpla con mi pedido, verdad? Mientras que si estrechamos el intervalo el
resultado ser ms significativo. Por lo tanto la Empresa est el 95% seguro que el
intervalo contiene a . Aunque la probabilidad de que contenga a se ha reducido de
99 a 95%, al ser ms estrecho el intervalo, es ms preciso. Es decir perdemos nivel de
confianza pero ganamos precisin.
Ahora consideremos el mismo problema, es decir, el intervalo de confianza
para estimar la media poblacional de la deuda a Rentas con o desconocida pero en
esta caso seleccionaremos una muestra de n = 50 (o sea n > 30). En el caso anterior
utilizamos la distribucin t-student, pero si ahora quisiramos hacer lo mismo
deberamos tener a nuestro alcance una tabla t-student con valores para los grados de
libertad mayores que 30. Si as ocurre buscaremos los valores en la tabla y
calcularemos sin problemas, pero si disponemos, como generalmente ocurre, de una
tabla que posee valores para n=30 o lo que es lo mismo gl = n-1=29, debemos recurrir
al Teorema Central del Lmite, el cual nos asegura que cualquier distribucin para n
suficientemente grande (n > 30) se aproxima a la Normal. Esto significa que como en
este caso seleccionamos una muestra de n=50 deberemos aproximar a la distribucin
t-student por la Normal, eso significa que en lugar de calcular t
o/2, n 1
calcularemos
z
o/2
, en consecuencia el intervalo de confianza correspondiente, como ya vimos en la
teora estar dado por:

x - z
o/2
(s / n ) s s x - z
o/2
(s / n )

con un nivel de confianza del %.

Volviendo al ejemplo, n=50 y el intervalo con un nivel de confianza = 0.99 y
como o/2 = (1-0.99)/2 = 0.005, entonces z
o/2
= z
0.005
= 2.575, por lo tanto:
652.68 (2.575)
50
43 . 217

o bien
652.68 - (2.575)
50
43 . 217
s s 652.68 + (2.575)
50
43 . 217

573.50 s s 731.86 (1)
Acabamos de obtener un intervalo de confianza con valores aproximados,
ya que tuvimos que aproximar la distribucin t-student por la Normal. Calculemos
ahora, el verdadero valor para t buscando en una tabla que contenga valores mayores
que 30 (Berenson), es decir t
o/2, n-1
= t
0.005, 49
= 2.68 entonces:
652.68 (2.68)
50
43 . 217

o sea
570.27 s s 735.09 (2)

Si comparamos ambos intervalos (1) y (2) observaremos que a pesar de
ser el intervalo dado en (2) ms amplio que el dado en (1) es ms preciso el intervalo
(2) puesto que se lo encontr con los verdaderos valores de t, no as el (1) que se lo
obtuvo de la aproximacin por la Normal.

Clase N 10: Intervalo de confianza para

Ejemplo 3 : Intervalo de Confianza para o

Un fabricante de bateras para automviles asegura que sus bateras duran
3 aos con la varianza de 1 ao. Si 5 de estas bateras tienen duraciones de 1.9, 2.4,
3.0, 3.5 y 4.2 aos, determinar un intervalo de confianza del 95% para o
2
e indicar si es
vlida la afirmacin del fabricante de que o
2
= 1. Suponga que la poblacin de las
duraciones de las bateras se distribuye aproximadamente en forma normal.
El intervalo de confianza para o
2
est dado por:
2
2 /
2
s ) 1 n (
o
_
< o
2
<
2
2 / 1
2
s ) 1 n (
o
_

donde
2
2 / o
_ y
2
2 / 1 o
_ son valores de
2
_ con n-1 grados de libertad (gl).
Como n = 5, entonces con gl = n-1 = 4 tendremos
2
2 / o
_ =
2
025 . 0
_ = 11.143 y
2
2 / 1 o
_ =
2
975 . 0
_ = 0.484 . Por lo tanto el intervalo de confianza para comprobar la
afirmacin del fabricante con el 95% ser:
143 . 11
82 . 0 4
< o
2
<
484 . 0
82 . 0 4

tendremos que:
0.294 < o
2
< 6.776
Como vemos 1 pertenece al intervalo de confianza por lo tanto es vlida la afirmacin
del fabricante.

Clase N 11: Test o Prueba de Hiptesis
Todos los conceptos necesarios para este tema se
encuentran muy bien definidos y ejemplificados en los dos libros propuestos y que para
una ms clara y detallada comprensin las distintas definiciones se encuentran
ejemplificadas, de todos modos les trasmitir como lo vine haciendo algunos conceptos
esenciales para ayudar an ms en el entendimiento del tema en cuestin.
El propsito del anlisis estadstico, tanto con la aplicacin de Intervalos de
Confianza como con Test de Hiptesis es reducir el nivel de incertidumbre en el
proceso de toma de decisiones.
Es as que los directivos de empresas pueden tomar mejores decisiones
cuando cuentan con suficiente informacin que le permitan un buen diseo y posterior
aplicacin de test de hiptesis. As por ejemplo:
Un embotellador de cremas debe determinar si sus envases, al terminar el proceso
de llenado, estn cumpliendo con el peso que deben tener sus potes, que deben
pesar 20 gr.
Un productor de estatuillas de adorno desea saber que la proporcin de las
estatuillas que entrega con defectos no supera el 3%.
Un fabricante de equipos deportivos desea saber si existe evidencia de que un
proceso de produccin ha reducido los costos promedios de produccin por debajo
de su nivel actual de $5 por unidad

Cuando estemos en condiciones de responder a estas como a otras preguntas
podremos dar algn grado de garanta y entonces la toma de decisiones se volver
ms segura y seguramente podremos evitar errores costosos en una empresa.

Es evidente que en ambos casos, en intervalos de confianza como en
prueba o test de hiptesis, se trata de efectuar juicios respecto a algn aspecto
desconocido de una poblacin determinada, en base a la informacin proporcionada
por una muestra. El aspecto investigado puede ser el valor de uno o ms parmetros
de la poblacin o menos frecuentemente, la forma funcional de la poblacin.

Segn el tipo de pregunta que se plantee, se tratar de un problema de
estimacin o de test de hiptesis. Si nos preguntamos cul es el valor de un
parmetro determinado?, tendramos a recurrir a la estimacin, si por el contrario
partimos de una afirmacin que hace referencia a la poblacin y en este caso nos
planteamos la pregunta si dicha afirmacin es correcta o falsa?, estaremos frente a
una prueba de hiptesis.

A modo de ejemplo, consideremos la afirmacin de que los economistas y
los mdicos gastan, en promedio en propinas, durante sus congresos anuales, una
cantidad igual. Ahora bien, podemos interpretar como una hiptesis que seala que la
media de la poblacin es la misma en los dos grupos profesionales. Normalmente, para
contrastar esta hiptesis obtendramos una muestra aleatoria de los economistas y otra

de los mdicos, determinaramos ambas las medias muestrales y compararamos estas
medias para saber si estbamos acertados o no en la afirmacin.
Ejemplo 1 : Test de Hiptesis para con o conocida

Aqu faltara agregar un ejemplo

Ver punto 10.5 Pruebas con respecto a una sola media (varianza conocida), pg
306, libro Probabilidad y Estadstica, para Ingenieros, autores Walpole, Myers

Clase N 12:
Ejemplo 1 : Test de Hiptesis para con o desconocida
Retomemos el embotellador
de cremas que quera determinar si sus envases, al terminar el proceso de llenado,
estn cumpliendo con el peso que deben tener sus potes, que deben pesar 20 gr. Es
decir que quiere probar la hiptesis de que = 20, es decir que el planteo de las
hiptesis sern:
H
0
:

= 20
H
1
:

= 20
Para poder realizar esta prueba el embotellador selecciona una muestra de
50 frascos, determina los valores de la media x = 20.357 grs y la desviacin
estndar s = 0.866 grs, el estadstico ser
T =
n / s
x
=
50 / 866 . 0
20 357 . 20
= 2.91
como para n = 50 no disponemos de luna tabla t-student para ese valor entonces
aproximamos por el TCL a la t-student por la distribucin normal, fijamos o = 5%,
entonces buscamos el valor de la tabla normal que corresponde a este nivel de
significancia esta dado por z
o/2
= z
0.025
= 1.96, la regla de rechazo nos dice que si
|t

| > z
o/2
, rechazamos la hiptesis, para este caso t = 2.91 es mayor que 1.96, por lo
tanto rechazamos la hiptesis al nivel del 5% , esto significa que

= 20, por lo tanto el
embotellador deber rectificar sus mquinas llenadoras.

Ejemplo 2 :
El gerente de un hotel report a su dueo que el nmero promedio de
habitaciones alquiladas por la noche es de por lo menos 212, es decir

> 212. Otro
funcionario del hotel considera que esta cifra puede estar algo sobrestimada. Una
muestra de 150 noches nos da una media de 201.3 habitaciones y una desviacin
estndar de 45.5 habitaciones. Si estos resultados sugiere que el gerente ha inflado
su reporte, ser amonestado severamente. A un nivel del 1% averiguaremos cul es el
destino del gerente.
Veamos cul sera el planteo de las hiptesis:
H
0
:

> 212 afirmacin del gerente
H
1
:

< 212
de acuerdo a este planteo de hiptesis nos queda claro que estamos frente a un test de
una cola para la con o desconocido ya que obtuvimos la media y la desviacin
estndar de la muestra. Dado que n > 30, entonces usaremos el TCL y la
aproximaremos por la Normal, el estadstico da:
T =
n / s
x
=
150 / 5 . 45
212 3 . 201
= - 2.88
para o = 1%, tendremos que z
o
= z
0.01
= - 2.325. La regla nos dice que rechazamos
H
0
si T < z
o
, como -2.88 < -2.325 entonces rechazamos H
0
, lo cual nos indica que el
gerente sobrestim el nmero de habitaciones ocupadas y en consecuencia recibir
una reprimenda por parte del dueo.

Ejemplo 3 :
Una encuesta realizada a estudiantes de universidades nacionales se
mostr que los estudiantes gastan en promedio ms de $75 mensuales en fotocopias.
Si usted puede hallar evidencias para confirmar esta afirmacin, podra utilizarla para
solicitar a su casa ayuda monetaria adicional. De los 30 estudiantes que tom la
muestra, se determin una media de $80.23 con una desviacin estndar de $45.67.
A un nivel del 5%, se encuentra justificacin para solicitar dinero a casa?
Las hiptesis son:
H
0
:

s 75 versin que circula
H
1
:

> 75
estamos frente a un test de una cola para la con o desconocido y con n s 30, por lo
tanto utilizaremos la tabla t-student, el estadstico es:
T =
n / s
x
=
30 / 67 . 45
75 23 . 80
= 0.63
con el nivel de significancia del 5% calculamos t
o, n-1
= t
0.05, 29
= 1.699, la regla
consiste en rechazar H
0
si T > t
o, n-1
, en este caso T = 0.63 < t
0.05, 29
= 1.699, en
consecuencia no rechazamos H
0
, lo cual significa que el gasto de los estudiantes en
fotocopias es menor que $75, por lo tanto el costo de las fotocopias no ser un pretexto
para solicitar dinero a casa.

Ejemplos de Test de hiptesis para con conocido

Ejemplo 1: Suponga que se utiliza una v.a. X para designar el peso de un pasajero de avin, y que
interesa conocer , la media de peso de todos los pasajeros del avin. Como hay limitaciones de tiempo
y de dinero para pesar a todos se toma una muestra aleatoria de 36 pasajeros, obtenindose una media
muestral x = 80 kg. Suponga adems que la distribucin de los pesos de todos los pasajeros del avin
tiene una desviacin estndar de 15 kg. Cul sera entonces el valor probable de si el nivel de
confianza es de 0.95?.

Con referencia al Ejercicio 1, probar la hiptesis = 82 kg. en
contraposicin a la alternativa de que es diferente de 82 kg. utilizando un nivel de
significancia de 0,05. Interpretar el resultado.

Solucin
1. En primer lugar se debe expresar la hiptesis nula, H
0,
y la hiptesis
alternativa, H
1
.
H
0
: = 82 kg
H
1
: = 82 kg

2. Determinar una regin crtica de tamao o (nivel de significancia), mediante el uso
de la distribucin muestral de un estadstico de prueba apropiado. La regin crtica es
la zona de rechazo de la hiptesis nula, 1 - o es la probabilidad de la zona de
aceptacin de la hiptesis nula.
En este problema, para un nivel de significancia de o = 0.05, la regin de rechazo se
divide en dos (o/2 = 0.025), se trata de un test de dos colas, debido a que la hiptesis
alternativa plantea = 82 , lo cual significa que puede ser < 82 > 82 .
Entonces obtienemos dos valores crticos de la tabla de la distribucin normal estndar,
por ser o conocido. Por lo tanto la hiptesis nula se rechaza si Z s -z
o/2
o Z > z
o/2
, es
decir se rechaza H
0
si Z s -1.96 o si Z > 1.96, o lo que es lo mismo si |Z| > 1.96.

3. Se calcula el estadstico de prueba a partir de los datos de la muestra:
n
x
Z
o
= ,
reemplazando por los valores correspondientes se obteiene:
36
15
82 80
= Z = -0.8
4. Como el valor de Z = - 0.8 no cumple ninguna de las dos condiciones de rechazo de
H
0
, se acepta la hiptesis nula.
S Si i o ob bs se er rv va am mo os s v ve er re em mo os s q qu ue e e el l v va al lo or r d de e = = 8 82 2 k kg g, , d de e l la a h hi ip p t te es si is s n nu ul la a, , v ve er ri if fi ic ca a q qu ue e | |- -0 0. .8 8| | s s 1 1. .9 96 6, , e es s
d de ec ci ir r, , p pe er rt te en ne ec ce e a al l i in nt te er rv va al lo o d de e c co on nf fi ia an nz za a e en nc co on nt tr ra ad do o e en n e el l E Ej je er rc ci ic ci io o 1 1 e en n c co on nc co or rd da an nc ci ia a c co on n e el l t te es st t d de e
h hi ip p t te es si is s. . S Se e p pu ue ed de e c co on nc cl lu ui ir r q qu ue e l la a m me ed di ia a d de el l p pe es so o d de e l la a p po ob bl la ac ci i n n d de e l lo os s p pa as sa aj je er ro os s d de el l a av vi i n n e es s 8 82 2 k kg g. .

E Ej je em mp pl lo o 2 2: : Un fabricante produce focos que tienen un promedio de vida con
distribucin aproximadamente normal, y un desvo estndar de 40 hs. Si una muestra
de 30 focos tiene una vida promedio de 780 hs., pruebe la hiptesis de que = 800 hs
en contraposicin a la alternativa de que es inferior a 800 hs, utilizando un nivel de
significancia de 0.04.

Solucin
Regin de
Aceptacin

1. En primer lugar se debe expresar la hiptesis nula, H
0
, y la hiptesis
alternativa, H
1

H
0
: = 800 hs.
H
1
: < 800 hs.
2. En este problema la probabilidad de la regin de rechazo es o = 0.04, por lo que se
obtiene el valor crtico empleando la tabla de la distribucin normal estndar, por ser
o conocido. Por lo tanto la hiptesis nula se rechaza si Z s -z
o
, es decir se rechaza
H
0
si Z s -1.75.
30
40
800 780
= Z = -2.74
4. Como el valor de Z = - 2.74 cumple la condicin de rechazo de H0, por lo tanto se rechaza la hiptesis
nula.

E Ej je em mp pl lo o 3 3: : Una muestra de 100 muertes durante el ao pasado mostr una vida
promedio de 71.8 aos. Suponiendo una desviacin estndar poblacional de 8.9 aos,
parecera esto indicar que la vida promedio hoy en da es mayor que 70 aos? Utilice
un nivel de significancia del 0.05.

Solucin
1. Planteamos las hiptesis
H
0
: = 70 aos
H
1
: > 70 aos
2. La probabilidad de la regin de rechazo es o = 0.05, el valor crtico se obtiene de la
tabla de la distribucin normal estndar, por ser o conocido. Por lo tanto la hiptesis
nula se rechaza si Z > z
o
, es decir se rechaza H
0
si Z > 1.645.
100
9 . 8
70 8 . 71
= Z = 2.02
4 4. . C Co om mo o e el l v va al lo or r d de e Z Z = = 2 2. .0 02 2 c cu um mp pl le e l la a c co on nd di ic ci i n n d de e r re ec ch ha az zo o d de e H H
0 0
, , p po or r l lo o t ta an nt to o s se e r re ec ch ha az za a l la a
h hi ip p t te es si is s n nu ul la a y y s se e c co on nc cl lu uy ye e q qu ue e l la a v vi id da a p pr ro om me ed di io o h ho oy y e en n d d a a e es s m ma ay yo or r q qu ue e 7 70 0 a a o os s. .

Clases Teoricas 2013

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Clases Teoricas 2013

Uploaded by

Copyright:

Available Formats

20

Ctedra: Probabilidad y Estadstica

You might also like