You are on page 1of 9

Curso de Estadstica

MDULO 3.
Independencia y relacin entre variables

RELACION LINEAL ENTRE VARIABLES CUANTITATIVAS


CALCULO

S XY =
( xi x ) ( yi y )
=
xi y i nxy
n n
INTERPRETACION
COVARIANZA S XY > 0 Las variables estn directamente relacionadas entre s,
MUESTRAL si una toma valores superiores a la media, la otra tambin.

S XY < 0 Las variables estn relacionadas en sentido inverso:
cuando una toma valores por encima de la media, la otra
los toma por debajo.

CALCULO

rxy =
S XY
=
xi y i nxy
S X .SY (
n Sx .Sy )
INTEPRETACION
1) -1 rXY 1
COEFICIENTE

DE 2) rXY = 1 Todos los puntos estn alineados en una recta con

CORRELACION pendiente positiva.



MUESTRAL
3) rXY = 1 Todos los puntos estn alineados en una recta con
pendiente negativa.

Ej: rXY = 0 ,9 quiere decir que existe relacin lineal positiva pero NO
NOS DICE CUAN FUERTE ES LA RELACIN.

rXY es un indicador bueno en distribuciones simtricas y cuando ms
nos alejamos de las distribuciones simtricas el indicador no sirve mucho.

-1-
Curso de Estadstica

TEMA: PUEBA DE HIPOTESIS

10 Prueba de hiptesis

1) Prueba de un parmetro

Es una regla de decisin que permite optar entre H0 y H1 a partir de la


informacin de una muestra. Conduce a aceptar o rechazar la hiptesis en
consideracin.

10.1 Planteo de las hiptesis.

Hiptesis nula: Hiptesis alternativa:


En general la que no se rechaza salvo Es la contraria a la nula, (no tiene
que la experiencia indique lo porque ser complementaria).
contrario.
En H0 va siempre el signo de igual.

10.2 Estados de naturaleza y decisiones.

Estados de naturaleza
Decisin H0 cierta H1 cierta
Rechazar H0 Error Tipo 1 Acierto
No rechazar H0 Acierto Error Tipo 2

10.3 Tipos de Errores.

Error Tipo 1: Rechazar H0 cuando es cierta.


Error Tipo 2: No rechazar H0 cuando es falsa.

El Error tipo 1 es el llamado PEOR ERROR


10.4 Nivel de significacin y regin ptima.

Regin Crtica:
Df: Es la regin de rechazo cuando el estadstico observado cae en dicha
regin.

X RC
Nivel de significacin: P =
H 0

-2-
Curso de Estadstica

Tamao Forma de la
Poblacin Estadstico y su distribucin en el
de la Hiptesis regin
y Prueba muestreo bajo H0) cierta
muestra critica
H 0 ) 0 Si 2 es conocida:
xk
Poblacin H1 ) > 0 2
cualquiera Xn N ;
d

Grande excepto H 0 ) 0 n
n 30
Bernoulli xk
Prueba H1 ) < 0 Si 2 es desconocida:
relativa a la
media H 0 ) = 0 S2
Xn
d
N ; x 0 k
H1 ) 0 n
H 0 ) 0 Si 2 es conocida:
ek
H1 ) > 0 2
E = X n N ;
Poblacin
Normal H 0 ) 0 n
ek
Chica Prueba
H1 ) < 0 Si 2 es desconocida:
( )
relativa a la
media
H 0 ) = 0 n X
E= t n 1
S e 0 k
H1 ) 0
H 0 ) p p0
xk
H 1 ) p > p0
p (1 p )
Poblacin
Bernoulli
Prueba H 0 ) p p0 Xn

d
N p;
Grande n n xk
relativa a
H 1 ) p < p0
una
X n = p = H
proporcin
H 0 ) p = p0
x p0 k
H 1 ) p p0

-3-
Curso de Estadstica

Tema: Prueba de independencia


Objetivo del problema
Se tiene una poblacin clasificada segn dos variables aleatorias (X e Y) y
se quiere saber si las variables son independientes. Se extrae una MAS
c/r de tamao n y a partir de la informacin contenida en la muestra, se
pretende tomar una decisin respecto a la independencia de las variables.
Planteo del problema
Planteamos los cuadros de valores observados y esperados:
Cuadro 1: Cuadro de valores observados ( de contingencia no)
X/Y Y1.. Yi Yn. n(xi)
X1 n(x1)
Xi n(xi)
Xp n(xp)
n(y1) n(yi) n(yp) n
Cuadro 2: Cuadro de valores esperados (ne)
X/Y Y1.. Yi Yn. n(xi)
X1 n(x1)
Xi n( xi ).n( y i ) n(x i)

n
Xp n(xp)
n(y1) n(yi) n(yp) n

-4-
Curso de Estadstica

1 Planteo de las hiptesis H0) X e Y son independientes

H1) X e Y no son independientes

2 Nivel de significacin

3 Estadstico (no nei , j )


2

E= = 2 i, j
si H0) es cierta
i, j nei , j

2 (2r 1)(s 1)

r = numero de filas

s= numero de columnas.

( del cuadro de valores esperados,

Luego de agrupar)

4 regin critica { } (
R.C. = X : 2 > / P 2 > / H 0 = )
5 Decisin Si 02 > Se rechaza H0)

Si 02 No se rechaza H0)

Importante: si algn valor esperado es menor a 5, agrupamos filas o columnas


de forma que los neij> para todo i,j

-5-
Curso de Estadstica

Ejercicio 1

La siguiente tabla muestra la distribucin conjunta de frecuencias relativas de la


variable CRED que representa el nmero de tarjetas de crdito que posee una
persona y la variable COMP que refleja el nmero de compras semanales
pagadas con tarjeta de crdito.
N DE COMPRAS POR SEMANA
N TARJETAS 0 1 2 3 4
1 0,08 0,13 0,09 0,06 0,03
2 0,03 0,08 0,08 0,09 0,07
3 0,01 0,03 0,06 0,08 0,08

1. Hallar la distribucin marginal de la variable COMP. Cul es el numer


medio y la desviacin tpica del nmero de compras semanales pagadas con
tarjeta de crdito? Obtener la distribucin del nmero de tarjetas de crdito que
poseen las personas de dicho estudio. Cul es el nmero ms frecuente de
tarjetas de crdito que posee una de estas personas?
2. Calcular la distribucin del nmero de compras semanales pagadas con
tarjetas de crdito que realizan las personas que poseen tres tarjetas. Cul es
la media de esta distribucin?
3. Qu conclusiones pueden extraerse a partir de la distribucin conjunta
sobre la relacin entre ambas variables?
4. Si se sabe que en el estudio ha participado 300 personas, hallar la
distribucin conjunta de frecuencias absolutas.

Ejercicio 2

A continuacin se presenta el puntaje otorgado por los clientes a un nuevo


sistema de gerenciamiento de las relaciones con los clientes (CRM). Cuanto
mayor el puntaje, se considera mejor la opinin acerca del sistema.

EDAD
OPINION [20,40) [40,60) [60,80) TOTAL
1 70 20 20 110
2 40 50 30 120
3 50 70 50 170
4 40 60 100 200
TOTAL 200 200 200 600
1. Determinar la distribucin conjunta de frecuencias relativas (trabaje con dos
dgitos decimales).
2. Determinar la distribucin marginal de frecuencias relativas de la variable
EDAD.
3. Determinar la distribucin marginal de frecuencias relativas de la variable
OPINION.
4. Determinar el promedio de edades en la muestra.
5. Determinar la distribucin de frecuencias relativas de la edad condicionada
por OPINION=1.

-6-
Curso de Estadstica
6. Determinar la distribucin de frecuencias relativas de la edad condicionada
por cada uno de los valores de opinin.
7. Determinar el promedio de la variable edad condicionado por OPINION=1.
8. Determinar el promedio de la variable edad condicionado por cada uno de
los valores de opinin.
9. Comente el vnculo entre ambas variables, en base a los promedios
condicionales calculados.

Ejercicio 3

Se desea investigar los resultados de una campaa publicitaria en la


comercializaron de un producto, la situacin anterior se caracterizaba por una
cartera de pedidos que promediaban 1.000 unidades mensuales. Se
selecciona una muestra de 100 clientes y se obtiene: X = 1.150 y S = 80 .
i) Formular una prueba de hiptesis que permita decidir si la campaa
ha sido exitosa.
ii) Hallar la regin critica si =0,05 y tomar una decisin.

Ejercicio 4

Una compaa fabrica cables cuyas resistencias a la ruptura tiene una media
de 100 libras. Se cree que un nuevo proceso es mas eficiente para incrementar
la media de resistencia. La compaa desea adoptar el nuevo proceso si en
verdad es mas eficiente, para eso controla 25 cables y obtiene como
resultados x = 110 libras y S=6 libras.
Que decisin se tomara para un nivel del 55 y del 1%, explicitar los supuestos
necesarios.

Ejercicio 5

Un establecimiento considera un cambio de sus envases. Este se efectuar si


lo prefieren mas del 70 % de los clientes y sabemos que 120 de ellos
estuvieron a favor, en una muestra de n=200. Cual ser la decisin a tomar
para un nivel del 1%.

-7-
Curso de Estadstica

Ejercicio 6

200 Estudiantes fueron tomados al azar de la poblacin de la Universidad ( 50


de c/u de las 4 facultades) y se les pregunt si eran o no tomadores de mate,
obtenindose el cuadro:
Ciencias
Econmicas Arquitectura Ingeniera Agronoma Total
Toman mate 30 35 20 25 110
No toman mate 20 15 30 25 90
Total 50 50 50 50 200
Probar la hiptesis de que tomar o no tomar mate es independiente de la
facultad a que concurren con un nivel de significacin de 5%.

Ejercicio 7

Se desea investigar si existe asociacin o independencia entre categoras de la


P.E.A. y la edad de dicha poblacin. A tales efectos e eligi una MAS c/r de
1000 personas activas obtenindose los siguientes resultados.
Ocupacin / Edad Menores de 25 Entre 25 y 60 Mayores de 60
Industria Manufacturera 50 220 40
Comercio 60 150 20
Otras Actividades 50 250 30
Desocupados 40 80 10
Someter a prueba de hiptesis de independencia entre la edad y la categora
de la P.E.A. para un nivel de significacin del 3 %. Calcular el ndice de
Cramer.

Ejercicio 8

A un gerente de marca le preocupa que la participacin de esta no se


encuentre distribuida uniformemente en el pas. En un estudio en que el pas
fue dividido en 4 regiones geogrficas se entrevisto una muestra de 100
consumidores consiguindose los resultados:
Actitud / Regin Norte Oeste Sur Este Total
Comprar marca 40 55 45 50 190
No comprar 60 45 55 50 210
Total 100 100 100 100 400
Someter a prueba de independencia con un nivel de significacin del 5 %.
Deber rechazarse la hiptesis nula?

-8-
Curso de Estadstica

Ejercicio 9

Los resultados de una muestra de hogares llevados a cabo en una ciudad son:
Rama de actividad Ocupados Desocupados Total
Agropecuario 77 8 85
Ind. Manufacturera 1.380 261 1.641
Construccin 276 72 348
Comercio y Servicios 4.296 430 4.726
Total 6.029 771 6.800
i) Someter a prueba de independencia entre condicin de actividad y la
rama para un nivel del 10%.

-9-

You might also like