Professional Documents
Culture Documents
03)
Preguntas Tericas de Exmenes Integradores
Explique qu datos necesita y cmo se calcula el tamao de muestra para obtener el intervalo de
confianza para la varianza de una poblacin normal.
Entonces, un valor alto del coeficiente de determinacin mltiple (R2) es condicin necesaria pero no
suficiente para un buen ajuste.
PRESS (Prediction Sum of Squares): es una medida de la capacidad predictiva del modelo. A menor
PRESS, el modelo dar mejores pronsticos.
Dada una tabla de datos con las variables Y, X1, X2, X3, X4, X5, cuntos modelos pueden
examinarse?
2k - 1 = 25 - 1 = 31 modelos.
Conviene estratificar una poblacin cuando se advierte una elevada heterogeneidad entre sus unidades
experimentales, con respecto a la variable que se desea relevar.
Tambin es posible estratificar una poblacin en funcin de los valores de una variables concomitante.
Debe tratarse que cada estrato sea internamente lo ms homogneo posible, es decir, que su dispersin
sea mnima.
Se desea estimar el total desconocido (N) de una poblacin. Se capturan R individuos y se les coloca
una marca indeleble. Luego se capturan n individuos y se cuentan los r (entre los n) que presentan la
marca. Explique cmo calcula la estimacin puntual y el intervalo de confianza para N.
= =
Aunque N ser muy grande para valores pequeos de r, y su esperanza no existir cuando r sea 0.
Entonces, se usa el siguiente estimador:
( + 1)( + 1)
=
+ 1
Sea = la estimacin de 1 2 ( ) + 1 2 ( )
Se estima la varianza de y se reemplaza a N por su estimacin:
1 1 1
2 ( )
= ( ) =
2
; = 1 2 ( )
Una sola de las siguientes afirmaciones es correcta. Indique cul es fundamentando la respuesta. En
el modelo lineal general de regresin:
a) Conviene que haya multicolinealidad
b) No conviene que haya multicolinealidad
c) Las variables independientes se tratan como aleatorias
d) La variable dependiente no es aleatoria
2
= 2 + 1 ( )2 Si H 0 ) es verdadera, las medias son todas iguales y el segundo
trmino se anula.
En la distribucin conjunta normal bidimensional:
a) Las distribuciones condicionales pueden ser o no normales
b) Slo si las variables son independientes, su combinacin lineal tiene distribucin normal
c) Slo en este caso la incorrelacin implica la independencia
d) Slo en este caso la independencia implica la incorrelacin
y/x = y + *y/x*(x-x)
Si = 0, entonces y/x = y, con lo cual x e y son independientes. Tenemos as que en este nico
caso la incorrelacin implica la independencia.
La duracin de una pieza que falla por fatiga tiene distribucin (elegir opcin). Aplicaciones de las
otras distribuciones.
a) Exponencial
b) Weibull
c) Beta
d) Fisher Snedecor
Exponencial: fallas de una pieza que constituyen un proceso de Poisson, siempre que se produzcan por
causas exclusivamente aleatorias, no por desgaste ni por fatiga (fusible de luz, chip de memoria RAM).
Beta: para algunas variables con dominio acotado, como ndices o porcentajes. Tambin se usa para
facilitar el clculo numrico de otras distribuciones.
Fisher Snedecor: ensayo de comparacin de varianzas para determinar si un caso de comparacin de
medias es homocedstico o heterocedstico.
Cada una de las siguientes variables responde a una de las distribuciones dadas:
a) Resistencia de rotura de muestras de un material --> Normal
b) Consumo de energa elctrica de los habitantes de una ciudad --> Lognormal
c) Varianza muestral en muestras de Poblaciones Normales --> Gamma
d) Vida de seres humanos de una poblacin dada --> Gumbel del mnimo
Cul de los siguientes se usan como complemento de ANOVA? Para qu casos se usan los dems?
a) Welch
b) Tukey
c) -------
d) -------
Cmo llegar a la frmula para calcular "n" en inferencia sobre la media, teniendo como datos , ,
1, 2.
Explique el procedimiento para obtener el tamao de muestra global (n) en el muestreo estratificado
y luego cmo debe distribuirse el tamao de los estratos (n = n 1 + n 2 + + n i ), o sea cmo se
calculan los n i a efectos de lograr una precisin o error de estimacin prefijado.
Llamamos multicolinealidad a la existencia de asociaciones lineales aproximadas entre los datos de las
variables explicativas.
Cmo se detecta: la multicolinealidad en los datos conlleva errores muestrales altos para los
coeficientes de regresin y, consecuentemente, pruebas no significativas.
Para detectarla, tambin se puede hacer uso de la matriz de correlaciones. Su determinante cumple
0 1, el 0 corresponde a la multicolinealidad perfecta y el valor 1 a la ausencia absoluta de
multicolinealidad (esta ausencia se denomina ortogonalidad, pero rara vez se presenta en la prctica).
El umbral es < 0,1, si esto ocurre se sospecha multicolinealidad severa en los datos.
El DET tiene una propiedad importante: al agregar una variable al modelo, necesariamente disminuye,
es decir que se agrega algo de multicolinealidad.
Si se desea retirar una o ms variables del modelo, ser necesario conocer cul es la ms perniciosa.
1
Para esto se utilizan los VIF (Factores de Inflacin de la Varianza) = 1 2 . Si un VIF es mayor
que 10 (o sea R i 2 > 0,9), implica que la variable correspondiente es perturbadora en lo que a la
multicolinealidad respecta. Si hay una o ms variables con VIF mayores que 10, convendr eliminar la
que tiene el VIF mayor.
Cuando hay multicolinealidad, el sistema se vuelve muy sensible a la inclusin de nuevos datos,
debido a la mala estimacin de sus parmetros.
Adems, los datos de las variables explicativas que se utilicen para la prediccin, debern estar dentro
del intervalo de los datos originales. Es decir, en presencia de multicolinealidad no debe extrapolarse.
La duracin de una pieza que falla por causas exclusivamente aleatorias tiene (solo una opcin es
correcta, indique aplicaciones de las otras) distribucin de:
a) Weibull
b) Pareto
c) Gamma
d) Lognormal
e) Exponencial
a) y d): los supuestos para el anlisis son homocedasticidad y normalidad de las variables.
c): es la hiptesis a ensayar, puede rechazarse o no.
b): las observaciones son datos.
En un problema de regresin lineal mltiple con multicolinealidad severa, puede usted eliminar dos
variables explicativas simultneamente? Justifique.
En una poblacin finita, un experto estadstico dise un muestreo, cuya operatoria supervis
personalmente, a efectos de estimar la media de una variable y su intervalo de confianza. Tiempo
despus, se pudo efectuar el relevamiento de toda la poblacin y se comprob que el intervalo
calculado anteriormente no contena a la media verdadera. Por qu pudo haber ocurrido esto?
a) Por la aleatoriedad de la muestra
b) Porque la muestra fue mal tomada
c) Porque la muestra era demasiado pequea, o sea con informacin pobre
d) Porque la muestra era demasiado grande, o sea que dio un intervalo muy angosto
2 ( 0 ) ( ) 2
Demostrar que (| 0 ) = ( 0 )
(0 )
0
La multicolinealidad se define como:
a) La existencia de asociaciones lineales entre las variables Xi
b) La existencia de asociaciones lineales aproximadas entre las variables Xi
c) La existencia de asociaciones lineales entre los datos de las variables Xi
d) La existencia de asociaciones lineales aproximadas entre los datos de las variables Xi
El tiempo que transcurre hasta que llegan 5 personas a una fila (diga cul es la correcta y d
aplicaciones de las dems):
a) Weibull
b) Normal
c) Exponencial
d) Gamma
Explique qu datos necesita y cmo se calcula el tamao de muestra, para obtener el intervalo de
confianza para la varianza de una poblacin normal.