You are on page 1of 3

Gua de Aplicaciones Regresin Lineal Simple

Matas Hisgen

Diciembre de 2014

1. Anlisis de frecuencias y estadsticos descriptivos.

Aplicacin 1

Para esta aplicacin utilice la base Datos1, que contiene informacin sobre casas vendidas en el
rea de Venice (Florida) durante el ao 1999.

a) Interprete las tablas de frecuencias a las variables que considere como discretas.
b) Reporte una tabla de frecuencias para la variable Precio considerando como intervalos
de clase a cada valor que toma la variable en cuestin. Cuntas casas se vendieron por
menos de 200 mil U$D y qu porcentaje representan? Qu porcentaje de casas se
vendieron por ms de 300 mil U$D?
c) Obtenga un histograma para el precio de ventas, ajuste el nmero de intervalos de ser
necesario (Stata toma un nmero optimo por defecto). Alrededor de qu valor tienden
a centrarse los precios de venta?
d) Obtenga estadsticos descriptivos (media, desvo estndar y rango) para todas las variables
de la base de datos. Comente/interprete.
e) Repita el anlisis previo pero usando la opcin detail del comando summarize.
f) Liste el precio promedio por localidad. Liste la mediana, el rango, el desvo estndar y el
Coeficiente de variacin, para Precio, por localidad.

Aplicacin 2

Para esta aplicacin utilice la base Datos4, que contiene informacin sobre los 94 distritos
escolares del Noroeste de Ohio.

a) Qu porcentaje de distritos escolares est por encima de 2000 alumnos?


b) Analice cada variable cuantitativa de la base, mediante el uso de histogramas, para
detectar la presencia de observaciones atpicas o aberrantes.
c) Describa las variables Ingreso-Gasto por alumno y Ayuda Social en cuanto a su
tendencia central y su dispersin.
d) Nota asimetra en alguna de las dos variables descriptas previamente? Cul es ms
asimtrica?

1
e) Describa cmo cambia la tendencia central y la dispersin de la variable Ayuda social al
separar los distritos en dos grupos (los que ms gastan y los que menos gastan por
alumno).
f) Repita el anlisis del tem previo, pero describiendo la ubicacin y dispersin de la variable
% de alumnos que aprueba el examen de aptitudes.

2. Anlisis de correlacin y regresin simple

Aplicacin 1

a) Grafique el diagrama de dispersin entre Precio y Superficie. Obtenga el coeficiente


de correlacin entre el Precio y la Superficie. Tiene el signo esperado a priori? Le
parece que representa una alta relacin lineal?
b) Compute la matriz de correlaciones entre todas las variables de la base. Cules son las 5
variables que ms se relacionan linealmente con el Precio? Excluyendo la variable
Precio, cules son los 4 pares de variables que ms se correlacionan? Tienen sentido
lgico estas 9 correlaciones analizadas? Cul es la variable cuya correlacin con las dems
carece de sentido (lgico o terico).
c) Estime la ecuacin de regresin de Precio sobre Superficie. Interprete los coeficientes
estimados. Grafique la recta de regresin estimada en el diagrama de dispersin
correspondiente. Cul es el precio medio estimado para una Superficie de 2000 pies?

Aplicacin 2

Para esta aplicacin utilice la base Datos4, que contiene informacin sobre los 94 distritos
escolares del Noroeste de Ohio.

a) Grafique un diagrama de dispersin entre el % de alumnos que aprueba el examen


general y la variable % de Asistencia promedio. Obtenga la correlacin entre ambas
variables e interprete.
b) Estime una regresin simple que explique el % de alumnos que aprueba el examen
general mediante la variable % de Asistencia promedio. Interprete los coeficientes
estimados. Le parece elevado el valor de la pendiente en trminos prcticos? Grafique la
recta estimada en el diagrama de dispersin correspondiente.
c) En base al modelo estimado previamente, halle el % de alumnos aprobados predicho
para los valores mnimo y mximo de la variable % de asistencia.

2
d) Repita el ajuste del modelo estimado en el tem (b) pero excluyendo las observaciones
atpicas en la variable asistencia (<92 y >98). Compare el resultado con el hallado
anteriormente.

You might also like