Professional Documents
Culture Documents
Trabajo Encargado
Anlisis de base de datos
Tabla de contenidos
Planteamiento del problema............................................................................... 3
Objetivo general:................................................................................................ 3
Objetivos especficos:......................................................................................... 3
Clasificacin de variables.................................................................................... 4
Anlisis exploratorio............................................................................................ 5
Prueba de supuestos de la tcnica escogida.....................................................11
Aplicacin de la tcnica escogida.....................................................................14
Conclusiones y recomendaciones.....................................................................21
Bibliografa........................................................................................................ 21
Objetivo general:
Usar las tcnicas de estadstica para demostrar que existen diversos
factores que influyen en el rendimiento acadmico de los estudiantes.
Objetivos especficos:
1.- Determinar los diferentes factores tanto: sociales, acadmicos,
demogrfico, que intervienen en el rendimiento acadmico de los
estudiantes.
2.- realizar recomendaciones para enriquecer el rendimiento en base a
los resultados estadsticos.
3.- procesar un modelo estadstico que nos facilite las predicciones
sobre el rendimiento del alumno.
Clasificacin de variables
3
No
1
Variable
School
Sex
Age
Address
Famsize
Pstatus
7
8
9
10
11
Medu
Fedu
Mjob
Fjob
Reason
12
13
Guardian
Traveltime
14
15
16
Studytime
Failures
Schoolsup
17
Famsup
18
Paid
19
Activities
20
21
22
23
24
Nursery
Higher
Internet
Romantic
Famrel
25
Freetime
26
27
Goout
Dalc
Descripcin
Escuela de los estudiantes (GP
Gabriel Pereira o MS Mousinho
da Silveira)
Sexo de los alumnos (F female
o M male)
Edad de los estudiantes (15 a
22)
Tipo de direccin (R Rural o U
Urbano)
Tamao de la Familia (LE3,
menor o igual a 3, GT3 mayor
que 3)
Cohabitacin de los padres
(Viven juntos o separados)
Educacin de la madre
Educacin del padre
Trabajo de la madre
Trabajo del padre
Razn por la que se escogi la
escuela
Apoderado del alumno
Duracin del viaje de la casa a
la escuela
Tiempo de estudio semanal
Nmero de cursos jalados
Recibe apoyo acadmico extra
de la escuela
Recibe apoyo acadmico de la
familia
Recibe clases extras pagadas de
matemtica
Tiene actividades
extracurriculares
Recibi educacin preescolar
Desea educacin superior
Tiene acceso a internet
En una relacin amorosa
Calidad de las relaciones
familiares
Tiempo libre despus de la
escuela
Salidas con los amigos
Consumo de alcohol en das de
Tipo de variable
No mtrica
Escala
Nominal
No mtrica
Nominal
Mtrica
Razn
No mtrica
Nominal
No mtrica
Ordinal
No mtrica
Nominal
No
No
No
No
No
mtrica
mtrica
mtrica
mtrica
mtrica
Ordinal
Ordinal
Nominal
Nominal
Nominal
No mtrica
No mtrica
Nominal
Ordinal
No mtrica
Mtrica discreta
No mtrica
Ordinal
Razn
Nominal
No mtrica
Nominal
No mtrica
Nominal
No mtrica
Nominal
No
No
No
No
No
Nominal
Nominal
Nominal
Nominal
Ordinal
mtrica
mtrica
mtrica
mtrica
mtrica
No mtrica
Ordinal
No mtrica
No mtrica
Ordinal
Ordinal
4
28
Walc
29
30
31
32
33
Health
Absences
G1
G2
G3
semana
Consumo de alcohol en fines de
semana
Estado actual de Salud
Numero de faltas
Grados del primer ao
Grados del segundo ao
Grados del tercer ao
No mtrica
Ordinal
No mtrica
Mtrica discreta
Mtrica discreta
Mtrica discreta
Mtrica discreta
Ordinal
Razn
Intervalo
Intervalo
Intervalo
Anlisis exploratorio
GRAPH
/HISTOGRAM=G3.
Graph
Interpretacin:
Explore
Case Processing Summary
Cases
Valid
N
G3
Missing
Percent
395
100,0%
Total
Percent
0
,0%
Percent
395
100,0%
Interpretacin:
XGraph
Interpretacin:
Descriptives
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
Statistic
Statistic
Statistic
Statistic
Statistic
G3
395
Valid N (listwise)
395
,00
20,00
10,4152
Skewness
Statistic
4,58144
-,733
Kurtosis
Std. Error
Statistic
,123
,403
Interpretacin:
Frecuencias
Estadsticos
higher
N
Vlido
internet
395
395
Perdidos
Tabla de frecuencia
higher
Frecuencia
Vlido
Porcentaje
Porcentaje
Porcentaje
vlido
acumulado
no
20
5,1
5,1
5,1
yes
375
94,9
94,9
100,0
Total
395
100,0
100,0
Interpretacin:
Std. Error
,245
internet
Frecuencia
Vlido
Porcentaje
Porcentaje
Porcentaje
vlido
acumulado
no
66
16,7
16,7
16,7
yes
329
83,3
83,3
100,0
Total
395
100,0
100,0
Interpretacin:
10
Supuesto de linealidad.
Se elaboraron los siguientes cuadros para evaluar la linealidad entre el
logaritmo de los odd ratios y las variables cuantitativas del modelo
11
12
N
Included in Analysis
Missing Cases
Total
Unselected Cases
Total
Percent
390
98,7
1,3
395
100,0
,0
395
100,0
Internal Value
14
Parameter coding
Frequency
health
Walc
Dalc
goout
Step 9
freetime
(1)
(2)
(3)
(4)
1,00
46
1,000
,000
,000
,000
2,00
44
,000
1,000
,000
,000
3,00
90
,000
,000
1,000
,000
4,00
66
,000
,000
,000
1,000
5,00
144
,000
,000
,000
,000
1,00
148
1,000
,000
,000
,000
2,00
85
,000
1,000
,000
,000
3,00
79
,000
,000
1,000
,000
4,00
50
,000
,000
,000
1,000
5,00
28
,000
,000
,000
,000
1,00
273
1,000
,000
,000
,000
2,00
73
,000
1,000
,000
,000
3,00
26
,000
,000
1,000
4,00
,000
,000
,000
1,000
,000
,000
,000
,000
,000
,000
1,000
,000
,000
5,00
9
,000
Omnibus Tests of Model Coefficients
1,00
23
1,000
Chi-square
df
Sig.
2,00
100
,000
Step3,00
4,698 128
1 ,000 ,030
Block
4,00
413,602
5,00
Model
413,602
Prueba de
,000 omnibus
,000
1,000
,000
86
,000
1,000
53
,000
,000
1,00
19
1,000
,000
,000
,000
2,00
64
,000
1,000
,000
,000
3,00
154
,000
,000
1,000
4,00
113
,000
,000
,000
5,00
40
,000
,000
,000
,000
8
1,000
,000
Model Summary
2,00
18
,000
1,000
Step
-2 Log likelihood Cox & Snell R
Nagelkerke R
3,00
65
,000
,000
Square
Square
4,00
193
,000
,000
9
81,481a
,654
,909
5,00
106
,000
,000
a.
Estimation
terminated
at
iteration
number
10
because
Fjob
at_home
19
1,000
,000
,000
,000
,000
,000
1,000
,000
,000
1,000
,000
,000
,000
,000
1,000
,000
,000
famrel
1,00
parameter estimates
than .001. ,000
health changed by less 18
Mjob
traveltime
Resumen
,000 del
1,000 modelo
other
213
,000
,000
1,000
,000
services
111
,000
,000
,000
1,000
teacher
29
,000
,000
,000
,000
at_home
57
1,000
,000
,000
,000
health
34
,000
1,000
,000
,000
other
139
,000
,000
1,000
,000
services
103
,000
,000
,000
1,000
teacher
57
,000
,000
,000
,000
1,00
255
1,000
,000
,000
2,00
104
,000
1,000
,000
3,00
23
,000
,000
1,000
4,00
,000
,000
,000
15
Chi-square
14.652
df
Sig.
8
,066
16
Classification Tablea
Predicted
aprobado
Observed
Step 9
aprobado
Percentage
1
Correct
124
96,1
254
97,3
Overall Percentage
96,9
17
Variables en la ecuacin
school(1)
S.E.
Wald
df
Sig.
Exp(B)
-4,322
1,428
9,156
,002
,013
age
-,965
,323
8,923
,003
,381
Pstatus(1)
2,580
1,244
4,300
,038
13,202
11,863
,018
Mjob
Mjob(1)
3,035
1,354
5,023
,025
20,794
Mjob(2)
,354
1,566
,051
,821
1,425
Mjob(3)
-,729
1,053
,479
,489
,482
Mjob(4)
1,525
1,177
1,678
,195
4,594
20,414
,000
Fjob
Fjob(1)
-5,969
2,585
5,333
,021
,003
Fjob(2)
-3,989
2,520
2,507
,113
,019
Fjob(3)
,576
1,956
,087
,768
1,779
Fjob(4)
-3,683
2,076
3,147
,076
,025
1,915
,778
6,059
,014
6,788
10,518
,033
romantic(1)
goout
goout(1)
3,028
1,495
4,104
,043
20,663
goout(2)
-,816
1,177
,481
,488
,442
goout(3)
-1,275
1,141
1,248
,264
,279
goout(4)
-1,690
1,137
2,209
,137
,185
13,851
,008
Dalc
Dalc(1)
-6,846
2,304
8,830
,003
,001
Dalc(2)
-7,493
2,364
10,045
,002
,001
Dalc(3)
-4,620
2,285
4,087
,043
,010
Dalc(4)
-10,823
3,895
7,722
,005
,000
3,718
,677
30,175
,000
41,174
-6,933
5,780
1,438
,230
,001
G2
Constant
Conclusiones y recomendaciones
o
o
o
Bibliografa
Guisande Gonzlez, C., & Vaamonde Liste, A. B. (2011). Tratamiento de datos
con R, STATISTICA y SPSS. Barcelona, Espaa: Ediciones Das de Santos.
Hosmer, D. W., & Lemeshow, S. (2000). Applied Logistic Regression. New York:
John Wiley & Sons.
Salas Velasco, M. (1996). La regresin logstica. Una aplicacin a la demanda
de estudios universitarios. Estadistica Espaola, 193-217.
Statistic Solutions. (2 de enero de 2015). Assumptions of Logistic Regression.
Recuperado el 9 de Noviembre de 2015, de Statistic Solutions:
http://www.statisticssolutions.com/assumptions-of-logistic-regression/
19