Professional Documents
Culture Documents
UNIVERSIDAD DE JAN
ndice
M
MAAT
AT ER
TE
E R AL
RIIIA
A L II
L MMO
OD
O DE
D EL
EL OD
LO
O DE
D EA
E AN
N
N L
LLIIIS
S S
SIIIS
S
1
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-2
Ejemplo:
Consideremos una investigacin basada en trabajos sobre la prevencin de trastornos
cardiovasculares a partir de la forma fsica (i.e. Ortega et al., 2005). Se midi a un conjunto
amplio de adolescentes espaoles en un conjunto de indicadores sobre su condicin fsica, de
donde se concluy que la fuerza fsica y la capacidad aerbica constituyen marcadores
importantes de salud cardiovascular. El objetivo de nuestro estudio es determinar si
efectivamente factores como la capacidad aerbica estn relacionados con la probabilidad de
sufrir trastornos coronarios. Los datos, ficticios, de 20 pacientes de esta investigacin son sobre
Capacidad aerbica medida como el VO2mx -consumo mximo de oxgeno- y extensin cardiaca
medida en las imgenes de un escner (0 es mnima y 100 es mxima).
Variables:
Capacidad aerbica medida como el consumo mximo de oxgeno.
Extensin cardiaca medida en las imgenes de un escner
Ejemplo:
Tipos de Variables:
Medida: Extensin cardiaca.
Predictora: Capacidad aerbica.
Modelo: Los datos medidos se explican a partir de la Capacidad segn una
relacin simple.
Desde este punto de vista, el objetivo fundamental del anlisis ser evaluar en qu
medida el modelo que incluye a los predictores es adecuado para explicar los datos
observados.
2
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-3
Comprobacin
Supuestos
Anlisis descriptivo-
Identificacin Modelo Exploratorio
3
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-4
El objetivo: construir modelos que sean una buena representacin de los datos,
haciendo el error tan pequeo como sea posible y de la manera ms simple
posible.
4
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-5
En dicho fichero aparecen los datos de la investigacin sobre condicin fsica y salud
cardiovascular.
5
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-6
El segundo paso del proceso de modelizacin estadstica consiste en estimar el valor de los
parmetros a partir de los datos.
Mediante uno de tres mtodos estadsticos que garantizan en trminos generales las
propiedades deseables de los estimadores (consistencia, carencia de sesgo, eficiencia y
suficiencia), cuyo uso depende del contexto:
o Mxima verosimilitud
o Los momentos
o Mnimos cuadrados (clsico).
Objetivo: encontrar unos valores de los parmetros que hagan lo ms pequea posible la
diferencia entre las predicciones y los datos observados, o lo que es lo mismo, hacer
mnimo el error cuadrtico para el conjunto de los datos, lo cual se hace para cada
tipo de modelo. Finalmente se divide por el nmero de grados de libertad asociados.
Una vez estimados los parmetros, slo queda ajustar el modelo, es decir realizar las
predicciones del modelo para cada dato y calcular el error cuadrtico global.
6
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-7
ModGeneralAnalisis.xls
Ver Hoja ModLineal1
7
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-8
El tercer gran paso es evaluar el modelo de trabajo o Ampliado, luego el objetivo es decidir
en qu medida el modelo podra ajustar estadsticamente a los datos.
Ahora podemos computar la reduccin neta del error, o la reduccin proporcional de AMP
respecto de COM:
Reduccin neta de error:
=SCR SCE (COM ) SCE ( AMP )
Reduccin proporcional de error:
SCE (COM ) SCE ( AMP )
RPE =
SCE (COM )
=
SCE (COM )
SCR + SCE ( AMP )
Re duccion Error
Error debida Modelo AMP Error prevalece
Original debido Modelo AMP
8
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-9
Lgica: Para confiar en el Modelo de trabajo, y por ende en los parmetros que ste
incluye, tendramos que obtener un valor suficientemente grande de Reduccin del
Error como para poder extrapolarlo desde nuestro estudio muestral hacia la
poblacin de referencia. Un valor que supere lo que se podra obtener por mero azar.
Por ejemplo, poder afirmar en general que el Modelo de prediccin de Trastorno
Coronario a partir de la capacidad Aerbica se mantiene en general en la poblacin
de las personas, y no exclusivamente en los que se han incluido en nuestro estudio
particular con una muestra de los mismos.
Por un lado hipotetizamos que la RPE no es suficientemente grande como para
extrapolarla a la poblacin frente a la hiptesis contrapuesta de que el efecto s es
representativo. El primer tipo de Hiptesis se denomina Nula (H0 en adelante)
puesto que se pone en el peor de los casos para el investigador y asume que el
Modelo de la investigacin es nulo o inexistente, que no es real o confiable. En
contraposicin, la otra se denomina Hiptesis alternativa (H1).
Problema Solucin
Sigue un modelo F: Fk FR
9
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-10
Aclaracin: Luego el puente de unin entre lo muestral y lo poblacional viene dado por
un Modelo de Distribucin, una funcin estadstica que nos permite estimar la
probabilidad que tiene asociado un determinado valor de una variable.
10
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-11
ModGeneralAnalisis.xls
Ver Hoja ModeloDistrib
0,30
0,25
0,20
0,15
0,10
0,05
0,00
76- 101- 126- 151-
<26 26-50 51-75 >175
100 125 150 175
Series1 0,05 0,05 0,15 0,25 0,25 0,15 0,05 0,05
Memoria
11
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-12
Ejemplo de Contraste de Hiptesis sobre el Modelo de Distribucin F con los parmetros: a=4;
n=10; 0.05F3;36=2.87
Alfa o nivel de
significacin
Valor Crtico de F
12
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-13
Intervalos confidenciales
Inferencia basada en la estimacin de parmetros: los mejores estimadores de los
parmetros poblacionales son precisamente los estadsticos equiparables (i.e. la media
muestral de la poblacional).
Esta estimacin puntual es poco informativa, mejor la variante de la estimacin mediante
intervalos de confianza. Dicha estimacin implica pocos clculos respecto al contraste de
hiptesis:
F R ; MC
n
Se estima una gama de valores (centrada en el estimador puntual) que capturarn el valor
real del parmetro con una probabilidad equivalente al nivel de confianza 1-. De forma,
que la magnitud del mismo depender del valor de alfa y de la cantidad de error que
nuestro modelo deja sin explicar.
13
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-14
Potencia estadstica
Un contraste implica la decisin entre dos hiptesis: la hiptesis nula, H0, que es la que
contrastamos, y una hiptesis alternativa, H1, que est implcita en el rechazo de la nula.
As, realmente tenemos dos probabilidades, alfa y beta, asociadas respectivamente a los
dos tipos de error que se pueden cometer en la nueva situacin.
CUADRO 6.10: Matriz de Decisin del Contraste de Hiptesis estadsticas. Adaptado a partir de
Ramos, M.M.; Catena, A. y Trujillo, H. (2004). Manual de Mtodos y Tcnicas de Investigacin en Ciencias
Del Comportamiento. Madrid: Biblioteca Nueva.
DECISIN
Rechazar H0 No rechazar H0
[Inclinacin hacia H1 en [Inclinacin hacia H0 en
contra de H0] contra de H1]
Decisin incorrecta: Decisin correcta
Error tipo I
H0 Verdadera
(con probabilidad o
SITUACIN
[ H1 falsa]
(con probabilidad 1-
nivel de significacin) o nivel de confianza)
Decisin correcta
Decisin incorrecta:
H0 Falsa Error tipo II
[ H1 verdadera ]
(probabilidad 1-
(con probabilidad )
o potencia)
14
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-15
15
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-16
16
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-17
17
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-18
18
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-19
2. Variaciones de la perspectiva de Modelizacin en funcin del tipo de diseo (Cuadro 6.11, tomado de
Ramos, M.M.; Catena, A. y Trujillo, H. (2004). Manual de Mtodos y Tcnicas de Investigacin en Ciencias Del Comportamiento.
Madrid: Biblioteca Nueva).
Unifactorial
Regres. Simple
Efectos Simples
X Factorial (Interaccin) vs.
Regres. Mltiple Principales
NMERO
VARIABLES Univariado
Regres. Lineal
Y
Multivariado
Regres. Cannica
Anlisis
COMPLEJIDAD Global
MODELO Polinmicas:
A priori Lineal, Cuadrtica, etc
(GENERALIDAD Anlisis
HIPTESIS) Detallado de Tendencias
Contrastes Post Hoc:
A Posteriori Tukey, Bonferroni
Control Estadstico
CASOS ANCOVA
ESPECIALES
No Equilibrados
Configuracin Incompleta:
Anidados, Jerrquicos
Modelos Series Temporales. ARIMA
Longitudinales
19
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-20
20
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-21
Descriptivo.
Estudiar en detalle las emisiones de un contaminante en estaciones mediante monitoreo
atmosfrico: Valores promedio, dispersin a travs de diferentes momentos temporales,
modelo de distribucin a travs del tiempo, etc.; deteccin de valores extremos y puntos
anmalos.
Series Temporales
Abstraccin del patrn de comportamiento de un agente contaminante a travs del tiempo.
Categricos.
Estudio de la frecuencia con la que se rebasa la norma de calidad en dos lugares antes y
despus de extremar las medidas de control.
21
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-22
Descriptivo.
Un colaborador del investigador es seleccionado para formar parte de un jurado y entonces se aprovecha
la ocasin para investigar la problemtica de inters. Para ello se elaboraron una serie de conductas que
seran exploradas durante la adopcin de decisiones y deliberaciones mediante una metodologa
observacional. Dichas conductas reflejaran diferentes actitudes valores que podran influenciar las
decisiones segn las teoras sociales ms relevantes. El objetivo es estudiar en detalle dichas conductas:
valores promedio, dispersin a travs de diferentes momentos temporales, modelo de distribucin a
travs del tiempo, etc.; deteccin de valores extremos y puntos anmalos.
Series Temporales.
Tambin se ha planteado que la edad de los jurados podra ser un factor importante a considerar. Esto es
as ya que las personas ms jvenes podran ser ms consideradas y relajadas en sus decisiones respecto
a las de ms edad. Para esta investigacin se eligi una muestra de jueces y se les midi a lo largo de un
dilatado perodo de tiempo, pudiendo as estudiar la curva que caracteriza sus juicios de culpabilidad con
relacin a su criterio de decisin. Esto sera de inters para determinar la edad ptima de los jueces.
Categricos.
Estudio de la frecuencia con la que se comenten decisiones sesgadas en funcin de variables como la edad
(mayores vs. jvenes) y el sexo (varones vs mujeres).
22
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-23
23
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-24
Volver Principio
24
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-25
SITUACIN MODELO
Una muestra Y = B0
Dos ms muestras Y = 0
Lineal simple + X
Y= 0 1
Lineal simple -mm. Y = 0 + 1 X + S
Dependientes
Lineal simple -anlisis + X ; X : (0,1, 1)
Y=
contrastes especficos 0 1
Lineal Mltiple
Y = 0 + 1 X 1 + 2 X 2
Lineal Mltiple con
Y = 0 + 1 X 1 + 2 X 2 + 3 X 1X 2
interaccin
Polinomial de grado-2 o
Y = 0 + 1 X 1 + 2 X 12
tendencia Cuadrtica
Lineal -Control de Z
Y = 0 + 1 X 1 + 2 Z1
Multivariado
f (Y 1, Y 2) = 0 + 1 X 1 + 2 X 2
Volver Principio
25
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-26
[1] Estes, W.K. (1991). Statistical models in behavioral research. Hillsdale, NJ: Erlbaum. Captulos 1 a
3 (pp.1-40).
[2] Judd, C.M. y McClelland, G.H. (1989). Data analysis: A model comparison approach. San Diego,
CA: Harcout, Brace, Jovanovich.
[3] Maxwell, S.E. y Delaney, H.D. (1990). Designing experiments and analyzing data: a model
comparison perspective. Wadsworth Belmont, California: International Student Ed. Captulos 1 y 2
(pp.3-60).
[4] Pea, D. (1987): Estadstica. Modelos y mtodos. I: Fundamentos. Madrid: Alianza Universidad.
[5] Pea, D. (1987): Estadstica. Modelos y mtodos 2. Modelos Lineales y Series Temporales. Madrid:
Alianza Universidad.
[6] Ramos, M.M.; Catena, A. y Trujillo, H. (2004). Manual de Mtodos y Tcnicas de Investigacin en
Ciencias Del Comportamiento. Madrid: Biblioteca Nueva. Captulo VI (pp.237-286).
26
Manuel Miguel Ramos lvarez
Curso de recursos metodolgicos y estadsticos I-27
27