Professional Documents
Culture Documents
Luego aceptar.
La tabla resultante, comparamos las muestras y se ve que s hay diferencia
entre ambas por lo que nos vamos a la tabla de muestras relacionadas y nos
vamos a la columna t (estadstico t), pero lo que ms nos interesa es
el P VALOR y tiene el siguiente VALOR 0,634, entonces podremos decir
que esta cifra est por encima del nivel de significancia (0.05), por lo que
aceptamos la hiptesis nula.
CORRELACION DE PEARSON
La asociacin que trabajbamos con las variables categricas, se trasladan
a la correlacin cuando trabajamos con variables numricas, de manera que
la asociacin y la correlacin sigan siendo lo mismo, lo comn entre ambas
es que tienen VARIABLES ALEATORIOS (es decir que su distribucin no la
conocemos hasta la recoleccin de datos), en el ejemplo se ha recolectado
la hemoglobina de 90 mujeres durante la gestacin y tambin se ha
evaluado el peso de los Recin Nacidos con la finalidad de que si el valor de
la hemoglobina de la madre est relacionada con el peso de su hijo ya que
estamos determinando la validez a travs de la CORRELACIN DE PEARSON,
pero tambin podemos esto categorizar para aplicar CHI CUADRADO
(clasificando la hemoglobina como normal y bajo y el peso como adecuado y
bajo (ASOCIACIN)).
Analizar, Correlacionar, y Bivariadas, seleccionamos ambas variables, por
defecto est seleccionado Pearson, si queremos trabajar con datos ordinales
se selecciona Tau-b Kendall y Spearman es la versin no paramtrica de
Pearson.
El ndice de correlacin es -0.056, pero la significancia (bilateral) es igual a
0.602 y es mayor que el nivel de significancia (0.05) por lo que aceptamos
la hiptesis nula y rechazamos la hiptesis del investigador.
ES BUENA, YA QUE LO QUE BUSCA EL INVESTIGADOR ES LA CORRELACIN
ENTRE AMBAS VARIABLES.
LA VALIDACIN SE DA CON EL INDICE DE PEARSON (cumplimiento de ndice
de R y Rho) que en este caso el valor es 0.056 y LA SIGNIFICANCIA
(BILATERAL= 0.602)
ndices R y Rho Interpretacin
0.00 0.20 Intima correlacin
0.20 0.40 escasa correlacin
0.40 0.60 moderada correlacin
0.60 0.80 buena correlacin
0.80 1.00 muy buena correlacin
ANALISIS DE LA VARIANZA ANOVA
Cuando queremos comparar 2 grupos y las variables a contrastar es una
variable numrica utilizamos la T de student para muestras independientes,
pero que pasara si lo grupos que comparamos es ms de 2 en este caso
utilizamos el Anlisis de la Varianza con un Factor o Anlisis de la
Varianza de una Va.
Con el ejemplo: Analizar, comparar medias, Anova de un factor, la variable
que vamos a contrastar ser el PESO y el factor ser Procedencia, OPCIONES
se selecciona los DESCRIPTIVOS.
Aceptar.
En el resultado se puede ver las medias de los pesos por ciudades, y se ve
en la tabla de ANOVA y que vara de un lugar a otro.
La pregunta es:
SI EL PESO PROMEDIO DIFIERE EN ESTAS 4 LOCALIDADES O SI EL
PESO PROMEDIO ES EL MISMO.
1. Formulacin de la hiptesis:
H0: Hiptesis nula o hiptesis de trabajo: HIPTESIS DE IGUALDAD.
H1: Hiptesis alterna o hiptesis del investigador: El investigador
siempre busca diferencias. HIPTESIS DE DIFERENCIAS.
2. Nivel de significancia: 5% o 0.05
3. Estadstico de prueba: Anlisis de la varianza ANOVA
4. Estimacin del p-valor:
5. Toma de decisin: SI p<0.05 entonces rechazamos la hiptesis nula.
Nos quedamos con la hiptesis del investigador.
La tabla de ANOVA tiene su estadstico (Columna F), pero lo importante es la
SIGNIFICANCIA ASINTTICA que en este caso es el 0.469 por lo que
podemos apreciar que el P-VALOR es mayor que 0.05 determinamos la
hiptesis de Igualdad.
Si P VALOR hubiera sido menor, entonces determinaramos que existe
diferencia entre ciudades, pero la pregunta es determinar cul es esa
diferencia entre ciudades (cul es la diferencia entre Arequipa y Tacna,
Arequipa y Puno, etc), para ello necesitamos el clculo de POST HOC
debemos irnos:
Analizar, comparar medias, Anova de un factor, Post Hoc y elegimos TUKEY,
Continuar y Aceptar y vemos la siguiente tabla:
Podemos ver que, en la columna de la Significancia Asinttica, ninguna de
los resultados es mayor de 0.05. y en la siguiente tabla podemos ver que
Se puede ver que solo aparece una columna (la 1), la cual nos indica que no
existe diferencia ya que se encuentran en la misma columna, pero si se
hubiera visto la columna 2 se podra ver la diferencia significativa entre la
columna 2 y la columna 1.
Tambin se puede ver la significancia entre los grupos y que en este caso es
de 0.451. significa tambin que no existe diferencia entre grupos.
REGRESIN LINEAL SIMPLE
Se da cuando previamente se ha demostrado relacin entre 2 variables,
pero no solamente en una relacin aleatoria sino una relacin causal, es que
esta regresin corresponde a un MODELO PREDICTIVO, mientras que una
CORRELACION corresponde a una PRUEBA DE HIPTESIS, en el ejemplo
tenemos una variable Y (Rendimiento Acadmico) y X (Horas de estudio a la
semana), en este caso ya sabemos que existe relacin entre ellos (a ms
horas de estudio mayor es el rendimiento), entonces no vamos a realizar la
PRUEBA DE HIPOTESIS, lo que vamos hacer es construir un modelo para
predecir el rendimiento acadmico en funcin al nmero de estudios a la
semana, suponiendo que el rendimiento acadmico depende nicamente de
cuantas horas una persona lo dedica al estudio una semana.
Analizar, Regresin y Lineales, en dependiente colocamos rendimiento
acadmico y en independientes horas de estudio a la semana y a sta
tambin podemos colocar otras variables que influyan en el rendimiento
acadmico.
En la Tabla Resumen del modelo podemos ver que en la columna R (R de
Pearson) tenemos un valor de 0.847 y el R cuadrado (columna) es de 0.718
por lo que, si sacamos un porcentaje, estamos hablando de un 71.8% un
valor muy alto para poder mencionar que: es posible construir un
modelo de regresin a partir de estas 2 variables? (incluso el R
cuadrado ajustado) tambin arroja 70.8%. y la respuesta nos da ANOVA
Anlisis de la Varianza (cuadro siguiente) y al ver la Significancia (Sig) se
puede ver que es de 0.000 y esta es menor a 0.05, por lo que SI ES POSIBLE
CONSTRUIR UN MODELO DE REGRESIN CON ESTAS 2 VARIABLES
ANALIZADAS.