You are on page 1of 8

Universidad Latina De Panam

Sede De David

Facultad Ciencias De La Salud Dr William
Gorgas
Escuela De Enfermera

Segundo Semestre-2014

Bioestadsticas
Anlisis De Correlacion

Equipo De Trabajo:
Acevedo P., Virtudes C.
Caballero, Yarelis J.

Anlisis de correlacin
Correlacin
Es la medida del grado de relacin entre dos o mas variables.
Con variables nominales suele utilizarse el termino asociacin para indicar el grado de relacin entre
las variables.
Analisis de Correlacion
El anlisis de correlacin emplea mtodos para medir la significacin del grado o intensidad de
asociacin entre dos o ms variables. El concepto de correlacin est estrechamente vinculado al
concepto de regresin, pues, para que una ecuacin de regresin sea razonable los puntos
muestrales deben estar ceidos a la ecuacin de regresin; adems el coeficiente de correlacin
debe ser:
Grande cuando el grado de asociacin es alto (cerca de +1 o -1, y pequeo cuando es bajo,
cerca de cero.
Independiente de las unidades en que se miden las variables.

Correlacion simple
La relacin entre dos variables cuantitativas para verificar su relacin se llama: correlacin simple,
porque slo involucra una variable independiente. Mientras que la relacin entre varias variables
independientes con una dependiente se llama correlacin mltiple.
La relacin entre dos variables manteniendo el resto constante recibe el nombre de correlacin
parcial.
La correlacion con una sola variable independiente se llama: Simple.
La correlacion con ms de una variable independiente se llama: Mltiple.
La correlacion de un grupo de variables dependientes con un grupo de variables independientes, es
decir, entre grupo de variables se llama: correlacion canonica.

Coeficiente de correlacion segn la naturaleza de las variables
El grado de relacin entre variables depende de la naturaleza de las variables involucradas en el
estudio o investigacin.
En este sentido, si ambas variables son nominales la relacin ser descrita con el Estadistico X -
Cuadrado. Si ambas variables son ordinales se describe la relacin de correlacion de Spearman. Si
ambas variables son intercalares mediante el coeficiente de Pearson. Si una variable es nominal y la
otra es intervalar la relacin puede ser descrita mediante el coeficiente - Cuadrado. Si ambas
variables son dicotmicas o binarias la relacin puede establecerse mediante el Coeficiente .
La relacin entre dos fenmenos puede ser: estricta, funcional o nula. La relacin entre talla-peso
no es estricta, ya que no existe una proporcionalidad simple entre ambas variables; pero tampoco es
nula, pues de lo contrario ambas variables serian independientes entre s. No obstante, esta relacin
no resulta funcional, porque de lo contrario se podra captar matemticamente la dependencia
mediante una ecuacin de dos variables.
La correlacin tiene las mismas propiedades de los vectores: magnitud, direccin y sentido.
En tal sentido, se habla de correlacin positiva o directa cuando ambas caractersticas presentan la
misma tendencia porque a medida que una aumenta se espera que la otra variable aumente pero
esta relacin en los seres vivos no es indefinida sino hasta cierta edad. Es decir, hay una variable
reguladora la edad en este caso.
En este mismo orden de ideas, se habla de correlacin negativa o inversa cuando una variable
aumenta y la otra disminuye, mostrando tendencias claramente opuestas, es el caso de la oferta y el
precio en el mbito de la economa. Cuando la oferta aumenta, el precio tiende a bajar.
Correlacin como medida de la confiabilidad de un Instrumento de medicin o Test.
La correlacin es la base utilizada para evaluar la confiabilidad de un instrumento de medicin o test.
Si los puntajes fueron medidos en base a una escala Likert, se utilizara el coeficiente de Cronbach,
pero si los puntajes provienen de alternativas dicotmicas o binarias (si, no) se utilizara el coeficiente
el Coeficiente de Kuder-Richardson.
Por otra parte existe un coeficiente de particin por mitades o Correlacin de Spearman-Brown
que mide el grado de homogeneidad de un test; cuando las correlaciones entre la primera y la
segunda mitad del test, o entre pares e impares es lo ms elevada posible y en todo caso mayor que
0,70, se concluye que el test es confiable.
La correlacin tambin hace posible el clculo del coeficiente de Determinacin R que se utiliza
como medida de la Bondad de ajuste de un modelo de Regresin.
En general, si el valor de R es mayor en comparacin a otro modelo, el modelo que posea un R
mayor ser el de mayor ajuste. El R, comienza a ser importante si sobrepasa el valor 0,70. Este
coeficiente siempre es positivo.

Correlacion parcial
Se define como la correlacion entre dos variables intervenientes controladas.
Es muy til cuando entre las variables no se manifiestan las verdaderas correlaciones a causa de
que una tercera variable opaca la relacin que hay entre aquellas dos.

Coeficiente de confiabilidad -Cronbach
Validez
Es la eficacia con que un instrumento mide lo que pretende medir.

Confiabilidad
Es el grado con que se obtienen resultados similares en distintas aplicaciones.
Anlisis de Regresin y Correlacin
El anlisis de regresin consiste en emplear mtodos que permitan determinar la mejor relacin
funcional entre dos o ms variables concomitantes (o relacionadas). El anlisis de correlacin
estudia el grado de asociacin de dos o ms variables.
Analisis de Regresion
Una relacion funcional matemticamente hablando, est dada por:
Y = f(x1,...,xn; 1,...,m) donde:
Y : Variable respuesta (o dependiente)
xi : La i-sima variable independiente (i=1,..,n)
j : El j-simo parmetro en la funcin (j=1,..,m)
f : La funcin
Para elegir una relacin funcional particular como la representativa de la poblacin bajo
investigacin, usualmente se procede:
1) Una consideracin analtica del fenmeno que nos ocupa, y
2) Un examen de diagramas de dispersin.
Una vez decidido el tipo de funcin matemtica que mejor se ajusta (o representa nuestro concepto
de la relacin exacta que existe entre las variables) se presenta el problema de elegir una expresin
particular de esta familia de funciones; es decir, se ha postulado una cierta funcin como trmino del
verdadero estado en la poblacin y ahora es necesario estimar los parmetros de esta funcin
(ajuste de curvas).
Como los valores de los parmetros no se pueden determinar sin errores por que los valores
observados de la variable dependiente no concuerdan con los valores esperados, entonces la
ecuacin general replanteada, estadsticamente, sera:
Y = f(x1,...xn;1,...,m) + donde respresenta el error cometido en el intento de observar la
caracterstica en estudio, en la cual muchos factores contribuyen al valor que asume .
Regresion Lineal Simple
Cuando la relacin funcional entre las variables dependiente (Y) e independiente (X) es una lnea
recta, se tiene una regresin lineal simple, dada por la ecuacin
Y = o + 1X +
donde:
o : El valor de la ordenada donde la lnea de regresin se intersecta al eje Y.
1 : El coeficiente de regresin poblacional (pendiente de la lnea recta)
: El error.
Suposiciones de la regresin lineal
1. Los valores de la variable independiente X son "fijos".
2. La variable X se mide sin error (se desprecia el error de medicin en X)
3. Existe una subpoblacin de valores Y normalmente distribuido para cada valor de X.
4. Las variancias de las subpoblaciones de Y son todas iguales.
5. Todas las medias de las subpoblaciones de Y estn sobre la misma recta.
6. Los valores de Y estn normalmente distribuidos y son estadsticamente independientes.
Los supuestos del 3 al 6 equivalen a decir que los errores son aleatorios, que se distribuyen
normalmente con media cero y variancia .
Terminologia:
Promedios


Sumas de cuadrados y productos de X e Y.
SCY =


SCY tambin corresponde a la suma de cuadrados total = SC total
Estimacin de parmetros
La funcin de regresin lineal simple es expresado como:
Y = o + 1X +
La estimacin de parmetros consiste en determinar los parmetros o y 1 a partir de los datos
muestrales observados; es decir, deben hallarse valores como bo y b1 de la muestra, que
represente a o y 1, respectivamente.
Empleando el mtodo de los mnimos cuadrados, es decir minimizando la suma de cuadrados de los
errores, se determinan los valores de bo y b1.
El coeficiente de regresin (b1) .- pendiente de la recta de regresin, representa la tasa de
cambio de la respuesta Y al cambio de una unidad en X.
Si b1=0, se dice que no existe relacin lineal entre las dos variables.
Fuentes de variacin en la regresin lineal
Los clculos de regresin pueden ser vistos como un proceso de particin de la suma total de
cuadrados; as, grficamente se tiene:
Se observa que la desviacin total para un Yi en particular es igual a la suma de las desviaciones
explicada e inexplicada, simblicamente.
Luego:
Q=
b0 : es el valor que representa (estimador) a 0 constituye el intercepto cuando X=0;
b1 : es el valor que representa (estimador) a 1.
Sus desviaciones estandares respectivas son:
n SCX
CMresidual Sb X i
.
.
0
2 =
SCX
CMresidual Sb1 =

Luego, la ecuacin de regresin es: y = bo + b1X
El coeficiente de regresin (b1) .- pendiente de la recta de regresin, representa la tasa de cambio
de la respuesta Y al cambio de una unidad en X.
Si b1=0, se dice que no existe relacin lineal entre las dos variables. F. de Mendiburu
4
Fuentes de variacin en la regresin lineal
Los clculos de regresin pueden ser vistos como un proceso de particin de la suma total de
cuadrados; as, grficamente se tiene:
(y ) (y ) (y y )
i i i i
y y
) )
= + F. de Mendiburu
5- Se observa que la desviacin total para un Yi en particular es igual a la suma de las desviaciones
explicada e inexplicada, simbolicamente.
Luego:
(y y) = (y y) + (y y )
i i i i
2 ) 2 ) 2
SC total = SC regresion + SC residual
Suma de Cuadrados del Total (SCT), mide la dispersin (variacin total) en los valores observados
de Y. Este trmino se utiliza para el clculo de la variancia de la muestra.
Suma de Cuadrados explicada (Suma de Cuadrados debido a la Regresin, SCR) mide la
variabilidad total en los valores observados de Y en consideracin a la relacin lineal entre X e Y.
Suma de Cuadrados residual (inexplicada, Suma de Cuadrados del Error, SCE) mide la dispersin
de los valores Y observados respecto a la recta de regresin Y (es la cantidad que se minimiza
cuando se obtiene la recta de regresin).
Anlisis de Variancia para la regresin lineal simple
Cuando cada particin se asocia a una porcin correspondiente del total de grados de libertad, la
tcnica es conocida cono analisis de variancia (ANVA), que generalmente se presenta en un cuadro
de la siguiente forma:
Cuadro del ANVA.
Fuentes Grados de Libertad
Suma de Cuadrados (SC)
Cuadrados Medios (CM) Fc
Regresion 1 b1.SPXY b1.SPXY CM (regresion)/
CM(residual)
Residual: Error n-2 Diferencia SC(residual) / (n-
2)
Total n-1 SC Y
La prueba estadstica F evalua las hiptesis:
Hp: 1 = 0. No existe una regresin lineal entre X e Y.
Ha: 1 0. Existe regresion lineal de Y en funcin de X. F. de Mendiburu
6
Para el ejemplo del grafico (ao base 1990 = 0)
Aos (X) 0 1 2 3 4 5 6 7 8 9
Madera Aserrada (Y) 489.25 475.24 495.72 585.2 565.78 630.22 624.92 482.27 590.27 834.67
Gl SC CM F F0.05 Pr>F
Regression 1 49223 49223 6,9941 5,31 0,0295
Residual 8 56303 7037.8
Total 9 105526
Modelo de regresion estimado:
Total de Madera aserrada (miles de m3 ) = 467,42 + 24,42 X
X = El periodo.
R = (49223 / 105526) *100% = 46%
Intercepto = 467,42
Tasa = 24,42
Significa que el crecimiento anual es de 24 mil metros cubicos.
Intervalos de Confianza
Intervalos de confianza para 1 (tasa)
En muchos casos es de inters conocer entre que valores se encuentra el coeficiente de regresin
de la poblacin 1 para un cierto grado de confianza fijada, este procedimiento permite hallar los
valores llamados lmites de confianza, as:

You might also like