Professional Documents
Culture Documents
La regresin logstica es un procedimiento cuantitativo de gran utilidad para problemas donde la variable dependiente toma valores en un conjunto finito
La regresin logstica es un instrumento estadstico de anlisis bivariado o multivariado, de uso tanto explicativo como predictivo
La regresin logstica predice directamente la probabilidad de ocurrencia de un suceso dado las variables regresoras, esta tomara valores que estarn entre 0 y 1
El objetivo primordial de esta tcnica es el de modelar como influyen las variables regresoras en la probabilidad de ocurrencia de un suceso particular
El Objetivo es intentar estimar o proximar el valor de una caracterstica variable dependiente) en funcin de los valores que pueden tomar en conjunto otra serie de caractersticas (variables independientes), denominado entonces modelo con fines predictivos.
1.
La regresin logstica se usa cuando se requiere modelar la relacin entre una variable dependiente y una o mas variables independientes cuantitativas o cualitativas La Funcin de Relacin es una regresin intrnsecamente no lineal La varianza de una variable dicotmica no es constante, al cambiar los valores de las Xi los puntos de Y se abren en un abanico que refleja la heterocedasticidad
2.
Cuando el objetivo es calcular la probabilidad de un suceso en funcin de varias variables, podemos utilizar la regresin logstica
se utiliza cuando queremos investigar si una o varias variables explican una variable dependiente que toma un carcter cualitativo.
Cuando tengamos una variable dependiente dicotmica (0/1; SI/NO; VIVO/MUERTO;CURADO/NO-CURADO, etc.) que deseemos predecir, o para la que queramos evaluar la asociacin o relacin con otras (ms de una) variables independientes y de control.
Existen varios mtodos para construir el modelo de regresin, es decir, para seleccionar de entre todas las variables que introducimos en el modelo, cuales son las que necesitamos
El modelo de . regresin se puede construir utilizando las siguientes tcnicas:
Tcnica de pasos hacia adelante (Forward)) : se introduce las variables en el modelo si cumplen una serie de condiciones, hasta que ninguna cumpla la condicin impuesta.
Tcnica de pasos hacia atrs (Backward) : se introducen en el modelo todas las variables y se van suprimiendo si cumplen una serie de condiciones definidas a priori hasta que no se pueden eliminar ms, ninguna variable cumpla la condicin impuesta.
Tcnica por pasos (Stepwise): combina los dos mtodos anteriores, introduciendo o eliminando variables del modelo si cumplen una serie de condiciones definidas hasta que ninguna variable satisfaga ninguna de las condiciones expuestas de entrada o salida del modelo
Tcnica de introducir todas las variables obligatoriamente (Enter): se obliga a que entren todas las variables seleccionadas, se va evaluando qu variable es la que menos participa en l y se elimina..
Caractersticas Cuantificar la importancia de la relacin existente entre cada una de las covariables y la variable dependiente, lo que lleva implcito tambin clarificar la existencia de interaccin y confusin entre covariables respecto a la variable dependiente. Clasificar individuos dentro de las categoras de la variable dependiente, segn la probabilidad que tenga de pertenecer a una de ellas dada la presencia de determinadas covariables.
Ecuacin de partida
Ecuacin 1 siendo P(y=1|X) la probabilidad de que y tome el valor 1 (presencia de la caracterstica estudiada), en presencia de las covariables X (aqu X es un conjunto de n covariables x1, x2, ... , xn-1, xn).
Si dividimos la expresin anterior de la Ecuacin 1 por su complementario, es decir, si construimos su odds, obtenemos una expresin de ms fcil manejo matemtico:
Ecuacin 2
Si ahora realizamos su transformacin logartmica con el logaritmo natural, obtenemos una ecuacin lineal que es lgicamente de manejo matemtico an ms fcil y de mayor comprensin:
Ecuacin 3
En la expresin de la Ecuacin 3 vemos a la izquierda de la igualdad el llamado logit, es decir, el logaritmo natural de la odss de la variable dependiente. El trmino a la derecha de la igualdad es la expresin de un recta, idntica a la del modelo general de regresin lineal:
Ecuacin 4
Siguiendo el ejemplo de las Figuras 1 y 2, podemos representar el logit frente a la edad de la forma que se observa en la Figura
Error
En el modelo de regresin lineal se asume que los errores estndar de cada coeficiente siguen una distribucin normal de media 0 y varianza constante.
Ecuacin 5
Para la estimacin de los coeficientes del modelo y de sus errores estndar se recurre al clculo de estimaciones de mxima verosimilitud, Estas estimaciones no son de clculo directo, como ocurre en el caso de las estimaciones de los coeficientes de regresin de la regresin lineal mltiple por el mtodo de los mnimos cuadrados.
El estadstico de Wald
Contrasta la hiptesis de que un coeficiente aislado es distinto de 0, y sigue una distribucin normal de media 0 y varianza 1. Su valor para un coeficiente concreto viene dado por el cociente entre el valor del coeficiente y su correspondiente error estndar.
Se trata de ir contrastando cada modelo que surge de eliminar de forma aislada cada una de las covariables frente al modelo completo. mismo.
La prueba Score.
Su clculo para el caso de una nica variable viene dado por la Ecuacin 6.
Ecuacin 6
Regresin Logstica
En Economa
Empresa bajo riesgo financiero o no Empresa rentable o no rentable xito de ventas frente a fracaso en ventas
Anlisis de Datos
EN VETERINARIA
V. Independientes: Raza, Peso al Nacer, Ganancia de peso, Indice de Quetelet (Masa corporal).
Anlisis de Datos
Razn de oportunidades
1.Determinar si una variable explicativa tiene coeficiente igual a cero. 2. Determinar si un conjunto de variables explicativas tienen coeficientes igual a cero. 3. Determinar la calidad del ajuste global del modelo.
Esta prueba se usa para evaluar la significancia estadstica de cada variable explicativa o regresora
LA ESTADSTICA DE WALD
Cuando el valor absoluto del coeficiente de Regresin es grande, el error estndar tambin lo es
Esta situacin hace que la estadstica W sea pequea y por tanto se puede rechazar b j igual a cero, cuando en realidad no debera rechazarse.
1. Determinar si una variable explicativa tiene coeficiente igual a cero. 2. Determinar si un conjunto de variables explicativas tienen coeficientes igual a cero.
Bajo la hiptesis de que los coeficientes de las variables retiradas son iguales a cero, la estadstica tiene una distribucin asinttica
Valores altos para esta estadstica indican que una o ms de las q variables retiradas tienen coeficiente de regresin distinto de cero.
La regresin logstica puede utilizarse como mtodo descriptivo cuando se desea estudiar desde una perspectiva epidemiolgica la aparicin de un determinado evento en un grupo de individuos, por ejemplo:
Los pacientes de una determinada enfermedad desarrollan un cierto signo propio de sta.
CONCLUSIONES
La regresin logstica, son modelos de regresin que permiten estudiar si una variable binomial depende, o no, de otra u otras variables (no necesariamente binomiales).
En la regresion logistica tenemos efectos lineales de las variables en el valor del logit
Es por tanto, una tcnica multivariante de dependencia ya que trata de estimar la probabilidad de que ocurra un suceso en funcin de la dependencia de otras variables
Anlisis de Datos
Gracias