You are on page 1of 33

INTRODUCCION

La regresin logstica es un procedimiento cuantitativo de gran utilidad para problemas donde la variable dependiente toma valores en un conjunto finito

La regresin logstica es un instrumento estadstico de anlisis bivariado o multivariado, de uso tanto explicativo como predictivo
La regresin logstica predice directamente la probabilidad de ocurrencia de un suceso dado las variables regresoras, esta tomara valores que estarn entre 0 y 1

El objetivo primordial de esta tcnica es el de modelar como influyen las variables regresoras en la probabilidad de ocurrencia de un suceso particular

El Objetivo es intentar estimar o proximar el valor de una caracterstica variable dependiente) en funcin de los valores que pueden tomar en conjunto otra serie de caractersticas (variables independientes), denominado entonces modelo con fines predictivos.

Razones para utilizar la Regresin Logstica

1.

La regresin logstica se usa cuando se requiere modelar la relacin entre una variable dependiente y una o mas variables independientes cuantitativas o cualitativas La Funcin de Relacin es una regresin intrnsecamente no lineal La varianza de una variable dicotmica no es constante, al cambiar los valores de las Xi los puntos de Y se abren en un abanico que refleja la heterocedasticidad

2.

Cuando Utilizar Regresin Logstica

Cuando el objetivo es calcular la probabilidad de un suceso en funcin de varias variables, podemos utilizar la regresin logstica

se utiliza cuando queremos investigar si una o varias variables explican una variable dependiente que toma un carcter cualitativo.

Cuando tengamos una variable dependiente dicotmica (0/1; SI/NO; VIVO/MUERTO;CURADO/NO-CURADO, etc.) que deseemos predecir, o para la que queramos evaluar la asociacin o relacin con otras (ms de una) variables independientes y de control.

Seleccin de las variables del modelo.

Existen varios mtodos para construir el modelo de regresin, es decir, para seleccionar de entre todas las variables que introducimos en el modelo, cuales son las que necesitamos
El modelo de . regresin se puede construir utilizando las siguientes tcnicas:

Tcnica de pasos hacia adelante (Forward)) : se introduce las variables en el modelo si cumplen una serie de condiciones, hasta que ninguna cumpla la condicin impuesta.

Tcnica de pasos hacia atrs (Backward) : se introducen en el modelo todas las variables y se van suprimiendo si cumplen una serie de condiciones definidas a priori hasta que no se pueden eliminar ms, ninguna variable cumpla la condicin impuesta.

Tcnica por pasos (Stepwise): combina los dos mtodos anteriores, introduciendo o eliminando variables del modelo si cumplen una serie de condiciones definidas hasta que ninguna variable satisfaga ninguna de las condiciones expuestas de entrada o salida del modelo

Tcnica de introducir todas las variables obligatoriamente (Enter): se obliga a que entren todas las variables seleccionadas, se va evaluando qu variable es la que menos participa en l y se elimina..

Modelos de regresin logstica


Son modelos estadsticos en los cuales se desea conocer la relacin entre: Una variable dicotmica dependiente cualitativa,

Una o ms variables explicativas independientes, o covariables.

Caractersticas Cuantificar la importancia de la relacin existente entre cada una de las covariables y la variable dependiente, lo que lleva implcito tambin clarificar la existencia de interaccin y confusin entre covariables respecto a la variable dependiente. Clasificar individuos dentro de las categoras de la variable dependiente, segn la probabilidad que tenga de pertenecer a una de ellas dada la presencia de determinadas covariables.

Ecuacin de partida

Ecuacin 1 siendo P(y=1|X) la probabilidad de que y tome el valor 1 (presencia de la caracterstica estudiada), en presencia de las covariables X (aqu X es un conjunto de n covariables x1, x2, ... , xn-1, xn).

Si dividimos la expresin anterior de la Ecuacin 1 por su complementario, es decir, si construimos su odds, obtenemos una expresin de ms fcil manejo matemtico:

Ecuacin 2

Si ahora realizamos su transformacin logartmica con el logaritmo natural, obtenemos una ecuacin lineal que es lgicamente de manejo matemtico an ms fcil y de mayor comprensin:

Ecuacin 3

En la expresin de la Ecuacin 3 vemos a la izquierda de la igualdad el llamado logit, es decir, el logaritmo natural de la odss de la variable dependiente. El trmino a la derecha de la igualdad es la expresin de un recta, idntica a la del modelo general de regresin lineal:

Ecuacin 4

Siguiendo el ejemplo de las Figuras 1 y 2, podemos representar el logit frente a la edad de la forma que se observa en la Figura

Error

En el modelo de regresin lineal se asume que los errores estndar de cada coeficiente siguen una distribucin normal de media 0 y varianza constante.

Ecuacin 5

Estimaciones de los coeficientes

Para la estimacin de los coeficientes del modelo y de sus errores estndar se recurre al clculo de estimaciones de mxima verosimilitud, Estas estimaciones no son de clculo directo, como ocurre en el caso de las estimaciones de los coeficientes de regresin de la regresin lineal mltiple por el mtodo de los mnimos cuadrados.

El estadstico de Wald
Contrasta la hiptesis de que un coeficiente aislado es distinto de 0, y sigue una distribucin normal de media 0 y varianza 1. Su valor para un coeficiente concreto viene dado por el cociente entre el valor del coeficiente y su correspondiente error estndar.

El estadstico G de razn de verosimilitud

Se trata de ir contrastando cada modelo que surge de eliminar de forma aislada cada una de las covariables frente al modelo completo. mismo.

La prueba Score.
Su clculo para el caso de una nica variable viene dado por la Ecuacin 6.

Ecuacin 6

La variable dependiente, en lugar de ser de intervalo, es dicotmica y se maneja en trminos logit

El mtodo de obtener los parmetros no es el de mnimos cuadrados, sino el de mxima verosimilitud.

Regresin Logstica

En Economa

Empresa bajo riesgo financiero o no Empresa rentable o no rentable xito de ventas frente a fracaso en ventas

Anlisis de Datos

EN VETERINARIA

V. Dependiente (alcanza, no alcanza el peso al destete fin de la lactancia)

V. Independientes: Raza, Peso al Nacer, Ganancia de peso, Indice de Quetelet (Masa corporal).
Anlisis de Datos

Expresiones de la Regresin Logstica

Odds Ratio De gran utilidad en estudios de casos y controles

- Razn de ventajas - Razn de desigualdades

- Razn de momios - Transformacin logstica - Razn de verosimilitud Cociente de posibilidades

Su valor es independiente de la incidencia de la condicin en estudio.

Razn de oportunidades

1.Determinar si una variable explicativa tiene coeficiente igual a cero. 2. Determinar si un conjunto de variables explicativas tienen coeficientes igual a cero. 3. Determinar la calidad del ajuste global del modelo.

Esta prueba se usa para evaluar la significancia estadstica de cada variable explicativa o regresora

LA ESTADSTICA DE WALD

Cuando el valor absoluto del coeficiente de Regresin es grande, el error estndar tambin lo es

Esta situacin hace que la estadstica W sea pequea y por tanto se puede rechazar b j igual a cero, cuando en realidad no debera rechazarse.

1. Determinar si una variable explicativa tiene coeficiente igual a cero. 2. Determinar si un conjunto de variables explicativas tienen coeficientes igual a cero.

3. Determinar la calidad del ajuste global del modelo.

Bajo la hiptesis de que los coeficientes de las variables retiradas son iguales a cero, la estadstica tiene una distribucin asinttica

Valores altos para esta estadstica indican que una o ms de las q variables retiradas tienen coeficiente de regresin distinto de cero.

La regresin logstica puede utilizarse como mtodo descriptivo cuando se desea estudiar desde una perspectiva epidemiolgica la aparicin de un determinado evento en un grupo de individuos, por ejemplo:
Los pacientes de una determinada enfermedad desarrollan un cierto signo propio de sta.

Los nios dejan la lactancia materna exclusiva.

El fallecimiento de individuos de una cohorte

CONCLUSIONES

La regresin logstica, son modelos de regresin que permiten estudiar si una variable binomial depende, o no, de otra u otras variables (no necesariamente binomiales).

En la regresion logistica tenemos efectos lineales de las variables en el valor del logit
Es por tanto, una tcnica multivariante de dependencia ya que trata de estimar la probabilidad de que ocurra un suceso en funcin de la dependencia de otras variables

Anlisis de Datos

Gracias

You might also like