Introducción al Modelo de Regresión Logística.

Disclaimer: Este texto es una sintetización del Capítulo 1 del Libro Logistic Regression: A Self-Learning Text de D.G. Kleinbaum et. al. ISBN 978-1-4419-1742-3.


Un inconveniente con la formulación del Modelo de Generalización Lineal es que no otorga garantía alguna de que la probabilidades que puedan ser pronosticadas por medio de 1 se encuentren dentro de un rango válido( 0 a 1 ). Si lo que se pretende es concebir un modelo capaz de pronosticar las probabilidades de que un conjunto de observaciones T pertenezcan a algún miembro del grupo discreto de clases Y, la variable de respuesta otorgada por el Modelo Lineal debe ser transformada para garantizar que esta se posicione en un rango de entre cero y uno.

1

El Método de Regresión Logística es un modelo matemático que puede ser utilizado para describir la relación entre un conjunto de variables exógenas y una variable dicotómica. Dicho procedimiento está basado en la Función Logística, misma que posee un rango de 0 a 1 y cuya definición se encuentra denotada en 2.

2

Así, cuando z tienda a −∞, f(z) tenderá a 0. De manera contraria, cuando z posea un valor que se incline a ∞, f(z) se aproximará a 1. De este modo, a partir de la Función Logística, se puede asegurar que un Modelo de Regresión Logística siempre mantendrá un valor entre 0 y 1, lo que vuelve a este paradigma una buena opción a considerar a la hora de trabajar bajo un contexto en el cual se procure estimar probabilidades.

3

Para alcanzar el Modelo Logístico a partir de la función logística, la variable z puede ser escrito como la suma lineal del vector de coeficientes constantes β y los atributos X pertenecientes a cada una observaciones del conjunto de datos a estudiar. Así, semejante variable combina las ponderaciones otorgadas por 1 y las sustituye en 4.

4

Visto de otro modo, el Modelo Logístico puede ser interpretado como la probabilidad de que un suceso dicotómico S ocurra en función de un conjunto de atributos exógenos k pertenecientes a un repositorio de inspecciones T.

5

Más aún, por conveniencia, la probabilidad P( S | X1, X2, …, Xk ) que se desea modelar puede ser expresada simplemente como P( X ) donde X hace alusión a la colección de variables independientes de X1 a Xk.

7

Un comentario en “Introducción al Modelo de Regresión Logística.

Deja un comentario