Saltar al contenido principal
MedCalc
Enviar una copia en PDF de esta página a:
(Su dirección de correo electrónico no se añadirá a una lista de distribución)
working

Regresión ponderada: ejemplo resuelto

El problema de la heterocedasticidad

En el análisis de regresión, la heterocedasticidad se refiere a una situación en la que la varianza de la variable dependiente (Y) varía a lo largo de los niveles de los datos independientes (X). La heterocedasticidad puede complicar el análisis, ya que este se basa en el supuesto de que la varianza es igual en todos los niveles de los datos independientes.

Diagrama de dispersión que muestra homocedasticidad Diagrama de dispersión que muestra heterocedasticidad.
Homocedasticidad Heteroscedasticidad

La regresión ponderada puede utilizarse para corregir la heterocedasticidad. En un procedimiento de regresión ponderada, se otorga mayor peso a las observaciones con menor varianza, ya que estas proporcionan información más fiable sobre la función de regresión que aquellas con varianzas elevadas.

Neter et al. (1996) sugieren el siguiente proceso para estimar los coeficientes de regresión en presencia de heterocedasticidad:

  1. Ajuste el modelo de regresión mediante mínimos cuadrados no ponderados y analice los residuos.
  2. Estime la función de varianza o la función de desviación estándar mediante la regresión de los residuos cuadrados o de los residuos absolutos en los predictores apropiados.
  3. Utilice los valores ajustados de la función de varianza estimada o desviación estándar para obtener los pesos w i.
  4. Estime los coeficientes de regresión utilizando estos pesos.

Cómo hacer esto automáticamente

MedCalc realizará estos pasos automáticamente cuando seleccione la variable ficticia '*** AutoWeight 1/SD^2 ***' para 'Pesos' en los cuadros de diálogo de regresión.

Cómo realizar cada paso en MedCalc

Si desea tener más control sobre el proceso, tal vez porque requiere algunas modificaciones de uno o más pasos, puede realizar cada uno de estos pasos utilizando Regresión ponderada y otras herramientas disponibles en MedCalc.

Este proceso se describe a continuación en detalle.

Los datos de este ejemplo están disponibles en la carpeta de archivos de muestra de MedCalc, archivo 'Regresión ponderada (Neter).mc1'. Este archivo contiene datos de edad y presión arterial diastólica (PAD) recopilados de 54 sujetos.

Datos de ejemplo de regresión ponderada

Fuente

Paso 1. Ajuste el modelo de regresión mediante mínimos cuadrados no ponderados y analice los residuos.

Hacemos clic en Regresión en el menú Estadísticas y completamos el cuadro de diálogo de la siguiente manera.

Cuadro de diálogo para regresión (ejemplo de regresión ponderada)

Variable Y, la variable dependiente es PAD (Presión arterial diastólica) y Variable X, la variable independiente es Edad.

No seleccionamos una variable para Pesos porque en este primer paso realizamos una regresión de mínimos cuadrados no ponderados ordinaria.

Obtenemos los siguientes resultados:

Resultados de regresión (ejemplo de regresión ponderada)

En la ventana de resultados, hacemos clic en el hipervínculo 'Guardar residuos' para guardar los residuos en una nueva columna de la hoja de cálculo.

Los residuos son las diferencias entre los valores observados de la variable dependiente DBP y los valores calculados utilizando la ecuación de regresión.

Guardar residuos (ejemplo de regresión ponderada)

En el cuadro de diálogo siguiente, hacemos clic Aceptar.

Guardar residuos (ejemplo de regresión ponderada)

Esto creará una nueva columna en la hoja de cálculo que contiene los residuos (variable 'REGR_Resid1'):

Guardar residuos (ejemplo de regresión ponderada)

Paso 2. Estime la función de varianza o la función de desviación estándar

En este paso, construimos un modelo de regresión de la desviación estándar en función de la edad. Para ello, regresionamos los valores absolutos de los residuos en función de la edad, ya que estos últimos son un estimador de la desviación estándar de la PAD para diferentes valores de edad.

Hacemos clic en Regresión en el menú Estadísticas y completamos el cuadro de diálogo de la siguiente manera:

Regresión del cuadro de diálogo (ejemplo de regresión ponderada)

Para la variable Y, primero seleccionamos la nueva variable 'REGR_Resid1' y luego edite la selección y cambie la variable a 'abs(REGR_Resid1)'.

Obtenemos los siguientes resultados:

Resultados de regresión (ejemplo de regresión ponderada)

Paso 3. Utilice los valores ajustados de la función de varianza estimada o desviación estándar para obtener los pesos.

En la última ventana de resultados, hacemos clic en el hipervínculo 'Guardar valores predichos' para guardar los valores predichos en una nueva columna de la hoja de cálculo.

Guardar valores previstos

En el cuadro de diálogo siguiente, hacemos clic Aceptar.

Guardar valores previstos

Esto creará una nueva columna en la hoja de cálculo que contiene los valores previstos (o estimados) de la desviación estándar (variable 'REGR_Pred1'):

Valores previstos guardados en una hoja de cálculo

Paso 4. Estime los coeficientes de regresión utilizando estos pesos.

Finalmente, podemos construir nuestro modelo de regresión ponderada.

Para los pesos, utilizamos el recíproco de los valores predichos al cuadrado para la desviación estándar (la varianza es la desviación estándar al cuadrado): a las observaciones con una desviación estándar grande se les da menos peso que a las observaciones con una desviación estándar menor.

$$ weight = \frac{1}{SD^2} $$

Hacemos clic en Regresión en el menú Estadísticas y completamos el cuadro de diálogo de la siguiente manera.

Regresión del cuadro de diálogo (ejemplo de regresión ponderada)

Para los pesos, primero seleccionamos la nueva variable 'REGR_Pred1' y luego edite la selección y cambie la variable a '1/REGR_Pred1^2'(también podríamos utilizar '1/(REGR_Pred1*REGR_Pred1)' o '1/Power(REGR_Pred1,2)'.

Obtenemos los siguientes resultados:

Resultados de regresión (ejemplo de regresión ponderada)

La ecuación de regresión final (ponderada) es

DBP = 55.5658 + 0.5963 Age

que no es muy diferente de la ecuación de regresión original (no ponderada)

DBP = 56.1569 + 0.5800 Age

Sin embargo, los errores estándar de los coeficientes de regresión son más pequeños, lo que resulta en intervalos de confianza más estrechos.

Literatura

  • Neter J, Kutner MH, Nachtsheim CJ, Wasserman W (1996) Applied linear statistical models. 4th ed. Boston: McGraw-Hill.

Véase también