Regresión ponderada: ejemplo resuelto
El problema de la heterocedasticidad
En el análisis de regresión, la heterocedasticidad se refiere a una situación en la que la varianza de la variable dependiente (Y) varía a lo largo de los niveles de los datos independientes (X). La heterocedasticidad puede complicar el análisis, ya que este se basa en el supuesto de que la varianza es igual en todos los niveles de los datos independientes.
![]() |
![]() |
| Homocedasticidad | Heteroscedasticidad |
La regresión ponderada puede utilizarse para corregir la heterocedasticidad. En un procedimiento de regresión ponderada, se otorga mayor peso a las observaciones con menor varianza, ya que estas proporcionan información más fiable sobre la función de regresión que aquellas con varianzas elevadas.
Neter et al. (1996) sugieren el siguiente proceso para estimar los coeficientes de regresión en presencia de heterocedasticidad:
- Ajuste el modelo de regresión mediante mínimos cuadrados no ponderados y analice los residuos.
- Estime la función de varianza o la función de desviación estándar mediante la regresión de los residuos cuadrados o de los residuos absolutos en los predictores apropiados.
- Utilice los valores ajustados de la función de varianza estimada o desviación estándar para obtener los pesos w i.
- Estime los coeficientes de regresión utilizando estos pesos.
Cómo hacer esto automáticamente
MedCalc realizará estos pasos automáticamente cuando seleccione la variable ficticia '*** AutoWeight 1/SD^2 ***' para 'Pesos' en los cuadros de diálogo de regresión.
Cómo realizar cada paso en MedCalc
Si desea tener más control sobre el proceso, tal vez porque requiere algunas modificaciones de uno o más pasos, puede realizar cada uno de estos pasos utilizando Regresión ponderada y otras herramientas disponibles en MedCalc.
Este proceso se describe a continuación en detalle.
Los datos de este ejemplo están disponibles en la carpeta de archivos de muestra de MedCalc, archivo 'Regresión ponderada (Neter).mc1'. Este archivo contiene datos de edad y presión arterial diastólica (PAD) recopilados de 54 sujetos.

Paso 1. Ajuste el modelo de regresión mediante mínimos cuadrados no ponderados y analice los residuos.
Hacemos clic en Regresión en el menú Estadísticas y completamos el cuadro de diálogo de la siguiente manera.

Variable Y, la variable dependiente es PAD (Presión arterial diastólica) y Variable X, la variable independiente es Edad.
No seleccionamos una variable para Pesos porque en este primer paso realizamos una regresión de mínimos cuadrados no ponderados ordinaria.
Obtenemos los siguientes resultados:

En la ventana de resultados, hacemos clic en el hipervínculo 'Guardar residuos' para guardar los residuos en una nueva columna de la hoja de cálculo.
Los residuos son las diferencias entre los valores observados de la variable dependiente DBP y los valores calculados utilizando la ecuación de regresión.

En el cuadro de diálogo siguiente, hacemos clic Aceptar.

Esto creará una nueva columna en la hoja de cálculo que contiene los residuos (variable 'REGR_Resid1'):

Paso 2. Estime la función de varianza o la función de desviación estándar
En este paso, construimos un modelo de regresión de la desviación estándar en función de la edad. Para ello, regresionamos los valores absolutos de los residuos en función de la edad, ya que estos últimos son un estimador de la desviación estándar de la PAD para diferentes valores de edad.
Hacemos clic en Regresión en el menú Estadísticas y completamos el cuadro de diálogo de la siguiente manera:

Para la variable Y, primero seleccionamos la nueva variable 'REGR_Resid1' y luego edite la selección y cambie la variable a 'abs(REGR_Resid1)'.
Obtenemos los siguientes resultados:

Paso 3. Utilice los valores ajustados de la función de varianza estimada o desviación estándar para obtener los pesos.
En la última ventana de resultados, hacemos clic en el hipervínculo 'Guardar valores predichos' para guardar los valores predichos en una nueva columna de la hoja de cálculo.

En el cuadro de diálogo siguiente, hacemos clic Aceptar.

Esto creará una nueva columna en la hoja de cálculo que contiene los valores previstos (o estimados) de la desviación estándar (variable 'REGR_Pred1'):

Paso 4. Estime los coeficientes de regresión utilizando estos pesos.
Finalmente, podemos construir nuestro modelo de regresión ponderada.
Para los pesos, utilizamos el recíproco de los valores predichos al cuadrado para la desviación estándar (la varianza es la desviación estándar al cuadrado): a las observaciones con una desviación estándar grande se les da menos peso que a las observaciones con una desviación estándar menor.
Hacemos clic en Regresión en el menú Estadísticas y completamos el cuadro de diálogo de la siguiente manera.

Para los pesos, primero seleccionamos la nueva variable 'REGR_Pred1' y luego edite la selección y cambie la variable a '1/REGR_Pred1^2'(también podríamos utilizar '1/(REGR_Pred1*REGR_Pred1)' o '1/Power(REGR_Pred1,2)'.
Obtenemos los siguientes resultados:

La ecuación de regresión final (ponderada) es
DBP = 55.5658 + 0.5963 Age
que no es muy diferente de la ecuación de regresión original (no ponderada)
DBP = 56.1569 + 0.5800 Age
Sin embargo, los errores estándar de los coeficientes de regresión son más pequeños, lo que resulta en intervalos de confianza más estrechos.
Literatura
- Neter J, Kutner MH, Nachtsheim CJ, Wasserman W (1996) Applied linear statistical models. 4th ed. Boston: McGraw-Hill.

