Cálculo de la media recortada, el EE y el intervalo de confianza
La media recortada k veces se calcula como la media de la muestra después de eliminar las k observaciones más pequeñas y las k observaciones más grandes de la muestra.
Si el número de observaciones a recortar se especifica como un porcentaje p, entonces p es el porcentaje de observaciones que se recortan en cada extremo de la muestra. Por ejemplo, si el porcentaje es del 20%, entonces MedCalc recorta un 20% en el extremo inferior y un 20% en el extremo superior.
Con la proporción $ \gamma $ siendo $ p/100 $, el número de observaciones a recortar k se da por $$ k = trunc (n \gamma) $$
Si $n \gamma $ no es un número entero, se trunca al entero más grande o más pequeño (redondeado hacia abajo). Tenga en cuenta que SPSS, R (y Excel) también redondean hacia abajo, pero SAS redondea hacia arriba.
La media recortada k veces se calcula como
El error estándar (EE) de la media recortada se basa en la media Winsorizada y la suma de las desviaciones cuadradas Winsorizada (Tukey y McLauglin, 1963). La media Winsorizada se calcula como
y la suma Winsorizada de las desviaciones cuadradas se calcula como
El error estándar de la media recortada se puede calcular entonces como:
El intervalo de confianza para la media recortada se define como
Comparación de 2 medias recortadas independientes, prueba de Yuen-Welch
Estos cálculos se basan en el método dado por Yuen, 1974 (ver Wilcox, 2022).
La estadística de prueba de Yuen es
$$ T = \frac{ \bar{x}_{wk1} - \bar{x}_{wk2} } { \sqrt {d_1 + d_2 } } $$donde $d_1$ y $d_2$ son los cuadrados de los errores estándar de las 2 medias muestrales.
Los grados de libertad estimados son:
$$ gl = \frac {(d_1+d_2)^2} { \frac{d_1^2}{h_1-1}+\frac{d_2^2}{h_2-1} } $$donde $ h_j = n_j-2k_j $ es el número de observaciones que quedan después del recorte.
El valor P se toma de la distribución t con gl grados de libertad.
El intervalo de confianza del 95% para la diferencia es
$$ (\bar{x}_{wk1} - \bar{x}_{wk2}) \pm t \sqrt {d_1 + d_2 } $$dónde el es el cuartil $ 1- \alpha / 2 $ de la distribución t con gl grados de libertad.
Comparación de las medias recortadas de muestras apareadas
Estos cálculos se basan en el método dado por Wilcox, 2022.
El error estándar cuadrado de la diferencia entre las medias $ \bar{x}_{wk1} - \bar{x}_{wk2} $ se estima con: $$ \frac {1}{h(h-1)} \left\{ \sum { (x_{1i}-\bar{x}_{wk1})^2 } + \sum { (x_{2i}-\bar{x}_{wk2})^2 } - 2 \sum { (x_{1i}-\bar{x}_{wk1})({x_{2i}-\bar{x}_{wk2}) } } \right\} $$
donde $ h = n-2k $ es el número de observaciones que quedan después del recorte.
Alquiler
$$ d_j = \frac {1}{h(h-1)} \sum { (x_{ji}-\bar{x}_{wkj})^2 } $$y
$$ d_{12} = \frac {1}{h(h-1)} \sum { (x_{1i}-\bar{x}_{wk1})({x_{2i}-\bar{x}_{wk2}) } } $$La estadística de prueba T se da por $$ T = \frac{ \bar{x}_{wk1} - \bar{x}_{wk2} } { \sqrt {d_1 + d_2 - 2d_{12}} } $$
El valor P se toma de la distribución t con h−1 grados de libertad.
El intervalo de confianza del 95% para la diferencia es
$$ (\bar{x}_{wk1} - \bar{x}_{wk2}) \pm t \sqrt {d_1 + d_2 - 2d_{12}} $$dónde el es el cuartil $ 1- \alpha / 2 $ de la distribución t con h−1 grados de libertad.
Referencias
- Tukey JM, McLaughlin DH (1963) Less Vulnerable Confidence and Significance Procedures for Location Based on a Single Sample: Trimming/Winsorization 1. Sankhya A, 25:331–352.
- Wilcox RR (2022) Introduction to robust estimation and hypothesis testing. 5th ed. Elsevier Academic Press.
- Yuen KK (1974) The two-sample trimmed t for unequal population variances. Biometrika 61:165-170.
 Digimizer
Digimizer