Saltar al contenido principal

Construcción de un diagrama de caja y bigotes

Diagrama de caja y bigotes

Construction of Box-and-Whisker plot

Un diagrama de caja y bigotes (Tukey, 1977) se construye de la siguiente manera:

  • Se dibuja un cuadro del 1er al 3er cuartil (los percentiles 25 y 75)
  • Se dibuja una línea horizontal en la mediana (el percentil 50)
  • El rango intercuartil (RIC) se calcula: RIC = 3er − 1er cuartil
  • Se dibuja una línea imaginaria en el tercer cuartil + 1,5 × RIQ; esta es la valla interna superior
  • el valor más alto (observación, medición) justo debajo de la valla interior superior es el valor adyacente superior ; se dibuja una línea horizontal en este valor;
  • Se traza una línea vertical desde el tercer cuartil hasta el valor adyacente superior.
  • Se dibuja una línea imaginaria en el tercer cuartil + 3 × RIQ; esta es la valla exterior superior
  • Todos los valores superiores a la valla interior superior siempre se representan en el gráfico.
    • Un valor superior al límite exterior superior se denomina valor muy alejado (se dibujan utilizando un símbolo diferente).
    • Un valor superior al límite interior superior, pero no superior al límite exterior superior, se denomina valor exterior.
  • Se dibujan líneas similares en la parte inferior del gráfico.

Tenga en cuenta que John Tukey no utilizó el término 'valor atípico' para los valores 'externos' y 'muy alejados'.

Diagrama de caja y bigotes con muescas

Construction of notched Box-and-Whisker plot

Un diagrama de caja y bigotes con muescas (McGill et al., 1978) se construye de la misma manera que un diagrama de caja y bigotes (descrito anteriormente), pero en esta variación del diagrama de caja y bigotes se proporciona un intervalo de confianza (*) para la mediana por medio de muescas que rodean las medianas.

(La ilustración no muestra todos los detalles del diagrama de caja y bigotes habitual)

Las muescas que rodean las medianas proporcionan una medida de la significancia aproximada de las diferencias entre los valores. Específicamente, si las muescas alrededor de dos medianas no se superponen en la visualización, las medianas son, aproximadamente, significativamente diferentes con un nivel de confianza del 95% (McGill et al., 1978).

En el siguiente ejemplo, probablemente no haya una diferencia significativa entre las medianas de las dos muestras porque las muescas se superponen.

Comparison of medians using Notched Box-and-Whisker plot

MedCalc calcula las muescas según McGill et al. (1978), de la siguiente manera:

$$ Mediana\;±\;1.7\;\frac{1.25\;RIC}{ 1.35\;\sqrt{N}} $$

donde RIC es el rango intercuartil y N es el número de casos en la muestra.

(*) Importante: Este intervalo de confianza no es un intervalo de confianza del 95 % de la mediana. Es un intervalo de confianza que permite la comparación de las medianas.

Literatura

  • McGill R, Tukey JW, Larsen WA (1978) Variations of box plots. The American Statistician, 32, 12-16.
  • Tukey JW (1977) Exploratory data analysis. Reading, Mass: Addison-Wesley Publishing Company.

Procedimientos de MedCalc que ofrecen diagramas de caja y bigotes

Véase también