Construcción de un diagrama de caja y bigotes
Diagrama de caja y bigotes
Un diagrama de caja y bigotes (Tukey, 1977) se construye de la siguiente manera:
- Se dibuja un cuadro del 1er al 3er cuartil (los percentiles 25 y 75)
- Se dibuja una línea horizontal en la mediana (el percentil 50)
- El rango intercuartil (RIC) se calcula: RIC = 3er − 1er cuartil
- Se dibuja una línea imaginaria en el tercer cuartil + 1,5 × RIQ; esta es la valla interna superior
- el valor más alto (observación, medición) justo debajo de la valla interior superior es el valor adyacente superior ; se dibuja una línea horizontal en este valor;
- Se traza una línea vertical desde el tercer cuartil hasta el valor adyacente superior.
- Se dibuja una línea imaginaria en el tercer cuartil + 3 × RIQ; esta es la valla exterior superior
- Todos los valores superiores a la valla interior superior siempre se representan en el gráfico.
	- Un valor superior al límite exterior superior se denomina valor muy alejado (se dibujan utilizando un símbolo diferente).
- Un valor superior al límite interior superior, pero no superior al límite exterior superior, se denomina valor exterior.
 
- Se dibujan líneas similares en la parte inferior del gráfico.
Tenga en cuenta que John Tukey no utilizó el término 'valor atípico' para los valores 'externos' y 'muy alejados'.
Diagrama de caja y bigotes con muescas
Un diagrama de caja y bigotes con muescas (McGill et al., 1978) se construye de la misma manera que un diagrama de caja y bigotes (descrito anteriormente), pero en esta variación del diagrama de caja y bigotes se proporciona un intervalo de confianza (*) para la mediana por medio de muescas que rodean las medianas.
(La ilustración no muestra todos los detalles del diagrama de caja y bigotes habitual)
Las muescas que rodean las medianas proporcionan una medida de la significancia aproximada de las diferencias entre los valores. Específicamente, si las muescas alrededor de dos medianas no se superponen en la visualización, las medianas son, aproximadamente, significativamente diferentes con un nivel de confianza del 95% (McGill et al., 1978).
En el siguiente ejemplo, probablemente no haya una diferencia significativa entre las medianas de las dos muestras porque las muescas se superponen.
MedCalc calcula las muescas según McGill et al. (1978), de la siguiente manera:
donde RIC es el rango intercuartil y N es el número de casos en la muestra.
(*) Importante: Este intervalo de confianza no es un intervalo de confianza del 95 % de la mediana. Es un intervalo de confianza que permite la comparación de las medianas.
Literatura
- McGill R, Tukey JW, Larsen WA (1978) Variations of box plots. The American Statistician, 32, 12-16.
- Tukey JW (1977) Exploratory data analysis. Reading, Mass: Addison-Wesley Publishing Company.
Procedimientos de MedCalc que ofrecen diagramas de caja y bigotes
- Diagrama de caja y bigotes: diagrama de caja y bigotes para una variable (sin diagrama de caja y bigotes con muescas)
- Gráficos de comparación de datos: diagramas de caja y bigotes para dos variables
- Gráficos de comparación múltiple: diagramas de caja y bigotes para subgrupos (clasificación unidireccional) de una variable
- Gráficos de comparación múltiple agrupados: diagramas de caja y bigotes para subgrupos (clasificación de dos vías) de una variable
- Gráficos de múltiples variables: diagramas de caja y bigotes para varias variables
- Gráficos de variables múltiples agrupadas: diagramas de caja y bigotes para subgrupos de varias variables
 Digimizer
Digimizer