Saltar al contenido principal
MedCalc
Enviar una copia en PDF de esta página a:
(Su dirección de correo electrónico no se añadirá a una lista de distribución)
working

Gráfico de violín

Ilustration of a violin plot

El gráfico de violín (Hintze y Nelson, 1998) combina el diagrama de caja y bigotes (Tukey, 1977) y una traza de densidad de datos en un solo diagrama. Esta traza complementa las estadísticas de resumen tradicionales al mostrar gráficamente características distributivas más detalladas de los datos. MedCalc suaviza la traza de densidad mediante un estimador de densidad kernel.

La ilustración muestra, a la izquierda, la distribución de los datos como puntos, y a la derecha, el diagrama de violín correspondiente. Dentro del diagrama de violín se dibuja un pequeño diagrama de caja y bigotes.

La gráfica del violín es más amplia en las secciones donde hay más datos y más estrecha en las secciones donde hay menos datos.

Al igual que los diagramas de caja, los diagramas de violín ilustran muy bien las diferencias entre distribuciones de variables o entre subcategorías de una o más variables; pero sólo cuando los rangos de las distribuciones no son demasiado diferentes.

Ejemplo de gráfico de violín en MedCalc:

Ejemplo de gráfico de violín

Observe que el área de superficie de ambos violines es la misma (vea los detalles matemáticos a continuación).

Formateo del gráfico del violín

Para cambiar el color de línea y el estilo de relleno de los violines, haga clic derecho en un violín y seleccione 'Formato de gráfico de violín':

Formato del gráfico gráfico del violín

Puede seleccionar los colores y estilos en el siguiente cuadro de diálogo:

Formato del gráfico gráfico del violín

Ancho máximo del violín

En principio, la superficie de cada violín dentro del mismo gráfico debería ser la misma (véanse los detalles matemáticos a continuación). Al seleccionar la opción 'Igualar el ancho de todos', cada violín se amplía al máximo ancho posible en el gráfico.

Con la opción 'Hacer todos del mismo ancho', el gráfico resultante es:

Los gráficos de violín tienen el mismo ancho

Esto puede resultar estéticamente más atractivo en algunos casos. Sin embargo, podría ser engañoso, ya que, al observar el ejemplo a continuación, la figura sugiere que, con el ancho máximo de cada violín, el número de cajas (o más bien, la densidad) es el mismo en ambas muestras. Sin embargo, esto no es así, ya que el ancho del violín del lado izquierdo es mayor de lo debido.

Tenga en cuenta que este ejemplo se generó utilizando dos muestras con el mismo tamaño de muestra.

Utilice esta opción con cuidado.

Detalles matemáticos

El estimador de densidad del kernel se define de la siguiente manera:

$$\widehat{f}_h(x) = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big) $$

donde K es la función kernel:

$$ K\Big(\frac{x-x_i}{h}\Big) = \frac{1}{\sqrt{2\pi}} e^{-\frac{(x-x_i)^2}{2h^2}} $$

y el parámetro h es un parámetro de suavizado, que en MedCalc se define como:

$$h = 0.9\, \min\left(\hat{\sigma}, \frac{RIC}{1.34}\right)\, n^{\frac{-1}{5}}$$

donde $\hat{\sigma}$ es la desviación estándar de la muestra, n es el tamaño de la muestra y RIC es el rango intercuartil.

Nótese que el área bajo la curva de densidad del núcleo para cada 'violín' es 1 y, por lo tanto, el área de superficie de cada violín es la misma, independientemente del tamaño de la muestra.

Literatura

  • Hintze JL, Nelson RD (1998) Violin Plots: A Box Plot-Density Trace Synergism. The American Statistician 52:181-184.
  • Tukey JW (1977) Exploratory data analysis. Reading, Mass: Addison-Wesley Publishing Company.

Procedimientos de MedCalc que ofrecen gráficos de violín

Para obtener un gráfico de violín con el diagrama de caja y bigotes dentro, debe seleccionar ambas opciones en el cuadro de diálogo del gráfico.

Véase también