Las medidas de dispersión son herramientas clave en la estadística descriptiva, ya que permiten evaluar la variabilidad de los datos y su distribución. En contextos laborales, ayudan a identificar inconsistencias, optimizar procesos y tomar decisiones fundamentadas en datos.
Son esenciales para detectar inconsistencias, riesgos y patrones en datos, como por ejemplo en el área laboral, en salarios, productividad o tiempos de respuesta.
La varianza mide la dispersión de los datos respecto a la media. Su cálculo implica obtener el promedio de las desviaciones al cuadrado de cada dato respecto a la media.

Varianza de una Población: Cuando se tienen datos de toda la población (es decir, el conjunto completo que queremos estudiar), la fórmula es:
$$ \sigma^2 = \frac{\sum (x_i - \mu)^2}{N} $$
Varianza de una Muestra: Cuando se trabaja con una muestra (un subconjunto de la población), usamos una fórmula diferente porque las muestras tienden a subestimar la varianza real. Para compensarlo, se divide entre n−1 (en lugar de n)
$$ s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1} $$
Interpretación:
⬆️ Varianza alta: mayor dispersión de los datos.
⬇️ Varianza baja: datos más agrupados alrededor de la media.
En una fábrica, se miden los pesos de productos empaquetados en dos líneas de producción.
| Línea 1 | Línea 2 |
|---|---|
| 100 g | 100 g |
| 102 g | 105 g |
| 98 g | 95 g |
| 101 g | 110 g |
| 99 g | 90 g |
Aunque ambas líneas tienen una media de 100 g, la varianza de la Línea 2:
$$ \sigma^2 = \frac{(100 - 100)^2 + (105 - 100)^2 + (95 - 100)^2 + (110 - 100)^2 + (90 - 100)^2}{5} = 50 $$
será mayor porque sus pesos están más dispersos en comparación con la Línea 1: