Dispersión. Variables Discretas [mediante sumas de cuadrados]

[list][*]Calcula la varianza y la desviación típica y las desviaciones de los datos preguntados.[/*][*]Cada ejercicio vale 3 puntos. Si también calculas el Coeficiente de Variación (C.V.), recibes 0.5 pts. extra [br][/*][*]Redondea con 2 decimales.[/*][/list]
[list][*] Se dan por válidos tanto la [b]varianza muestral[/b] como la [b]poblacional[/b].[/*][*]La varianza muestral se utiliza al calcularla a partir de una estimación de la media (pues tomamos una muestra), y la varianza poblacional cuando se calcula utilizando el verdadero valor de la media.[/*][/list]
Las fórmulas
Veamos las fórmulas que podemos utilizar para nuestros cálculos. Más abajo tenemos un ejemplo con datos numéricos.[br]Dado un conjunto de datos [math]x_1,\ldots,x_n[/math], [br][list][*]su [b]media [/b]es [math]\overline{X}=\frac{x_1+\ldots+x_{n}}{n}[/math]. También se denota como [math]\mu[/math]. Al haber datos repetidos (frecuencias mayores que 1), suele ser cómodo multiplicar el dato por la frecuencia, para reducir el número de [br]sumandos.[/*][*]la [b]media cuadrática[/b] (o media de los cuadrados) es [math]\overline{X^2}=\frac{x_1^2+\ldots+x_{n}^2}{n}[/math].[/*][*]y ¡ojo! no coincide con la media al cuadrado, [math]\overline{X}^2[/math], que se puede escribir como [math]\mu^2[/math]. Cuidado porque la notación del cuadrado y la barra para la media se parecen bastante. [math]\overline{X^2}\neq\mu^2[/math].[br][br][/*][*]La [b]varianza poblacional[/b] se denota [math]\sigma^2[/math] y es la diferencia media entre la media cuadrática y la media la cuadrado, es decir:[br][math]\sigma^2=\frac{\overline{X^2}-\mu^2}{n}[/math].[/*][*]A partir de la varianza, calculamos la [b]desviación típica poblacional[/b] como su raíz cuadrada:[br][math]\sigma=\sqrt{\sigma^2}[/math].[/*][*]Podemos usar el [b]coeficiente de variación[/b] para medir a relación entre el tamaño de la media y su varianza, para ver si la media aritmética es representativa del conjunto de datos. Lo calculamos como [math]C_{V}=\frac{\sigma}{\ \overline X\ }[/math], y suele expresarse en porcentaje.[br]Cuando es menor que el 30%, podemos decir que la media es suficientemente representativa.[br][/*][/list]
Ejemplo con datos numéricos
Si los datos fuesen [math]x_1=6,x_2=8,x_3=7[/math], (por simplificar, hemos supuesto que la frecuencia es 1)[br][list][*]su [b]media [/b]es [math]\overline{X}=\frac{6+8+7}{3}=\frac{21}{3}=7[/math]. También se denota como [math]\mu[/math].[/*][*]la [b]media cuadrática[/b] (o media de los cuadrados) es [math]\overline{X^2}=\frac{6^2+8^2+7^2}{3}=\frac{149}{3}\approx 49,6667[/math].[/*][*]y ¡ojo! no coincide con la media al cuadrado, [math]\overline{X}^2=49[/math], que a veces también se escribe como [math]\mu^2=49[/math]. Cuidado porque la notación del cuadrado y la barra para la media se parecen bastante. [math]\overline{X^2}\neq\mu^2[/math]. (Las notaciones [math]\overline{X^2}[/math] y [math]\overline{X}^2[/math] son muy similares).[br][br][/*][*]La [b]varianza poblacional[/b] se denota [math]\sigma^2[/math] y es la diferencia media entre la media cuadrática y la media la cuadrado, es decir:[br][math]\sigma^2=\frac{\overline{X^2}-\mu^2}{n}\approx 49,6667-49=0,6667[/math].[/*][*]A partir de la varianza, calculamos la [b]desviación típica poblacional[/b] como su raíz cuadrada:[br][math]\sigma=\sqrt{\sigma^2}\approx 0,8165[/math].[/*][*]Podemos usar el [b]coeficiente de variación[/b] para medir a relación entre el tamaño de la media y su varianza, para ver si la media aritmética es representativa del conjunto de datos. Lo calculamos como [math]C_{V}=\frac{0,8165}{7}=0,1166[/math], y suele expresarse en porcentaje, es decir, [math]11,66\%[/math].[br]Como es menor que el 30%, podemos decir que la media es suficientemente representativa.[br][/*][/list]
¿Muestral o poblacional?
Normalmente, no disponemos de todos los datos de la población, y lo que hacemos es tomar una muestra.[br]En ese caso, los resultados obtenidos son algo mejores si utilizamos la varianza y desviación típicas muestrales.[br][list][*]La única diferencia es que en los cálculos dividiremos por [math]n-1[/math], en lugar de [math]n[/math].[/*][*]Pero en este caso, al realizar los cálculos mediante diferencias de cuadrados, resulta más cómodo utilizar las fórmulas poblacionales (las anteriores), pues se ha utilizado una simplificación de la fórmula original (a partir de las desviaciones respecto la media), que ya no podría usarse.[/*][/list]

Information: Dispersión. Variables Discretas [mediante sumas de cuadrados]