1 00:00:08,560 --> 00:00:15,519 Vamos a calcular la varianza y la desviación típica cuando la variable es cuantitativa continua. 2 00:00:16,460 --> 00:00:19,579 Antes de ir con un ejemplo, vamos a recordar un par de ideas. 3 00:00:20,420 --> 00:00:25,500 Se llama varianza y se representa con esa letra griega sigma elevado al cuadrado 4 00:00:25,500 --> 00:00:32,100 a la media de las diferencias entre los datos y su media elevados al cuadrado. 5 00:00:32,840 --> 00:00:36,119 La fórmula para calcularla es esta que vemos aquí. 6 00:00:36,119 --> 00:00:44,020 La deviación típica, que se representa por sigma, será la raíz cuadrada de la varianza 7 00:00:44,020 --> 00:00:48,640 ¿Qué información nos dan la varianza y la deviación típica de una variable? 8 00:00:49,420 --> 00:00:56,039 Pues estos dos parámetros nos dan una idea de cómo deseparados están los datos con respecto a la media 9 00:00:56,039 --> 00:01:01,619 Lo vamos a explicar mucho mejor, o con mucho más detalle, a lo largo del ejercicio que vamos a hacer 10 00:01:01,619 --> 00:01:11,060 Las alturas de los alumnos de una clase se recogen en la siguiente tabla 11 00:01:11,060 --> 00:01:14,700 nos piden que calculemos la varianza y la desviación típica. 12 00:01:15,319 --> 00:01:22,859 En la tabla los datos están agrupados por intervalos y nos dan la frecuencia absoluta, 13 00:01:23,040 --> 00:01:26,719 es decir, dos personas están en el primer intervalo, 14 00:01:26,879 --> 00:01:31,719 tienen una estatura mayor de 1,50 y más pequeña que 1,56. 15 00:01:32,640 --> 00:01:40,879 Siete personas están en el segundo intervalo con estaturas mayores o iguales que 1,56 y menor que 1,62 16 00:01:40,879 --> 00:01:49,780 8 personas pertenecen al tercer intervalo, su estatura es mayor o igual que 1,62 y menor que 1,68 17 00:01:49,780 --> 00:01:59,540 y 5 personas están en el último intervalo, su estatura es mayor o igual que 1,68 y menor que 1,74. 18 00:02:00,439 --> 00:02:06,390 La fórmula que vamos a utilizar para calcular la varianza es esta. 19 00:02:06,390 --> 00:02:11,430 Si nos damos cuenta, es un poco diferente a la que hemos visto antes 20 00:02:11,430 --> 00:02:16,810 pero también es equivalente a la anterior y es mucho más fácil para realizar los cálculos 21 00:02:16,810 --> 00:02:19,990 y nos permite realizar la varianza de una forma más sencilla 22 00:02:19,990 --> 00:02:27,969 En la fórmula que nos dan, o para calcular la varianza, es necesario calcular antes la media 23 00:02:27,969 --> 00:02:31,750 La fórmula de la media que ya sabemos es esta 24 00:02:31,750 --> 00:02:39,669 Pero, para calcular la media, también necesitamos tener calculados los x y 25 00:02:39,669 --> 00:02:47,789 En el caso de que la variable sea continua, los x y son la marca de clase 26 00:02:47,789 --> 00:02:52,250 Es decir, los puntos medios de cada uno de estos intervalos 27 00:02:52,250 --> 00:02:58,229 Por lo tanto, antes de empezar a calcular la media y después poder calcular la varianza 28 00:02:58,229 --> 00:03:02,110 necesitamos añadir una columna más a nuestra tabla 29 00:03:02,110 --> 00:03:06,289 La vamos a poner al lado de la columna de los intervalos 30 00:03:06,289 --> 00:03:08,289 es decir, al lado de la primera columna 31 00:03:08,289 --> 00:03:19,310 Por lo tanto, vamos a añadir esta columna 32 00:03:19,310 --> 00:03:24,090 y vamos a calcular la marca de clase o la mitad de cada uno de los intervalos 33 00:03:24,090 --> 00:03:37,840 Recuerdo que para calcular la marca de clase 34 00:03:37,840 --> 00:03:42,439 tenemos que sumar ambos extremos y dividirlo entre dos 35 00:03:42,439 --> 00:03:57,719 Y así obtenemos que la mitad del primer intervalo es 1,53, la mitad del segundo intervalo es 1,59, la mitad del tercero es 1,65 y la mitad del cuarto intervalo es 1,71. 36 00:03:58,539 --> 00:04:07,379 Esta es la marca de clase y con estos datos ya podemos calcular la media y una vez que hayamos calculado la media calcularemos la varianza. 37 00:04:07,379 --> 00:04:25,579 A continuación, para calcular la media, añadimos una nueva columna con los xui por fsui. 38 00:04:26,420 --> 00:04:42,959 Las vamos a rellenar. La primera fila es 1,53 por 2, la segunda es 1,59 por 7, que nos da 11,13, 1,65 por 8, que nos da 13,2 y 1,71 por 5, que nos da 8,55. 39 00:04:42,959 --> 00:04:50,120 Y una vez que hemos rellenado vamos a sumar todos los datos de esa columna y podríamos calcular ya la media 40 00:04:50,120 --> 00:05:01,040 Por lo tanto el valor de la media es 1,63 41 00:05:01,040 --> 00:05:13,800 Vamos a calcular el valor de la varianza 42 00:05:13,800 --> 00:05:19,860 Para ello vamos a tener que insertar una nueva columna que es x sub i al cuadrado por f sub i 43 00:05:19,860 --> 00:05:41,000 Para poder rellenar esta columna nos podemos dar cuenta de que x sub i al cuadrado por f sub i es lo mismo que multiplicar x sub i por x sub i y por f sub i 44 00:05:41,920 --> 00:05:52,990 Por lo tanto podemos rellenar la nueva columna multiplicando dos columnas que ya tenemos 45 00:05:52,990 --> 00:06:00,889 La columna x sub i de la marca de clase con la columna x sub i por f sub i que hemos utilizado para calcular la media 46 00:06:00,889 --> 00:06:32,959 Vamos a calcular la varianza. Dividimos 58,78, que es la suma de todos los datos de esa nueva columna, entre n, que es el tamaño de la muestra y que en este caso es 22, y le vamos a quitar la media, que ya la teníamos calculada, lo tenemos arriba, que es 1,63, pero cuidado, hay que elevarlo al cuadrado. 47 00:06:32,959 --> 00:06:37,860 Hacemos los cálculos y ese es el valor de la varianza, 0,015 48 00:06:37,860 --> 00:06:45,360 Para calcular la deviación típica, finalmente solo tenemos que hacer la raíz cuadrada de la varianza 49 00:06:45,360 --> 00:06:47,519 Y con esto ya hemos terminado