1 00:00:07,450 --> 00:00:12,029 En este vídeo vamos a estudiar los parámetros estadísticos de dispersión. 2 00:00:13,029 --> 00:00:15,830 Son medidas de la dispersión de las medidas observadas. 3 00:00:16,530 --> 00:00:19,410 El primero que tenemos que conocer es el rango recorrido. 4 00:00:19,550 --> 00:00:23,949 Siempre es la diferencia entre el mayor y el menor de la variable estadística. 5 00:00:25,289 --> 00:00:35,049 En variables continuas, con datos agrupados, el rango se calcula restando el extremo superior del último intervalo del extremo inferior del primero. 6 00:00:36,770 --> 00:00:43,329 La varianza, que se denota con la letra V, es la media de las desviaciones al cuadrado. 7 00:00:44,549 --> 00:00:49,990 Consiste en restar cada dato menos la media aritmética y elevarlo al cuadrado. 8 00:00:50,250 --> 00:00:54,750 Lo multiplicamos por las frecuencias absolutas y lo dividimos por el número total de datos. 9 00:00:55,729 --> 00:01:01,750 Una fórmula equivalente es esta de aquí, que utilizaremos con las tablas de frecuencias. 10 00:01:01,750 --> 00:01:08,310 frecuencias. La desviación típica, que tiene las mismas unidades que los datos, es la raíz cuadrada 11 00:01:08,310 --> 00:01:19,390 positiva de la varianza. Y por último, el coeficiente de variación se calcula dividiendo la desviación 12 00:01:19,390 --> 00:01:25,930 típica entre la media. A veces se puede expresar en forma de tanto por ciento multiplicando este 13 00:01:25,930 --> 00:01:34,349 resultado por 100. En este ejemplo tenemos datos expresados en centímetros. Comenzamos 14 00:01:34,349 --> 00:01:42,969 calculando el rango o recorrido. Para ello restamos el dato mayor que es 17 menos el 15 00:01:42,969 --> 00:01:49,730 dato menor que es 15 y nos quedan 2 centímetros. Observar que las unidades corresponden con 16 00:01:49,730 --> 00:01:57,379 la de los datos. A continuación vamos a calcular el siguiente parámetro de dispersión, 17 00:01:57,379 --> 00:02:04,140 la varianza. Para ello hemos elaborado una tabla de frecuencias. Ordenamos nuestros datos 18 00:02:04,140 --> 00:02:17,759 de menor a mayor. Calculamos las frecuencias absolutas de cada dato. Para el dato 15 observamos 19 00:02:17,759 --> 00:02:34,909 que lo tenemos tres veces. El dato 16 aparece cinco veces. Y por último, el dato 17 lo 20 00:02:34,909 --> 00:02:41,569 tenemos una sola vez. La suma de todas las frecuencias absolutas nos da el número total 21 00:02:41,569 --> 00:02:48,990 de datos, que en este caso es 9. Para calcular la media aritmética que necesitaremos para 22 00:02:48,990 --> 00:02:53,669 hallar la varianza, hemos añadido la columna del producto de los datos por las frecuencias 23 00:02:53,669 --> 00:03:14,580 Vamos multiplicando así 15 por 3, 45, 16 por 5, 80 y por último 17 por 1, que nos da 17. 24 00:03:15,780 --> 00:03:21,199 La suma de toda la columna nos queda 142. 25 00:03:21,199 --> 00:03:32,939 Calculamos ahora la media aritmética dividiendo la suma de la columna del producto de los datos por sus frecuencias absolutas 26 00:03:32,939 --> 00:03:42,340 que nos queda 142 entre el número total de datos que es igual a la suma de las frecuencias absolutas, es decir, 9 27 00:03:42,340 --> 00:03:53,509 Así obtenemos una media de 15,7 cm 28 00:03:53,509 --> 00:03:57,610 Observar que las unidades corresponden con las unidades de los datos 29 00:03:57,610 --> 00:04:04,689 La varianza es la media de las desviaciones de los datos con respecto de la media al cuadrado 30 00:04:04,689 --> 00:04:09,550 Es más sencillo utilizar esta segunda fórmula utilizando la tabla de frecuencias 31 00:04:09,550 --> 00:04:17,069 Así añadimos una columna con los datos elevados al cuadrado 32 00:04:17,069 --> 00:04:23,250 Calculamos 15 al cuadrado 33 00:04:23,250 --> 00:04:27,370 Nos queda como resultado 225 34 00:04:27,370 --> 00:04:33,449 16 al cuadrado nos queda 256 35 00:04:33,449 --> 00:04:42,180 17 al cuadrado da como resultado 289 36 00:04:42,180 --> 00:04:48,800 Añadimos una nueva columna que es el producto de los datos al cuadrado por sus frecuencias absolutas 37 00:04:48,800 --> 00:04:50,879 Y vamos multiplicando 38 00:04:50,879 --> 00:05:14,009 Realizamos ahora la suma de toda esta columna 39 00:05:14,009 --> 00:05:18,550 dando como resultado 2.244. 40 00:05:20,529 --> 00:05:28,990 Así, la varianza la obtenemos dividiendo la suma de los datos al cuadrado multiplicados por las frecuencias absolutas, 41 00:05:29,089 --> 00:05:31,930 que nos ha quedado 2.244, 42 00:05:33,509 --> 00:05:41,889 entre el número total de datos, que es lo mismo, la suma de todas las frecuencias absolutas, que nos queda 9, 43 00:05:41,889 --> 00:05:55,860 y a este resultado le restamos la media aritmética que habíamos calculado previamente elevada al cuadrado, es decir, 15,7 al cuadrado. 44 00:06:00,800 --> 00:06:14,579 Realizando las operaciones nos queda aproximadamente 249,33 menos 246,49 45 00:06:14,579 --> 00:06:20,019 lo cual nos da una varianza de 2,84 centímetros al cuadrado. 46 00:06:20,500 --> 00:06:28,019 Observar que las unidades de la varianza son las de los datos elevadas al cuadrado, en este caso centímetros cuadrados. 47 00:06:29,439 --> 00:06:35,019 La desviación típica se calcula realizando la raíz cuadrada de la varianza, 48 00:06:36,259 --> 00:06:42,360 es decir, la raíz cuadrada de 2,84 nos da como resultado 1,67 centímetros. 49 00:06:42,360 --> 00:06:46,959 La desviación típica tiene las mismas unidades que los datos. 50 00:06:47,860 --> 00:06:59,220 Por último, calculamos el coeficiente de variación dividiendo la desviación típica entre la media, es decir, 1,67 entre 15,7. 51 00:06:59,519 --> 00:07:03,259 Eso nos da como resultado 0,106. 52 00:07:04,000 --> 00:07:09,879 El coeficiente de variación es un número adimensional, es decir, no tiene unidades. 53 00:07:09,879 --> 00:07:14,980 Cuanto más próximo sea a 0 significa que los datos están muy concentrados 54 00:07:14,980 --> 00:07:20,600 Mientras que si se aproxima a 1 significa que los datos están muy dispersos 55 00:07:20,600 --> 00:07:24,860 A veces es conveniente expresarlo en tanto por ciento 56 00:07:24,860 --> 00:07:31,259 Para ello multiplicamos nuestro resultado por 100 y obtenemos en este caso 10,6% 57 00:07:31,259 --> 00:07:39,860 De la misma forma, si nos diese muy cercano al 100% significaría que los datos estarían muy dispersos.