1 00:00:00,920 --> 00:00:06,839 Hola chicos y chicas, voy a contaros un poquito lo que tenemos que hacer, lo que tenéis que hacer hoy en la clase, ¿vale? 2 00:00:06,839 --> 00:00:13,980 De momento, tanto con vuestro estudio que habéis hecho por parejas, como con los deberes que hicimos el otro día, 3 00:00:14,099 --> 00:00:21,320 tenéis que tener, por un lado, dos distribuciones marginales, ya sea con una variable o con otra, ¿vale? 4 00:00:21,320 --> 00:00:26,640 Aquí tenéis vuestra x, y, lo que sea, y vuestras frecuencias. 5 00:00:27,660 --> 00:00:34,520 Y tenéis que tener la otra con la otra variable y sus otras frecuencias. 6 00:00:35,159 --> 00:00:42,600 Tenéis que tener calculada aquí la media, aquí esto, y luego las varianzas y tal, pero que hoy todavía no las vamos a usar de momento. 7 00:00:42,600 --> 00:00:53,789 Entonces lo que vamos a hacer hoy es, lo primero, la representación gráfica de la distribución bidimensional conjunta. 8 00:00:54,130 --> 00:01:08,849 Además de estas dos tendréis la tabla de doble entrada, si os acordáis, que era la de x, y, y aquí teníamos cada valor. 9 00:01:09,269 --> 00:01:13,010 Yo en mi caso, que eran las familias, tenía aquí 2, 3, 4, 5, me parece. 10 00:01:13,790 --> 00:01:21,230 Aquí 250, 350, y aquí las listas, 2, 0, 0, 0, etc. 11 00:01:21,230 --> 00:01:25,890 Es decir, esta tablita de aquí. 12 00:01:25,890 --> 00:01:32,000 esta tablita, donde pone tabla de doble entrada 13 00:01:32,000 --> 00:01:37,019 ahí estamos, entonces lo que vamos a hacer, lo primero es la representación gráfica 14 00:01:37,019 --> 00:01:40,700 esto de aquí abajo, para ver si hay algún tipo de relación, para eso lo que tenéis 15 00:01:40,700 --> 00:01:44,079 que hacer es, pintáis dos ejes, el eje de coordenadas 16 00:01:44,079 --> 00:01:48,640 y ponéis la variable que queráis abajo y la que queráis arriba 17 00:01:48,640 --> 00:01:52,260 por ejemplo, yo he puesto los números de la familia abajo 18 00:01:52,260 --> 00:01:56,980 pues aquí tendré 2, 3, 4 19 00:01:56,980 --> 00:02:15,659 5 y 6. Y aquí las marcas de clase de la cantidad de euros que gastaban. 250, 350, 450 y así. No vamos a hacer caso a la cantidad de datos que aparecen en cada uno. 20 00:02:16,180 --> 00:02:22,139 Aquí que aparezca un 2 o que aparezca un 4 me da exactamente igual. Lo único que vamos a hacer es, si hay algo que no sea 0, pintamos punto. 21 00:02:22,139 --> 00:02:32,159 Por ejemplo, yo en el 2, 250, si miramos la tabla del 2, si miramos la línea del 2, en el 2 la única que tiene es 250, ¿no? 22 00:02:32,560 --> 00:02:35,439 Pues el único punto que voy a pintar es en el 2, 250. 23 00:02:36,659 --> 00:02:42,860 Luego, miramos la del 3, pues en el 3 solo tengo en el 350 y en el 450, me da igual que sean 4 y 1. 24 00:02:43,419 --> 00:02:47,580 Pues en la de 350 voy a pintar uno más o menos y 450 otro. 25 00:02:47,580 --> 00:03:04,240 En el 4, pues aquí tengo 0, 0, 4, 3, pues tengo 1 en 450 y 1 en 550, ¿no? Pues 1 en 450 y 1 en 550. Y así, pintáis todos. Una vez los hayáis pintado, una vez lo tengáis todo pintado, seguimos con el vídeo. 26 00:03:04,240 --> 00:03:11,219 Vale, ya habréis terminado de pintarlo, entonces ahora lo que vamos a hacer es ver cómo de relacionados están estos datos 27 00:03:11,219 --> 00:03:22,319 Igual que en las distribuciones marginales veíamos qué error habíamos cometido o cuánto nos habíamos separado de la media 28 00:03:22,319 --> 00:03:33,979 Calculando la varianza, que decíamos la varianza de x era el sumatorio de cada una menos la media al cuadrado 29 00:03:34,240 --> 00:03:43,620 por su frecuencia, partido por el número total de datos, vamos a hacer lo mismo, vamos a ver cómo se separan cada una de las dos comparadas de la media. 30 00:03:44,240 --> 00:03:48,060 Este cuadrado va a desaparecer y se va a convertir en una multiplicación de las dos. 31 00:03:48,419 --> 00:03:55,659 Entonces lo que se llama la covarianza, porque es la varianza de las dos, la vamos a calcular, lo podéis ver en la hoja del formulario de Mariel, 32 00:03:55,659 --> 00:04:04,060 bueno, la representación de nube de puntos es lo que hemos hecho, esta analítica de tipo de la relación lo veremos mañana y esto es lo que vamos a hacer hoy. 33 00:04:04,240 --> 00:04:12,539 la covarianza. Es lo que vamos a hacer ahora. Entonces la fórmula básicamente lo que me hace es decirme cómo de separado está un dato del otro. 34 00:04:13,300 --> 00:04:29,560 La covarianza la vamos a llamar la cop de x y y la fórmula va a ser la suma de cada x menos su media por cada y menos su media 35 00:04:29,560 --> 00:04:39,860 por la frecuencia que tiene ese dato partido de n. Por ejemplo, en mi caso, en el caso de la tabla que tengo aquí a la izquierda, 36 00:04:41,459 --> 00:04:52,660 la covarianza de los miembros de la familia y la cantidad que gastan será el primero, pues el primer dato, si os fijáis, es el de dos miembros, 250 de gasto. 37 00:04:52,660 --> 00:05:11,089 Pues entonces será 2 menos la medida de x, que si os acordáis, yo me había calculado la mía en la distribución marginal y era 4, la teníamos aquí, y la media de y, si os acordáis, la tengo ahí guardada, que son 490 euros. 38 00:05:11,089 --> 00:05:35,120 Esto era miembros de la familia. Entonces, ahora la fórmula de la covarianza lo que vamos a hacer es el primer dato, la x del primer dato menos su media por la y de ese primer dato que sería que gastan 250 menos la media del gasto que era 490. 39 00:05:35,120 --> 00:05:48,300 ¿Por cuántas veces me sale ese dato? Ahora sí vamos a utilizar ese 2 por 2. Vamos al siguiente. En el siguiente que no tenemos un 0 sería 3 miembros de la familia que gastan 350, ¿no? 40 00:05:48,600 --> 00:06:03,060 Pues venga, 3 miembros de la familia menos la media de miembros de la familia que era 4 por el gasto que tienen mensualmente menos la media de gasto por el número de veces que me sale ese dato. 41 00:06:03,060 --> 00:06:19,810 en este caso me sale 4. Pues 4. Más, siguiente que tengo, el 1 de los 3 miembros que gastaban 450. Pues 3 menos esa media por 450 menos la media de gasto 42 00:06:19,810 --> 00:06:29,750 por el número de veces que me sale este dato, 1. Y así lo vamos haciendo con todos. Y al final, como siempre en estas fórmulas, dividimos entre el número total de datos que era 20. 43 00:06:29,750 --> 00:06:39,009 Vale, pues ahora lo que tenéis que hacer es calcular las covarianzas de cada una de las dos tablas que tenéis 44 00:06:39,009 --> 00:06:43,290 que es la del estudio que habéis hecho en parejas y de la de los deberes del otro día 45 00:06:43,290 --> 00:06:46,829 y una vez las hayáis terminado tenéis que intentar compararlas entre vosotros 46 00:06:46,829 --> 00:06:49,370 porque el viernes veremos cómo se comparan entre ellas 47 00:06:49,370 --> 00:06:55,589 Si termináis esas dos podéis hacer de la página 353 ejercicio 11 y 12 48 00:06:55,589 --> 00:06:57,970 Que vaya muy bien la clase chicos, nos vemos