1 00:00:00,500 --> 00:00:09,740 Bueno, echamos un vistazo a este ejercicio que viene resuelto, que viene de este otro de aquí, que veíamos en la epigrafía anterior, 2 00:00:09,740 --> 00:00:29,960 que era estudiar la estatura de un grupo de 8 mujeres, y recoger la estatura y el peso, es decir, esta sería la variable x, sería el x sub i, todos los pesos, 3 00:00:30,500 --> 00:00:36,740 Y esta sería su y, es decir, todas y cada una de las ocho elementos. 4 00:00:36,920 --> 00:00:43,899 Este sería el y sub 1, el y sub 2, el y sub 3, el y sub 4, el y sub 5, el y sub 6, el y sub 7 e el y sub 8, ¿vale? 5 00:00:43,939 --> 00:00:46,140 Igualmente para las x, ¿de acuerdo? 6 00:00:46,439 --> 00:00:47,700 Las alturas ya sabemos. 7 00:00:47,960 --> 00:00:52,880 Y aquí hemos ido poniendo, ¿veis? Cada uno de estos puntos. 8 00:00:53,679 --> 00:00:57,280 Aparentemente estos puntos aquí se ajustan. 9 00:00:57,280 --> 00:01:12,140 Se ajustan muy bien a una línea, ¿verdad? Una línea, sería una correlación lineal, además apenas hay dispersión, ¿de acuerdo? Vamos a verlo con números, con números. 10 00:01:13,000 --> 00:01:34,780 Bueno, pues lo primero que hacemos, ponemos, aquí viene puesto en horizontal, yo prefiero siempre en vertical, pero bueno, aquí tendríamos x y, es decir, cada uno de los puntos x y, y cada uno de los puntos de la variable, en este caso y, y de la variable x, ¿vale? 11 00:01:34,780 --> 00:01:39,579 con lo cual estos son los datos, estos de aquí serían los datos 12 00:01:39,579 --> 00:01:44,060 ahora a partir de aquí lo que tenemos que hacer nosotros 13 00:01:44,060 --> 00:01:49,159 en este caso como no hay frecuencias, porque la frecuencia sería 1 para cada uno de los datos 14 00:01:49,159 --> 00:01:52,379 que tendríamos aquí, esto sería lo mismo que tener 15 00:01:52,379 --> 00:01:57,379 el sumatorio de x sub i por f sub i, lo que teníamos en la tabla 16 00:01:57,379 --> 00:02:01,459 pero como el f sub i es 1, pues obviamente me queda esto 17 00:02:01,459 --> 00:02:05,980 a ver, lo primero que tendríamos que hacer es situarnos la tabla 18 00:02:05,980 --> 00:02:24,379 Ahora, como lo vais a hacer con la calculadora, pues a continuación metéis los datos y luego pues completáis esta de aquí, los cuadrados, perdón, los sumatorios aquí, este sería el sumatorio de y sub i, ¿vale? Por la f sub i, pero como es 1, pues esta es la misma. 19 00:02:24,379 --> 00:02:46,139 Luego, aquí sería el cuadrado, que sería xy al cuadrado, lo veis y lo miráis. Aquí sería cada uno de los datos, es decir, este sería 142 al cuadrado, que me va a quedar esto, 147 al cuadrado, que quedará esto, 152 al cuadrado, es decir, cada uno de los cuadrados. 20 00:02:46,139 --> 00:03:10,639 Esto no os va a aparecer en la tabla, en la tabla os aparece solo el sumatorio de todos los cuadrados, ¿de acuerdo? Igual pasa con las y subís, es decir, esto tendréis que hacerlo vosotros, perdón, esto aquí iría aparte, es decir, esto cada uno tendrá que calculárselo a mano metiendo los cuadrados, 21 00:03:10,639 --> 00:03:13,240 metiendo los cuadrados 22 00:03:13,240 --> 00:03:14,620 de cada, en este caso estamos 23 00:03:14,620 --> 00:03:16,680 dando con la y sub i 24 00:03:16,680 --> 00:03:18,699 iría con esta, con la y sub i 25 00:03:18,699 --> 00:03:19,840 que me he confundido 26 00:03:19,840 --> 00:03:22,159 prefiero hacerlo en vertical, ya os digo 27 00:03:22,159 --> 00:03:25,259 y luego al final es el producto de ambas 28 00:03:25,259 --> 00:03:27,280 es decir, de x sub i por y sub i 29 00:03:27,280 --> 00:03:28,680 y lo que os aparece 30 00:03:28,680 --> 00:03:31,039 en esto de aquí, lo tendréis que calcular 31 00:03:31,039 --> 00:03:32,819 vosotros, vale 32 00:03:32,819 --> 00:03:34,460 nos aparece, salvo que hagáis a lo mejor 33 00:03:34,460 --> 00:03:36,319 un excel, una hoja excel 34 00:03:36,319 --> 00:03:38,419 y metáis los datos y metáis la fórmula 35 00:03:38,419 --> 00:03:40,539 entonces sí, pero en la calculadora 36 00:03:40,539 --> 00:03:47,300 os aparece esto final. Pero bueno, a la postre vosotros os tenéis que calcular numéricamente 37 00:03:47,300 --> 00:03:52,719 y luego comprobarlo, que es el sumatorio de x sub i por f sub i, lo veis que era esto que aparecía aquí, 38 00:03:53,319 --> 00:03:59,259 partido por n que era 8 y esto sí que os aparece en la calculadora. La media de i también que sería 39 00:03:59,259 --> 00:04:06,139 el sumatorio de i sub i por f sub i, como f sub i ya os he dicho que era 1, pues me quedaba este de aquí, 40 00:04:06,139 --> 00:04:35,720 Los 454. ¿Qué más me falta? La covarianza, ¿vale? La covarianza es el sumatorio de x sub i por f sub i y por i sub i, ¿vale? Con lo cual, como esto era 1, pues era i sub i por x sub i, el sumatorio partido por n, que era 8, es esto, el 73.108 partido por 8 y luego menos el producto de la x media por la i media, ¿vale? 41 00:04:35,720 --> 00:04:38,199 y esto sale, ¿cuánto es la covarianza? 42 00:04:39,220 --> 00:04:42,939 En este caso, como la covarianza es positiva, ¿qué significa? 43 00:04:43,279 --> 00:04:53,620 Significa que hay una correlación positiva, es decir, que cuando el coeficiente de Pearson, 44 00:04:53,740 --> 00:04:56,139 que todavía no lo hemos visto, sería positivo. 45 00:04:56,699 --> 00:05:03,600 En este caso, la correlación positiva indica que cuando aumente, en este caso la x era la altura, 46 00:05:03,600 --> 00:05:06,939 cuando aumenta la altura, entonces aumentaría el peso. 47 00:05:07,339 --> 00:05:11,360 O al revés, si disminuye la altura, pues entonces disminuye el peso. 48 00:05:11,959 --> 00:05:15,839 Pero en cualquier caso, la relación que hay sería positiva, ¿vale? 49 00:05:15,899 --> 00:05:22,600 Es decir, si esta es la X y esta es la Y, al ser la covarianza positiva, es positiva. 50 00:05:22,600 --> 00:05:27,319 Y ahora vamos a ver, a ser la covarianza positiva, cuando aumenta una, aumenta la otra, ¿vale? 51 00:05:28,160 --> 00:05:32,000 Ahora bien, si queremos ver las marginales, cada una como es, por separado, 52 00:05:32,000 --> 00:05:36,800 cuánta dispersión hay en la x y en la y, hay que calcularlo por separado. 53 00:05:36,899 --> 00:05:38,579 ¿Qué calculábamos para ver la dispersión? 54 00:05:39,019 --> 00:05:42,259 El coeficiente de variación de x y el coeficiente de variación de y. 55 00:05:42,800 --> 00:05:50,139 El coeficiente de variación de x vimos que era la desviación típica de x respecto de la x media. 56 00:05:50,879 --> 00:05:56,360 Y si hago la cuenta esto es 0,071 o lo que es lo mismo un 7,1%. 57 00:05:56,360 --> 00:06:09,060 Y si hago respecto de Y sería la desviación típica de Y partido por Y media y me queda 0,134 o lo que es lo mismo un 13,4%. 58 00:06:09,060 --> 00:06:21,300 Con lo cual me está diciendo que hay una mayor dispersión donde en el peso que era la Y que en la estatura que era la X. 59 00:06:21,300 --> 00:06:26,300 Están correlacionadas de manera positiva pero luego por separada cada una de ellas 60 00:06:26,300 --> 00:06:32,860 Observamos la dispersión entre cada una de ellas por separadas 61 00:06:32,860 --> 00:06:41,939 Es también diferente, hay mayor dispersión en el peso, que es la Y, que en la altura, que es la X 62 00:06:41,939 --> 00:06:45,100 Y bueno, ya lo vimos antes, ¿de acuerdo? 63 00:06:45,100 --> 00:06:54,220 Aquí vemos la correlación, no vemos la dispersión que hay entre cada uno de ellos por separado.