1 00:00:00,620 --> 00:00:13,880 Diciendo que esta clase va a ser grabada, por si alguien tiene algún inconveniente que lo diga ahora mismo. Y si no, pues vamos directamente, entramos en materia. ¿De acuerdo? 2 00:00:13,880 --> 00:00:29,120 Bueno, entonces, estamos en la decima quincena, esta es la primera clase y, bueno, os tengo que decir que estos dos temas de estadística yo creo que son bastante asequibles, tenéis que revisar las cuentas. 3 00:00:31,910 --> 00:00:43,289 Os recomiendo que uséis, os recomiendo que siempre que uséis la calculadora, yo os voy a dar la opción de hacer las cuentas a mano o a calculadora, como queráis. 4 00:00:43,289 --> 00:00:56,289 No, las tablas siempre hay que confeccionarlas y, bueno, las tablas cuando os dan los datos en bruto, pero vamos, que luego los calculo, lo podéis hacer a mano o a máquina, ¿vale? 5 00:00:57,149 --> 00:01:03,649 Bueno, un truco. Del tema anterior necesitáis saber calcular las medidas de centralización, las de dispersión. 6 00:01:04,930 --> 00:01:09,530 En particular, las más importantes son media, desviación típica y coeficiente de variación. 7 00:01:09,530 --> 00:01:26,870 Si veis los exámenes del año pasado, para calcular el coeficiente de variación necesitáis la medida de desviación típica, con lo cual, pues, vamos, ahí ya está incluido el mayor cuerpo del examen. 8 00:01:26,870 --> 00:01:30,250 y luego de la unidad 11 9 00:01:30,250 --> 00:01:32,269 del libro os tengo que decir 10 00:01:32,269 --> 00:01:34,390 que este tema es un ejercicio 11 00:01:34,390 --> 00:01:36,209 que generalmente 12 00:01:36,209 --> 00:01:38,370 cae, pues un 90% os puedo decir 13 00:01:38,370 --> 00:01:38,930 que cae 14 00:01:38,930 --> 00:01:42,849 y para eso tenéis que tener 15 00:01:42,849 --> 00:01:44,730 claro que con la calculadora 16 00:01:44,730 --> 00:01:46,170 las cuentas son 17 00:01:46,170 --> 00:01:48,129 muchísimo más cortas 18 00:01:48,129 --> 00:01:51,909 las cuentas son muchísimo más cortas 19 00:01:51,909 --> 00:01:54,250 y que el ejercicio es muy tinto 20 00:01:54,250 --> 00:01:55,769 entonces 21 00:01:55,769 --> 00:02:18,680 ¿De qué dan estos ejercicios? Bueno, pues de que tenemos una población, tenemos una muestra que generalmente no es muy grande. Bueno, os tengo que decir que las tablas de doble entrada no las vamos a ver, solo vamos a ver los datos en bruto. 22 00:02:18,680 --> 00:02:34,460 Entonces, si os fijáis aquí hay 1, 2, 3, 4, 5, 6, 7, 8, 9 y 10. Son individuos de la misma población. Esto no es dato y frecuencia, sino que aquí tengo dos variables distintas. 23 00:02:34,460 --> 00:02:57,439 En este caso es la relación entre la mortalidad en cada país y el número de camas por cada mil habitantes. Se supone que por cada mil habitantes la mortalidad infantil es de 50, en este caso, y en ese mismo país el número de camas por cada mil habitantes es de 5. 24 00:02:58,439 --> 00:03:07,479 Aquí, aparentemente, pues eso, en un país donde la mortalidad es el doble, pues el número de camas por cada mil habitantes es la mitad. 25 00:03:08,639 --> 00:03:14,819 Aquí es un poco superior, de 50 pasa a 70, y el número de camas es la mitad, ¿no? 26 00:03:15,080 --> 00:03:18,659 Parece que hay una relación entre las variables. 27 00:03:19,240 --> 00:03:23,580 Yo diría que a mayor cantidad de mortalidad es menor el número de camas, ¿no? 28 00:03:23,580 --> 00:03:33,759 ¿no? Cuidado que no es lo mismo relación que causalidad. Puede que estén dos cosas 29 00:03:33,759 --> 00:03:43,240 que vayan a la par, pero que una no sea causa de la otra. Por ejemplo, lo normal es que, 30 00:03:43,240 --> 00:03:48,199 como consecuencia del número de camas por cada mil habitantes, la mortalidad infantil 31 00:03:48,199 --> 00:04:03,500 aumente, pero que la mortalidad aumente no produce que el número de camas sea mayor 32 00:04:03,500 --> 00:04:10,280 o menor. Supongo que entendéis la diferencia entre relación y causalidad. En este caso 33 00:04:10,280 --> 00:04:19,220 yo diría que una variable implica a la otra, pero la otra no implica a la primera. Bueno, 34 00:04:19,220 --> 00:04:41,620 Entonces, como veis, esto es una tabla de una distribución bidimensional, también se llaman variables estadísticas dobles, porque cada una de las columnas, bueno, en este caso columnas, a mí me gusta más ponerlo en filas, es un doble dato. 35 00:04:41,620 --> 00:04:55,180 Es un dato de una variable y otra variable de la otra. Y la correlación y la regresión consiste en hacer estimaciones de lo que correspondería a un dato que no está de esto, 36 00:04:55,180 --> 00:05:11,480 hay un valor de la X que desconocemos, por ejemplo el 80 no está aquí, pues qué valor correspondería a la Y. Y la regresión consiste en decir si esa aproximación es buena o no es buena. 37 00:05:12,500 --> 00:05:17,399 La estimación aquí siempre va a ser lineal, o sea, respecto de una recta. 38 00:05:19,259 --> 00:05:25,899 Entonces, como veis, bueno, esto es una tabla, dos datos, ¿no? 39 00:05:26,279 --> 00:05:28,759 Y lo primero que vamos a hacer es una nube de puntos. 40 00:05:29,279 --> 00:05:34,000 A partir de la nube de puntos, pues vamos a empezar a ver cómo se pueden relacionar las cosas. 41 00:05:39,600 --> 00:05:41,899 Este es el ejemplo que os he dicho antes. 42 00:05:41,899 --> 00:06:00,910 Entonces, la primera parte es sencilla, representar los puntos. Conviene tener una cierta lógica para hacer eso. 43 00:06:01,209 --> 00:06:18,529 Alguien todavía no lo ha contestado, en una duda me ha dicho que en un ejercicio que cómo marcaba los intervalos. Los intervalos se suelen marcar por sentido común y vamos intentando que la gráfica sea lo más clara posible. 44 00:06:18,529 --> 00:06:44,399 O que la tabla sea lo más clara posible. Entonces, a ver, yo aquí tengo datos que están entre el 30 y el 200. Pues podría tomar, por ejemplo, de 20 en 20, 20, 40, 60, 80, 100, 120, 40, 50, 60, 50, 80 y 200. 45 00:06:44,399 --> 00:07:06,509 Y el valor de la I está entre, a ver, el mayor valor es 7, pues casi pondría en unidades, ¿no? 4, 5, 6 y 7. Voy a indicar aquí el primer número. El primero siempre hay que ponerlo porque es el que nos da la escala, que significa cada rayita, ¿no? 46 00:07:06,509 --> 00:07:28,310 Y aquí tendría que poner la relación entre la mortalidad infantil, entonces es mortalidad o número de muertos por mil habitantes, supongo que sabéis que tanto por mil se pone así, y aquí el número de camas por mil habitantes, tanto por mil se pone con dos celdas. 47 00:07:28,310 --> 00:07:31,750 entonces, la nube de puntos 48 00:07:31,750 --> 00:07:33,110 pues consiste en 49 00:07:33,110 --> 00:07:37,980 el 55 50 00:07:37,980 --> 00:07:40,100 50 más o menos 51 00:07:40,100 --> 00:07:41,860 está por aquí, 5 está por aquí 52 00:07:41,860 --> 00:07:43,939 este es el primer punto 53 00:07:43,939 --> 00:07:46,040 el 102 54 00:07:46,040 --> 00:07:48,379 60 55 00:07:48,379 --> 00:07:49,500 80 56 00:07:49,500 --> 00:07:51,500 voy a poner aquí 100 para que 57 00:07:51,500 --> 00:07:53,819 para que sea más claro 58 00:07:53,819 --> 00:07:55,939 habría que poner todos los valores 59 00:07:55,939 --> 00:07:57,939 es lo más normal 60 00:07:57,939 --> 00:07:59,420 pero para ahorrar tiempo 61 00:07:59,420 --> 00:08:02,019 el 102 pues vendría 62 00:08:02,019 --> 00:08:03,120 por aquí 63 00:08:03,120 --> 00:08:09,870 72,5 64 00:08:09,870 --> 00:08:11,670 este sería 60 65 00:08:11,670 --> 00:08:12,689 en medio del 70 66 00:08:12,689 --> 00:08:15,410 2,5 vendría por aquí 67 00:08:15,410 --> 00:08:21,500 63,75 68 00:08:21,500 --> 00:08:22,860 60 está un poquito 69 00:08:22,860 --> 00:08:24,540 voy a agarrar la derecha 70 00:08:24,540 --> 00:08:26,160 no me gusta como lo he colocado 71 00:08:26,160 --> 00:08:27,879 aquí más el centro 72 00:08:27,879 --> 00:08:31,199 a la 63,75 73 00:08:31,199 --> 00:08:33,039 pues estaría un poquito más abajo 74 00:08:33,039 --> 00:08:33,799 de lo 4 75 00:08:33,799 --> 00:09:06,269 El 124, más o menos sale por aquí. 181, 200, 1,25. Hay el 250, quizá debería haberlo puesto de 25 en 25, pero bueno. 76 00:09:06,269 --> 00:09:18,730 este sería el 260, con lo cual el 250, 0,75, pues sería el más bajo de todos, por aquí, 37, 77 00:09:19,950 --> 00:09:30,009 este es el más alto de todos hasta el momento, y 93, 93 más o menos está por aquí. 78 00:09:31,009 --> 00:09:43,710 Bueno, pues esto como veis es una nube, no tiene una forma específica, es una gráfica amorfa en cierta manera, 79 00:09:44,710 --> 00:09:55,230 pero yo creo que se deja ver que hay una tendencia a que a mayor valor de la x, el valor de la y va descendiendo. 80 00:09:55,870 --> 00:09:59,309 Si yo cogiera una recta, esto es lo que luego vamos a hacer. 81 00:10:00,009 --> 00:10:03,409 Esto hay gente que lo sabe hacer muy bien, a mí se me da regular. 82 00:10:05,009 --> 00:10:10,590 Si yo cogiera una recta que aproxima mejor los puntos, pues más o menos sería así. 83 00:10:11,669 --> 00:10:14,309 La pendiente de esa recta sería negativa. 84 00:10:15,350 --> 00:10:20,970 Entonces, cuando voy a dejar como la mitad de los puntos hacia un lado, la mitad hacia el otro, más o menos sería eso. 85 00:10:20,970 --> 00:10:32,230 Y esto nos podría permitir calcular, por ejemplo, para x igual a 140, cuál es el valor de la y esperado. Esto es a lo que vamos a llegar. 86 00:10:33,529 --> 00:10:41,850 Bueno, yo aquí lo que sí que podría decir es que la pendiente, si hay una recta que se aproxima a estos puntos, esa recta va a tener pendiente negativa. 87 00:10:41,850 --> 00:10:57,429 Eso es lo que se llama correlación negativa. Tiene pendiente negativa. No tienen por qué ser los valores negativos, sino que a medida que avanzamos de izquierda a derecha, los valores de la Y van descendiendo. 88 00:10:59,570 --> 00:11:10,830 Vamos a hacer otra nube de puntos. Esta es la tabla de natalidad por cada mil habitantes de una determinada ciudad de España. 89 00:11:10,830 --> 00:11:26,539 Bueno, entonces, vamos a hacer lo mismo y vamos a ver, bueno, esto nos va a marcar una tendencia y vamos a ver cuál es esa tendencia. 90 00:11:27,820 --> 00:11:31,379 Entonces, aquí, ¿qué diferencia hay con el anterior? 91 00:11:31,379 --> 00:11:43,240 Bueno, así. Y ahora voy a hacer una cosa extraña. 92 00:11:45,120 --> 00:11:53,720 A ver, aquí tengo del año 96 al 2001, ¿no? 93 00:11:55,279 --> 00:11:58,399 Bueno, pues voy a hacer lo que se llama un eje quebrado. 94 00:12:00,000 --> 00:12:01,820 Esto es como si hubiera comprimido esto. 95 00:12:02,379 --> 00:12:05,779 Y aquí voy a poner el primer año, que es el 1996. 96 00:12:06,960 --> 00:12:13,159 Sería 97, 98, 99, 2000, 2001. 97 00:12:14,779 --> 00:12:16,740 O sea, aquí pongo el año. 98 00:12:16,740 --> 00:12:27,519 Y aquí tengo que poner la natalidad que se mide en tantos por mil. 99 00:12:28,940 --> 00:12:30,639 Eso es eso ya, como hemos visto. 100 00:12:31,120 --> 00:12:41,360 Aquí podría quebrar el eje, pero quizás se vea más claro, esto ya depende un poco del gusto de cada uno, ¿no? 101 00:12:41,360 --> 00:12:53,539 pues como el mayor valor es 21, pues voy a poner 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 y 22. 102 00:12:55,700 --> 00:13:02,659 Vamos, si podéis poner todos, rellenar la escala, mejor, 2, 3, 4, 5, 6, 7, 8, 9, 10 y 11. 103 00:13:02,659 --> 00:13:26,970 Entonces, en 1996 la natalidad fue de 20. 20 por 1.096. En 1997 fue 21. Es un poquito más alta. En 1998 fue de 19. Es un poquito más baja. 104 00:13:26,970 --> 00:13:45,289 Este 97 tendría que estar aquí. 21. Luego el 19. Estaría un poquito más bajo. Aquí está el año 98. 105 00:13:45,289 --> 00:14:01,600 El 99, el 17. Un poquito más baja todavía. El 2015 un poquito más baja también. Y el 2001 sería la 14. 106 00:14:01,899 --> 00:14:17,000 Bueno, pues esta es la nube de puntos. También parece ser que hay una tendencia descendente, que hay una correlación negativa y yo creo que más o menos una curva que tomara los puntos más o menos que se aproximara a ella sería esa. 107 00:14:18,000 --> 00:14:30,720 Eso no importa demasiado dibujarlo, eso hay gente, ya os digo, que lo hace con mucha precisión, a mí no se me da tan bien, pero los cálculos que se van a hacer son los cálculos y esos son los que vale. 108 00:14:31,899 --> 00:14:46,159 Entonces, vamos a ver este ejemplo, que es decidir si hay una relación entre las dos variables de momento a simple vista. 109 00:14:56,110 --> 00:15:09,669 A ver, yo diría que de todos estos casos, bueno, os sigo hablando, se llama correlación lineal, 110 00:15:09,669 --> 00:15:43,549 Porque hay cosas que se pueden aproximar mediante parábolas o mediante otro tipo de funciones. Yo diría que lo más parecido a una recta son los datos que hay aquí. Yo aquí diría que hay una correlación que es bastante fuerte, aunque no sigan exactamente en la línea recta, todos se agrupan mucho respecto de esa recta. 111 00:15:43,549 --> 00:16:06,659 Y esa recta va hacia abajo, entonces es negativa. Entonces, de estos tres datos que quedan, yo diría que esto es lo que menos se acerca a una recta. Yo aquí diría que la correlación es débil. A simple vista, luego ya veremos cómo se puede determinar eso. 112 00:16:09,549 --> 00:16:16,909 A simple vista, yo diría que de los segundos que se más parecen, se parecen a recta, es esto. 113 00:16:18,110 --> 00:16:20,809 Más o menos, están unos por encima, unos por debajo. 114 00:16:21,029 --> 00:16:27,490 Este es un dato que a veces puede ocasionarse por un error en la medición, o que puede ser ese, 115 00:16:27,490 --> 00:16:42,210 y que sea un dato que no se cumple, pero yo diría que aquí la correlación es media. 116 00:16:43,629 --> 00:16:45,769 y negativo. 117 00:16:48,519 --> 00:16:49,840 Y es media a media fuerte. 118 00:16:50,000 --> 00:16:51,500 Esta yo diría que es fuerte incluso. 119 00:16:52,159 --> 00:16:53,139 Diría que esta es fuerte 120 00:16:53,139 --> 00:16:57,100 y esta media 121 00:16:57,100 --> 00:16:58,539 entre media y fuerte. 122 00:17:01,159 --> 00:17:03,080 Y aquí, pues yo diría 123 00:17:03,080 --> 00:17:04,359 que hay una correlación 124 00:17:04,359 --> 00:17:06,920 bueno, esta podría decir 125 00:17:06,920 --> 00:17:07,900 que es muy débil. 126 00:17:11,680 --> 00:17:13,920 Yo diría que la correlación es débil 127 00:17:13,920 --> 00:17:15,319 pero en caso de 128 00:17:15,319 --> 00:17:17,720 haber alguna correlación entre las dos 129 00:17:17,720 --> 00:17:34,940 variables, pues más bien tiende al ascenso. Débil y positivo. Esto es buscarle un sentido 130 00:17:34,940 --> 00:17:39,400 a los cálculos que vamos a hacer ahora, porque los cálculos luego son bastante abstractos 131 00:17:39,400 --> 00:17:52,940 y no vamos a ver mucho. Bueno, entonces, vamos ya directamente a los cálculos. La recta 132 00:17:52,940 --> 00:18:02,279 de regresión, la recta de regresión es esta recta que yo he dibujado aquí de forma aproximada. 133 00:18:03,099 --> 00:18:10,339 La recta de regresión tiene esta forma. Que no cunda el pánico que esto no está en conjunto. 134 00:18:12,319 --> 00:18:19,420 A ver, la recta de regresión. Tenéis que calcular la media. Tenéis que calcular la media de la X, 135 00:18:19,420 --> 00:18:28,920 La media de la Y y tenéis que calcular la covarianza. Y bueno, la desviación típica al cuadrado de la X. 136 00:18:29,539 --> 00:18:38,420 Todo se va a hacer con calculadora, excepto la covarianza que vamos a hacer una parte que es entera. 137 00:18:38,420 --> 00:18:51,920 Vamos a ver el ejemplo, porque ya os digo que esto en principio os parece muy extraño, pero luego el ejercicio es bastante mecánico. 138 00:19:03,420 --> 00:19:18,500 Tengo seis institutos de la misma zona, se ha estudiado la nota media de los estudiantes de primero de bachillerato en matemáticas en inglés. Se obtiene la siguiente información que se recoge en la estampa. Entonces tengo uno, dos, tres, cuatro, cinco y seis alumnos. 139 00:19:18,759 --> 00:19:39,269 O sea, el número de datos es eso. En cada individuo, los datos que he recogido son la nota en matemáticas, esta es la del primer individuo en matemáticas, esta es la del primer individuo en inglés. 140 00:19:39,269 --> 00:19:52,529 Entonces, vamos a tomar eso y para no asustarnos, vamos a copiar las fórmulas que ya os digo que esto hacéis dos o tres y lo mecanizáis perfectamente. 141 00:19:54,170 --> 00:19:57,430 Entonces, esto es lo que se llama la covarianza. 142 00:20:03,720 --> 00:20:09,619 Para hacer la covarianza, primero, tengo que calcular la media. 143 00:20:11,000 --> 00:20:18,720 Y aquí, ya os tengo que decir, esto, si no sabéis hacerlo con calculadora, tenéis que hacerlo a mano y es bastante largo. 144 00:20:20,579 --> 00:20:22,819 Entonces, voy a hacer unos cálculos previos. 145 00:20:27,210 --> 00:20:28,730 Cálculos previos. 146 00:20:29,509 --> 00:20:35,089 ¿Qué es lo que necesito? 147 00:20:35,089 --> 00:20:37,109 cito 148 00:20:37,109 --> 00:20:39,910 la media de la X 149 00:20:39,910 --> 00:20:45,519 la desviación típica de la X 150 00:20:45,519 --> 00:20:49,589 y la media de L 151 00:20:49,589 --> 00:20:54,940 con eso casi tenemos la covariaz 152 00:20:54,940 --> 00:20:56,819 entonces ahora 153 00:20:56,819 --> 00:21:00,720 si tenéis la calculadora que os dije el otro día 154 00:21:00,720 --> 00:21:02,980 por favor hacerlo conmigo 155 00:21:02,980 --> 00:21:05,140 y si no intentad hacerlo bien 156 00:21:05,140 --> 00:21:07,180 se supone que ya habéis mirado el tutorial 157 00:21:07,180 --> 00:21:10,119 y que ya sabéis hacer una media y una desviación típica 158 00:21:10,900 --> 00:21:17,960 Entonces, los que tenéis la calculadora que os dije el otro día, os recuerdo que tenéis que darle a SID CLEAR. 159 00:21:20,240 --> 00:21:23,039 Luego le dais al 1 y le dais al 1. 160 00:21:24,720 --> 00:21:29,380 Tenéis que comprobar que vuestra calculadora está en modo estadístico. 161 00:21:29,480 --> 00:21:30,599 Acordaos que es SD. 162 00:21:31,460 --> 00:21:34,319 Si podéis hacerlo ahora, fenomenal. 163 00:21:34,460 --> 00:21:40,099 Si tenéis alguna duda sobre alguna tecla en particular, ya os digo, esta es la FX82. 164 00:21:40,119 --> 00:21:50,440 ms por similares son las que tienen aunque no sean casi un botoncito gris en medio pues en algunas 165 00:21:50,440 --> 00:21:57,700 creo que es azul también amarillo pero es un botón así muy claro y grande que pone replay entonces 166 00:21:57,700 --> 00:22:06,279 cómo se meten los datos acordaos que he borrado los datos por si acaso he borrado los datos por 167 00:22:06,279 --> 00:22:09,299 Por si acaso, me quedan los de otro día. 168 00:22:09,720 --> 00:22:13,740 Si yo le doy a SIF 1 y le doy al igual, 169 00:22:14,640 --> 00:22:17,920 y uno a la vez me tiene que dar N igual a 0. 170 00:22:18,420 --> 00:22:19,960 Y ahora voy metiendo los datos. 171 00:22:20,539 --> 00:22:24,019 Y os recuerdo que es 6.5 M más. 172 00:22:24,799 --> 00:22:25,940 Sale N igual a 1. 173 00:22:26,859 --> 00:22:29,980 5.2 M más. 174 00:22:32,650 --> 00:22:34,190 6 M más. 175 00:22:35,190 --> 00:22:37,670 6.5 M más. 176 00:22:37,910 --> 00:22:41,170 7, n más 177 00:22:41,170 --> 00:22:43,890 y 6, n más 178 00:22:43,890 --> 00:22:47,170 esto conviene hacerlo dos veces 179 00:22:47,170 --> 00:22:50,089 se supone que en la calculadora pone n igual a 6 180 00:22:50,089 --> 00:22:51,910 porque habéis metido 6 datos 181 00:22:51,910 --> 00:22:55,450 y ahora, si queréis calcular la media 182 00:22:55,450 --> 00:22:57,910 le dais SIF 183 00:22:57,910 --> 00:23:00,450 2, 1 184 00:23:00,450 --> 00:23:04,349 le dais al igual y sale 6,2 185 00:23:04,349 --> 00:23:07,170 esto no es 1, no sé si nos haría 186 00:23:07,170 --> 00:23:10,230 6,2 187 00:23:10,230 --> 00:23:13,430 y la desviación típica 188 00:23:13,430 --> 00:23:15,849 le dais shift 2 189 00:23:15,849 --> 00:23:18,869 y le dais al 2 y el igual 190 00:23:18,869 --> 00:23:21,670 y sale, este número es aproximado 191 00:23:21,670 --> 00:23:25,349 utilizad los decimales, mientras no se os llegue a lo contrario 192 00:23:25,349 --> 00:23:28,190 los decimales, sale aproximadamente 193 00:23:28,190 --> 00:23:30,049 0,56 194 00:23:30,049 --> 00:23:36,250 esta es la primera parte que ya os digo 195 00:23:36,250 --> 00:23:38,890 buscad el tutorial porque esto se hace en un libro 196 00:23:39,569 --> 00:23:56,049 Y ahora tengo que calcular la media de ley. Lo que os he dicho antes, no os olvidéis de borrar los datos. Le dais a seed, donde ponemos que es un amarillo clear, le dais a 1 y a igual. 197 00:23:56,049 --> 00:24:15,950 Y ahora voy a calcular, solo necesito la media. 7m más, 5m más, 5m más, 6m más, 7.5m más y 5m más. 198 00:24:15,950 --> 00:24:37,809 Y la media nos sale, acordaos, 6, 2, 1. Y os sale aproximadamente 5,92. Haced bien los redondeos, porque sale 5,916666. 5,92. 199 00:24:37,809 --> 00:24:41,349 Bueno, yo primero me tendría a decir 200 00:24:41,349 --> 00:24:44,750 ¿están bien hechas estas cuentas? Pues yo creo que sí 201 00:24:44,750 --> 00:24:48,529 porque valores que están entre 5,2 y 7 202 00:24:48,529 --> 00:24:51,369 que la media salga 6,2 me parece razonable 203 00:24:51,369 --> 00:24:54,930 y valores que están entre 5 y 7 204 00:24:54,930 --> 00:24:57,049 que salga una media de 5,92 205 00:24:57,049 --> 00:24:58,609 me parece razonable 206 00:24:58,609 --> 00:25:03,230 Siempre en caso de un examen o cuando estéis haciendo un ejercicio 207 00:25:03,230 --> 00:25:06,630 repasadlo, lo hacéis otra vez y que queden los números 208 00:25:06,630 --> 00:25:23,839 ¿Vale? Bueno, entonces, dejo la calculadora por un momento y ahora tengo que hacer este cálculo. Bueno, me diréis, ¿por qué he calculado la desviación típica si no sale aquí? 209 00:25:23,839 --> 00:25:41,710 Porque es que ese dato lo voy a necesitar. Esta columna, acordaos, xy por y sub y consiste en multiplicar este número por este. 210 00:25:42,269 --> 00:25:49,869 Entonces voy a ir haciéndolo con la calculadora. 6,5 por 7 y sale 45,5. 211 00:25:49,869 --> 00:26:08,240 En este ejercicio, que veáis que es bastante rollo, pero al hacer 2 o 3 ya os lo sabéis, 5,2 por 5, 26. 6 por 5 que es 30. 212 00:26:08,240 --> 00:26:40,599 Bueno, 6,5 por 6 es 3,9. Perdón, 39. Ahora 7 por 7,5 creo que es 5,5. 52,5. Y aquí hay otro 6 por 5 que es 30. Pues hay dos alumnos que han sacado las mismas notas. 213 00:26:40,599 --> 00:26:57,269 Puede ocurrir. Entonces, si yo sumo todos estos datos, me sale la suma de los productos X, Y por Y. Bueno, pues voy a sumarlo. 214 00:26:57,269 --> 00:27:20,049 52,5 más 30, más 39, más 30 otra vez, más 26, más 45,5. Y sale 223 por ciento. 215 00:27:20,049 --> 00:27:34,549 ¿Sí? Entonces, ya estoy en condiciones de calcular la covarianza. La covarianza es 223, que es la suma que nos ha salido, partido por el número de datos. 216 00:27:34,549 --> 00:27:56,630 Esto el otro día dije que era en minúscula, pero bueno, esto es el número de datos. 223 dividido entre 6, que aproximadamente es 37,17. 217 00:27:56,630 --> 00:28:06,549 Ah, no, perdón, que tengo que sumarle para menos, que tengo que restarle 6,2 por 5,92. 218 00:28:11,819 --> 00:28:16,640 Menos 6,2 por 5,92. 219 00:28:17,559 --> 00:28:23,059 Y esto, si no me equivoco, sale aproximadamente 0,46. 220 00:28:24,359 --> 00:28:28,440 Aproximadamente 0,46, remontado con dos decimales. 221 00:28:28,440 --> 00:28:40,460 Bueno, aquí la covarianza es positiva. Y bueno, si la covarianza es positiva, nos va a decir que la correlación es positiva. 222 00:28:40,460 --> 00:29:04,380 Vale. Y ahora, para no asustaros, aquí. Vale. Os voy a poner la fórmula de la recta de Rennes. Bueno, es muy raro que la covarianza sea exactamente cero, ¿no? 223 00:29:04,539 --> 00:29:15,559 Pero si la covarianza es negativa, la correlación se dice que es negativa o inversa. Esta es la recta, la ecuación de la recta que yo antes dibujaba de forma próxima. 224 00:29:15,559 --> 00:29:42,019 Y ahora os digo, ¿cómo se aprende uno esta fórmula? Pues vamos a ver. A la Y le resto la media de las X, que la he calculado, 5,92. A la X le resto la media de las X, que es 6,2. 225 00:29:42,019 --> 00:30:05,940 Y esto de aquí, pues es un poquito más largo, pero acordaos siempre que es la covarianza, que es lo que hemos hecho, 0,46 partido por el cuadrado de este número que nos habíamos reservado antes, 0,56 al cuadrado. 226 00:30:05,940 --> 00:30:09,779 una cosa en el libro creo que hace 227 00:30:09,779 --> 00:30:11,900 la recta de regresión de x sobre y 228 00:30:11,900 --> 00:30:13,140 y la de y sobre x 229 00:30:13,140 --> 00:30:15,420 yo solo voy a hacer esta que es la de y sobre x 230 00:30:15,420 --> 00:30:17,079 para no liar las cosas 231 00:30:17,079 --> 00:30:19,079 siempre vamos a utilizar 232 00:30:19,079 --> 00:30:21,339 entonces esto 233 00:30:21,339 --> 00:30:22,779 lo hago con la calculadora 234 00:30:22,779 --> 00:30:30,299 0,46 235 00:30:30,299 --> 00:30:33,440 dividido entre 0,56 236 00:30:33,440 --> 00:30:34,359 al cuadrado 237 00:30:34,359 --> 00:30:36,599 y si no me equivoco sale 238 00:30:36,599 --> 00:30:58,160 Entonces, el ejercicio nos pedía hacer una estimación de la nota de inglés 239 00:30:58,160 --> 00:31:02,099 que correspondería a un estudiante que sacaba un 5,5 en matemáticas. 240 00:31:06,019 --> 00:31:08,859 Entonces, esta es la nota de inglés. 241 00:31:08,859 --> 00:31:30,160 Con estos datos, yo puedo decir que y menos 5,92 es igual a 1,47 por x menos la media de la x, que es 6,2. 242 00:31:30,160 --> 00:32:03,480 Vale. Entonces, hago los cálculos. Será y igual a el 5, bueno, primero voy a multiplicar 1,47 por x menos 1,47 por 6,2. 243 00:32:03,480 --> 00:32:06,480 1,47 por 6,12. 244 00:32:07,500 --> 00:32:09,859 Aproximadamente me sale 9,11. 245 00:32:15,059 --> 00:32:16,839 Y este menos pasa con más. 246 00:32:17,099 --> 00:32:19,480 Más 5,92. 247 00:32:20,680 --> 00:32:27,119 Entonces me queda que la recta de regresión es igual a 1,47x. 248 00:32:27,119 --> 00:32:39,190 Y ahora, menos 9,11 más 5,92 es menos 3,19. 249 00:32:39,309 --> 00:33:17,099 Entonces, nos está diciendo que si la nota, conclusión, si la nota en matemáticas es 5,5, quiere decir que X es 5,5. 250 00:33:17,099 --> 00:33:41,650 Entonces, la nota en inglés es 1,47 por 5,5 menos 3,19, que esto sale 1,47 por 5,5 menos 3,19. 251 00:33:41,650 --> 00:34:11,239 Sale 4,85. Pues la conclusión que sería, se espera que en inglés tenga, como las notas están andadas con un decimal, lo redondeamos y nos sale un 4,85. 252 00:34:11,239 --> 00:34:34,460 Bueno, este ejercicio, que aparentemente os puede resultar muy complicado, consiste en que con la calculadora sepáis hacer la media de la X, la media de la Y y la desviación típica de la X. 253 00:34:34,460 --> 00:34:36,400 que a mano hagáis 254 00:34:36,400 --> 00:34:38,440 la columna esta de x y por 255 00:34:38,440 --> 00:34:40,519 y subí y que apliquéis 256 00:34:40,519 --> 00:34:41,579 esas dos fórmulas 257 00:34:41,579 --> 00:34:44,460 cuando hacéis dos o tres os quedáis 258 00:34:44,460 --> 00:34:46,440 con todo ello, yo creo que este es un problema 259 00:34:46,440 --> 00:34:47,579 de los que compense 260 00:34:47,579 --> 00:34:50,559 y creo que de cara al año 261 00:34:50,559 --> 00:34:52,400 que viene creo que luego van a empezar 262 00:34:52,400 --> 00:34:53,980 a volver a poner en la evao 263 00:34:53,980 --> 00:34:56,340 que a veces ha sido el temario de primero 264 00:34:56,340 --> 00:34:57,840 a veces ha sido el temario de segundo 265 00:34:57,840 --> 00:35:02,690 entonces, bueno esta es la idea 266 00:35:02,690 --> 00:35:04,530 de lo que es la 267 00:35:04,530 --> 00:35:05,769 recta de regresión 268 00:35:05,769 --> 00:35:13,710 Porque la recta que yo había dibujado a ojo tiene explícitamente un número asociado, ¿vale? 269 00:35:16,789 --> 00:35:22,329 Perdón, tiene una ecuación asociada que es exactamente esa y a partir de ahí se pueden hacer estimaciones. 270 00:35:23,329 --> 00:35:32,949 Pero ahora, como hemos visto al principio, las nubes de punto a veces son muy dispersas y a veces se acercan mucho a una recta. 271 00:35:32,949 --> 00:35:47,809 Entonces, ¿cómo se mide si la correlación es muy fuerte, es fuerte, es funcional, o es débil o no hay correlación? 272 00:35:47,809 --> 00:35:55,570 Bueno, pues para eso tenemos que calcular un número que se llama el coeficiente de correlación. 273 00:35:56,409 --> 00:36:08,230 Ese número viene dado por esta fórmula, entonces fijaos que lo que tenemos que hacer con la calculadora son la media de la x, la media de la y y luego hacer la covarianza como habéis hecho antes. 274 00:36:09,070 --> 00:36:15,090 Entonces los cálculos que hemos hecho antes se pueden aproximar con una fórmula. 275 00:36:15,389 --> 00:36:25,010 Bueno, una cosa muy importante, si calculáis el coeficiente de correlación, si os sale más pequeño que menos uno o más grande que uno, está mal. 276 00:36:25,570 --> 00:36:31,510 Si en el examen no encontráis el fallo, por lo menos decir que ese valor no es correcto, ¿vale? 277 00:36:32,829 --> 00:36:35,349 Ahora, ¿cómo se interpreta ese valor? 278 00:36:36,769 --> 00:36:43,469 Si el valor de ese coeficiente vale exactamente 1, la correlación es perfecta. 279 00:36:43,710 --> 00:36:49,409 Todos los puntos están perfectamente en una línea recta y la correlación es positiva. 280 00:36:49,530 --> 00:36:50,869 O sea, esa recta va a hacer 1. 281 00:36:52,090 --> 00:36:55,210 Si vale menos 1, la correlación también es perfecta. 282 00:36:55,210 --> 00:37:10,250 Se llama funcional. La diferencia es que la recta en vez de ser creciente es decreciente. Al mayor valor de un valor nos sale otro. ¿Sí? Ahora, cuanto más se acerca a 1 o a menos 1, la correlación es fuerte. 283 00:37:10,250 --> 00:37:13,929 esto más o menos 284 00:37:13,929 --> 00:37:15,590 pues ya en cada ejercicio 285 00:37:15,590 --> 00:37:17,809 pues ya se irá diciendo lo que para mí es fuerte 286 00:37:17,809 --> 00:37:19,869 muy fuerte, porque en los textos generalmente 287 00:37:19,869 --> 00:37:21,889 no lo detallan y yo creo que depende 288 00:37:21,889 --> 00:37:23,750 un poco de los tipos de datos que se 289 00:37:23,750 --> 00:37:25,929 manejen, se puede considerar fuerte 290 00:37:25,929 --> 00:37:27,690 o muy fuerte, pero si el valor 291 00:37:27,690 --> 00:37:29,929 es próximo a cero, la correlación es débil 292 00:37:29,929 --> 00:37:31,730 ¿vale? sea positiva o negativa 293 00:37:31,730 --> 00:37:33,849 si es exactamente cero es que 294 00:37:33,849 --> 00:37:34,690 no hay correlación 295 00:37:34,690 --> 00:37:37,730 correlación lineal 296 00:37:37,730 --> 00:37:38,889 eso 297 00:37:38,889 --> 00:38:03,239 Eso no excluye que puedan tener una relación parabólica o de cúbica o de otro tipo, ¿no? Entonces, vamos a hacer un ejemplo de esto y de gráfico y luego vamos a hacer los cálculos y el tema, que sepáis que está dado. 298 00:38:03,239 --> 00:38:16,420 Lo que hay que hacer ahora es repasar y ya os digo, practicar dos o tres de estos porque es un ejercicio que en mi opinión es bastante asequible. Tengo un trabajo de aprender a hacer la media con la calculadora. 299 00:38:16,420 --> 00:38:24,300 Bueno, aquí te dice los números 0, 2, menos 0, 9, menos 0, 7 y 0, 6 corresponden a coeficientes de correlación. 300 00:38:24,480 --> 00:38:27,039 Dice, asigna cada una gráfica al 5. 301 00:38:28,619 --> 00:38:34,320 A ver, yo aquí pondría, aquí la correlación es positiva, ¿no? 302 00:38:35,139 --> 00:38:36,539 Esta es la más grande de todas. 303 00:38:37,800 --> 00:38:41,380 Pues yo diría que esta correlación es de 0, 6. 304 00:38:41,380 --> 00:38:45,280 ¿Por qué? Porque es positiva y es la más fuerte que hay, es la que más se acerca a 1. 305 00:38:46,420 --> 00:39:00,320 Ahora, tengo estos valores y estos valores. Yo diría que los que se acercan más a una recta son estos. Esto como veis es una cuestión bastante subjetiva y por eso luego se hacen las cuentas. 306 00:39:00,320 --> 00:39:06,920 Yo diría que este es el del menos 0,9, porque parece que estos datos están un poquito más dispersos. 307 00:39:07,940 --> 00:39:14,420 Pues yo diría que aquí es menos 0,9 y aquí es menos 0,5. 308 00:39:15,480 --> 00:39:17,119 Es fuerte, pero no tanto. 309 00:39:17,920 --> 00:39:21,860 Y aquí los valores se acercan mucho a cero correlación débil. 310 00:39:22,960 --> 00:39:24,960 Vamos a ver el otro ejemplo que hay ahí. 311 00:39:24,960 --> 00:39:52,809 Para ver si... Bueno, aquí nos dicen que las correlaciones no nos dicen si son positivas o negativas. Y nos dicen que... A ver, yo diría que la correlación más fuerte es esta. Esta es la más fuerte. La más fuerte. 312 00:39:52,809 --> 00:39:59,750 yo creo que los puntos que se acercan más a una recta son estos 313 00:39:59,750 --> 00:40:02,710 entonces aquí la correlación es 0.96 314 00:40:02,710 --> 00:40:06,630 pero como se ajusta a una recta que va hacia abajo 315 00:40:06,630 --> 00:40:08,570 yo diría que la correlación es negativa 316 00:40:08,570 --> 00:40:12,949 la siguiente correlación fuerte que diría yo 317 00:40:12,949 --> 00:40:14,750 pues yo diría que son estos 318 00:40:14,750 --> 00:40:20,250 0.87 y de nuevo la correlación es negativa 319 00:40:23,090 --> 00:40:25,710 Estos yo veo que tienen muy poca relación. 320 00:40:25,909 --> 00:40:28,369 Yo diría que estos tienen una correlación de 0,55. 321 00:40:29,369 --> 00:40:32,710 Y no me atreví a saber, a decir si es positiva o negativa. 322 00:40:32,829 --> 00:40:35,769 Yo diría que sí, que más bien parece positiva que negativa. 323 00:40:37,070 --> 00:40:39,989 Y esta, pues sí, parece que es positiva. 324 00:40:41,690 --> 00:40:42,389 Esta sí. 325 00:40:42,789 --> 00:40:45,869 Pero vamos, esta sí de 0,55, yo diría que es positiva. 326 00:40:46,650 --> 00:40:48,190 Como veis, esto se hace a ojo. 327 00:40:48,349 --> 00:40:49,989 No os voy a pedir que hagáis nada a ojo. 328 00:40:50,710 --> 00:40:51,929 Esto es orientativo. 329 00:40:52,329 --> 00:40:57,130 para que veáis luego cómo se hace de una forma más científica. 330 00:40:58,150 --> 00:41:03,250 Entonces, vamos a hacerlo con la altura de unos niños 331 00:41:03,250 --> 00:41:06,309 y que sepáis que esto es un problema de examen, tal cual. 332 00:41:06,550 --> 00:41:09,489 Este 3 es un problema de examen, así tal cual. 333 00:41:10,289 --> 00:41:13,550 Y, bueno, si tenemos tiempo para hacerlo, 334 00:41:19,500 --> 00:41:22,639 a ver, sería bueno, como mínimo, 335 00:41:22,639 --> 00:41:25,139 que hagáis los ejercicios 9 y 10 de la página 336 00:41:25,139 --> 00:41:31,320 que hay el 275, en la página siguiente, y que veáis un ejercicio completo. 337 00:41:33,119 --> 00:41:37,920 Esto, si vais a hacer luego los cálculos con calculadoras, podéis saltar lo primero 8 minutos. 338 00:41:38,420 --> 00:41:41,659 Pero esto ya os digo, este es tal cual un ejercicio de un examen. 339 00:41:41,820 --> 00:41:47,380 Podéis verlo en los exámenes del curso pasado. 340 00:41:47,380 --> 00:41:57,039 ¿Vale? Entonces, si observamos las edades de cinco niños y niñas en sus pesos respectivos y se obtienen estos datos. 341 00:41:57,199 --> 00:41:58,559 Como veis, hay cinco datos. 342 00:42:03,889 --> 00:42:07,929 Nos dice, coeficiente de correlación lineal, rectas de regresión de y sobre x. 343 00:42:08,289 --> 00:42:09,389 Esto ya lo hemos hecho antes. 344 00:42:10,269 --> 00:42:13,150 ¿Qué peso correspondería a un niño de cinco años? 345 00:42:13,710 --> 00:42:17,889 Entonces, os recuerdo, tenemos que calcular la media de la x, 346 00:42:19,210 --> 00:42:21,349 la desviación típica de la x, 347 00:42:21,349 --> 00:42:23,610 la media de la Y 348 00:42:23,610 --> 00:42:25,849 y la desviación típica de la Y 349 00:42:25,849 --> 00:42:28,909 consejo que lo hagáis con calculador 350 00:42:28,909 --> 00:42:30,829 entonces 351 00:42:30,829 --> 00:42:32,989 si la tenéis a mano y ya habéis aprendido 352 00:42:32,989 --> 00:42:34,869 a hacerlo, acordaos de 353 00:42:34,869 --> 00:42:35,750 borrar los datos 354 00:42:35,750 --> 00:42:38,309 SIF mode 1 355 00:42:38,309 --> 00:42:40,429 acordaos de darle al igual 356 00:42:40,429 --> 00:42:42,570 ya están los datos borrados 357 00:42:42,570 --> 00:42:46,000 voy a comprobarlo 358 00:42:46,000 --> 00:42:47,739 si están todos borrados 359 00:42:47,739 --> 00:42:50,360 ahora, introduzco los datos de la X 360 00:42:50,360 --> 00:42:52,500 2M más 361 00:42:52,500 --> 00:43:14,179 No hace falta poner el punto y la coma que poníamos el otro día porque simplemente tenéis esos datos. Ahora, porque se repiten una vez. 4,5n más, 6n más, 7.2n más y 8n más. 362 00:43:14,179 --> 00:43:16,079 hay un error muy común 363 00:43:16,079 --> 00:43:18,199 es que es que cuando metéis el último dato 364 00:43:18,199 --> 00:43:19,579 se os olvida darle el ónimos 365 00:43:19,579 --> 00:43:21,360 o a mí por lo menos me pasa 366 00:43:21,360 --> 00:43:22,420 ¿vale? 367 00:43:23,460 --> 00:43:25,960 entonces, una vez hecho eso 368 00:43:25,960 --> 00:43:27,659 tenéis que en la pantalla 369 00:43:27,659 --> 00:43:28,880 ponerme igual a 5 370 00:43:28,880 --> 00:43:31,840 y le dais a SIF 371 00:43:31,840 --> 00:43:33,340 2 372 00:43:33,340 --> 00:43:34,860 1 373 00:43:34,860 --> 00:43:38,460 y os sale la media 5,54 374 00:43:38,460 --> 00:43:40,000 parece un valor razonable 375 00:43:40,000 --> 00:43:40,780 pues la apunto 376 00:43:40,780 --> 00:43:43,340 5,54 377 00:43:43,340 --> 00:43:46,800 es más correcto que pongáis 378 00:43:46,800 --> 00:43:49,900 en ambos 379 00:43:49,900 --> 00:43:52,679 años 380 00:43:52,679 --> 00:43:54,539 las unidades pues siempre quedan 381 00:43:54,539 --> 00:43:56,599 ahora la desviación 382 00:43:56,599 --> 00:43:58,179 típica le dais 383 00:43:58,179 --> 00:43:59,960 SIF 2 384 00:43:59,960 --> 00:44:02,559 y ahora le dais al 2 que no se os olvide 385 00:44:02,559 --> 00:44:03,400 darle al igual 386 00:44:03,400 --> 00:44:06,719 y sale aproximadamente 2,13 387 00:44:06,719 --> 00:44:09,599 2,13 388 00:44:09,599 --> 00:44:11,760 y esto serían 389 00:44:11,760 --> 00:44:12,699 años también 390 00:44:12,699 --> 00:44:28,719 Entonces, nos olvidamos de la X, borramos los datos, SIG CLEAR, sale igual, borrado 391 00:44:28,719 --> 00:44:37,219 los datos, lo compruebo y ya está. Bueno, y ahora meto los datos de los pesos, 15 M 392 00:44:37,219 --> 00:44:56,380 más, 19 m más, 25 m más, 33 m más, 34 m más y 34 m más. Le doy a ver si he metido 393 00:44:56,380 --> 00:45:07,800 los datos, si he metido 100 datos. Ahora me doy a la media, SIF 2, 1, igual 25,2. Como 394 00:45:07,800 --> 00:45:14,159 me parece un resultado razonable entre 15 y 34, pues pongo aproximadamente, no, no, exactamente 395 00:45:14,159 --> 00:45:24,920 25,2. Como son pesos, pongo kilogramos. Ahora le doy sí, 2, 2, le doy al igual y me sale 396 00:45:24,920 --> 00:45:35,920 7,49. Este es aproximado. Lo aproximo con dos cifras decimales, 7,49 kilogramos. Entonces, 397 00:45:35,920 --> 00:45:45,880 Ahora, necesito calcular la covarianza. Para hacer la covarianza, acordaos que tengo que hacer x y por y sub i. 398 00:45:45,880 --> 00:46:10,719 Entonces pongo aquí 2 por 15 que es 30, 19 por 4,5 que es 85,5, 25 por 6 que es 150, 399 00:46:10,719 --> 00:46:31,090 P2 por 33, que es 237,6, y 34 por 8, que es 270. 400 00:46:32,610 --> 00:46:34,469 Bueno, esto podría haberlo hecho con la calculadora. 401 00:46:35,050 --> 00:46:42,030 Bueno, entonces voy a hacer la suma de xy por y sub i. 402 00:46:42,030 --> 00:47:00,070 Y la suma es 30 más 85,5 más 150 más 237,6 más 272. 403 00:47:01,070 --> 00:47:03,789 Sale 775,1. 404 00:47:03,789 --> 00:47:23,289 Entonces la covarianza, hemos dicho que era la suma de las xy, o sea lo que calculo ahora, dividido entre n menos el producto de las medias. 405 00:47:23,289 --> 00:47:46,820 Pues me sale 775,1 dividido entre 5 datos menos la media de la X que es 5,54 por la media de la Y que es 25,2. 406 00:47:46,820 --> 00:48:11,050 Lo hago, divido entre 5, menos 5,54 por 25,2. Y sale 15,412, pongo aproximadamente 15,30. 407 00:48:11,050 --> 00:48:16,300 esto no tiene un día 408 00:48:16,300 --> 00:48:18,980 no son de kilos, ni están mezclados los kilos 409 00:48:18,980 --> 00:48:19,639 con los kilos 410 00:48:19,639 --> 00:48:22,739 es lo normal que a mayor edad 411 00:48:22,739 --> 00:48:25,599 corresponda a mayor peso, la correlación es positiva 412 00:48:25,599 --> 00:48:40,360 y bueno, y ahora, el coeficiente de correlación 413 00:48:40,360 --> 00:48:40,960 que es E 414 00:48:40,960 --> 00:48:45,519 todavía estoy en el apartado A 415 00:48:45,519 --> 00:48:48,900 coeficiente 416 00:48:48,900 --> 00:48:52,460 de correlación 417 00:48:52,460 --> 00:48:56,019 en algunos sitios lo ponen con la R griega 418 00:48:56,019 --> 00:48:57,519 pero creo que lo he puesto con la R 419 00:48:57,519 --> 00:49:01,679 es la covarianza partido por el producto 420 00:49:01,679 --> 00:49:03,179 de las desviaciones típicas 421 00:49:03,179 --> 00:49:06,099 y esto tiene que ser un número entre 0 y 1 422 00:49:06,099 --> 00:49:08,420 porque si no me he equivocado en las cuentas 423 00:49:08,420 --> 00:49:10,559 perdón 424 00:49:10,559 --> 00:49:13,059 entre 425 00:49:13,059 --> 00:49:16,420 menos 1 y he dicho entre 0 y 1 426 00:49:16,420 --> 00:49:18,179 porque sé que la correlación es positiva 427 00:49:18,179 --> 00:49:19,420 pero siempre menos 1 428 00:49:19,420 --> 00:49:33,500 Bueno, entonces, la covarianza es 15,41 y las desviaciones típicas son 2,13 y 7,49. 429 00:49:35,119 --> 00:49:41,840 Es posible que si la correlación es muy buena, que os salga un 1,01 por lo redondeado. 430 00:49:42,980 --> 00:49:46,219 Acordaos de esto. Mirad, lo voy a hacer con calculadora. 431 00:49:46,679 --> 00:49:48,500 Ah, no, no, que la calculadora está en la zona. 432 00:49:50,980 --> 00:50:21,219 A ver, os voy a enseñar la calculadora, porque la parte de estadística no la puedo hacer. A ver, sería 15,41 dividido, poned paréntesis, los que no tenéis la fracción, la tecla de fracciones, a 2,13 por 7,49. 433 00:50:21,219 --> 00:50:40,469 Cierro paréntesis y sale 0,97 aproximadamente. 0,97. Sale menor que 1, o sea que esté bien, pero es que además esto me dice que la correlación es muy fuerte, porque se acerca mucho a 1. 434 00:50:40,469 --> 00:51:24,079 Y ahora, para hacer la recta de regresión, sabéis que a y le resto la media, a x le resto la media, y la pendiente de esta recta es, aquí tengo sigma xy, la cobranza, y aquí pongo, acordaos de que es la desviación típica al cuadrado. 435 00:51:24,079 --> 00:51:43,360 Entonces, aquí me queda y menos y barra, la media de y es 25,2, es igual a sigma xy, que está la covarianza, que es 15,41. 436 00:51:43,360 --> 00:51:58,489 15,41 partido por la desviación típica, que es 2,13 al cuadrado, por X menos la media de la X, que es 5,54. 437 00:52:02,469 --> 00:52:07,730 Bueno, entonces, os dice, ¿qué peso corresponde? Si queréis lo podéis dejar así, ¿vale? 438 00:52:10,480 --> 00:52:15,420 Ahora, apartado 1. ¿Qué peso correspondería a un niño de 5 años? 439 00:52:15,420 --> 00:52:44,760 Pues si x es igual a 5, yo tomo la recta de regresión y lo único que hago es igual a, lo digo para que quede con más precisión, 15,41 partido por 2,13 al cuadrado por x que vale 5, 5 menos 5,54 y este menos 25,2 pasa como más 25,2. 440 00:52:47,050 --> 00:53:11,070 Y esto lo hago con la calculadora, 15,41 dividido entre 2,13 elevado al cuadrado, por paréntesis, 5 menos 5,54, 441 00:53:11,070 --> 00:53:28,849 paréntesis, más 25,2, igual a aproximadamente 23,37, aproximadamente 23,37. 442 00:53:29,309 --> 00:53:46,920 ¿Qué peso? Kilogramos, 23,35, 37, 37, ¿sí? 443 00:53:46,920 --> 00:54:10,349 Y ahora, la tercera parte. ¿Es fiable esta estimación? Sí. Por dos razones. ¿Por qué? 5 está en medio de los datos. Los datos oscilan entre 2 y 8. 444 00:54:10,349 --> 00:54:18,119 entre 2 y 8 445 00:54:18,119 --> 00:54:19,840 y lo más importante 446 00:54:19,840 --> 00:54:21,820 que es lo que he dicho antes 447 00:54:21,820 --> 00:54:24,699 porque la correlación 448 00:54:24,699 --> 00:54:27,139 es muy fuerte 449 00:54:27,139 --> 00:54:35,199 bueno, pues con esto os tengo que decir 450 00:54:35,199 --> 00:54:36,860 que está dado todo el tema 451 00:54:36,860 --> 00:54:41,800 que lo que tenéis que hacer 452 00:54:41,800 --> 00:54:43,320 es practicar los ejercicios 453 00:54:43,320 --> 00:54:45,480 si queréis primero lo hacéis con el tutorial 454 00:54:45,480 --> 00:54:47,079 luego lo hacéis con los del libro 455 00:54:47,079 --> 00:54:51,809 son 5 o 6 456 00:54:51,809 --> 00:54:53,969 con esto se supone 457 00:54:53,969 --> 00:54:56,510 que tenéis bastante práctica 458 00:54:56,510 --> 00:54:58,289 para hacer esto 459 00:54:58,289 --> 00:54:59,829 la próxima clase 460 00:54:59,829 --> 00:55:00,570 es 461 00:55:00,570 --> 00:55:04,070 prácticamente de repaso 462 00:55:04,070 --> 00:55:06,289 si queréis está colgada si no me equivoco 463 00:55:06,289 --> 00:55:08,070 entonces bueno 464 00:55:08,070 --> 00:55:10,309 finalizamos la grabación 465 00:55:10,309 --> 00:55:12,030 os sigo insistiendo que si nadie 466 00:55:12,030 --> 00:55:14,469 tiene inconveniente la voy a colgar 467 00:55:14,469 --> 00:55:15,590 cuando pueda 468 00:55:15,590 --> 00:55:17,869 y bueno 469 00:55:17,869 --> 00:55:20,010 como siempre que tengáis una gran semana 470 00:55:20,010 --> 00:55:22,090 y que contéis siempre con las 471 00:55:22,090 --> 00:55:24,610 tutorías individuales 472 00:55:24,610 --> 00:55:26,369 bueno 473 00:55:26,369 --> 00:55:27,130 pues espero 474 00:55:27,130 --> 00:55:30,070 veros pronto y 475 00:55:30,070 --> 00:55:31,510 nada, dadle duro, esta parte 476 00:55:31,510 --> 00:55:34,190 es muy sencilla para los que os cuesta más 477 00:55:34,190 --> 00:55:35,849 entonces aprovechad y 478 00:55:35,849 --> 00:55:37,210 intentad hacerlo 479 00:55:37,210 --> 00:55:39,010 a lo mejor que podéis, ¿de acuerdo? 480 00:55:39,849 --> 00:55:40,750 bueno, hasta pronto